趋近智
在考察了XGBoost和LightGBM之后,我们现在转向CatBoost。这是一个梯度提升库,专门为解决一个特定但普遍的难题而优化:即如何有效处理类别特征。传统的做法通常涉及预处理步骤,这些步骤可能不够理想,或导致诸如目标泄漏之类的问题。CatBoost将其处理类别数据的创新方案直接整合到算法中。
本章内容包括:
完成本章后,你将理解CatBoost的独特方法,并能够应用它们,尤其是在处理包含大量类别数据的问题时。
6.1 动机:分类数据面临的难题
6.2 有序目标统计 (Ordered TS)
6.3 处理预测偏差:有序提升
6.4 处理特征组合
6.5 遗忘树
6.6 GPU训练加速
6.7 CatBoost API: 参数与配置
6.8 动手实践:实现 CatBoost
© 2026 ApX Machine Learning用心打造