趋近智
您已使用 Scikit-Learn、XGBoost 及其他高级库构建了梯度提升模型。尽管这些库的默认设置能提供一个不错的基准,但要针对特定问题获得出色表现,需要一个系统性的调整与优化过程。此过程称为超参数 (parameter) (hyperparameter)调整。
本章提供了一份有条理的指南,帮助您优化梯度提升模型。我们将从确定影响最大的超参数入手,这些超参数控制着模型的行为,例如提升阶段数 ()、学习率 (),以及控制单个决策树复杂度的参数。
您将学习这些设置如何影响偏差-方差权衡,以及如何调整它们以防止过拟合 (overfitting)。我们将介绍正则化 (regularization)技术,包括行和列子采样。最后,我们将实践系统化的搜索策略,包括网格搜索 (Grid Search) 和随机搜索 (Randomized Search),以自动化为您的数据集寻找有效超参数组合的过程。本章最后有一个实践练习,在其中您将应用这些调整技术来提升模型的预测准确性。
6.1 超参数调优的意义
6.2 梯度提升中的主要超参数
6.3 调整估计器数量和学习率
6.4 控制树的复杂度
6.5 正则化的抽样参数
6.6 调优的结构化方法
6.7 网格搜索与随机搜索的使用
6.8 动手实践:优化梯度提升模型