章节 3: 使用 Scikit-Learn 实现梯度提升

在掌握了梯度提升机 (GBM) 的工作原理后，我们现在转向其实际应用。本章主要介绍如何使用 Scikit-Learn 实现这些模型。Scikit-Learn 是 Python 机器学习 (machine learning)技术栈中的一个标准库。其统一的 API 为您构建第一个梯度提升模型提供了直接途径。

您将使用 Scikit-Learn 的两种主要实现：用于分类任务的 GradientBoostingClassifier 和用于回归问题的 GradientBoostingRegressor。我们将介绍将这些模型拟合到数据、生成预测结果以及理解决定模型行为的主要参数 (parameter)的标准流程，例如提升阶段的数量 ( $n\_estimators$ ) 和学习率。

构建模型只是过程的一部分；模型解释也同等重要。我们还将说明如何理解训练好的模型。您将学习提取特征重要性分数，以识别哪些变量对预测结果影响最大，并使用偏依赖图来呈现单个特征与模型输出之间的关系。

课程章节

3.1 Scikit-Learn的GradientBoostingClassifier
3.2 Scikit-Learn 的 GradientBoostingRegressor
3.3 梯度提升模型的拟合与预测
3.4 解读模型参数
3.5 GBM中的特征贡献度
3.6 偏依赖图用于模型解释
3.7 实战演练：构建预测模型