趋近智
在前几章中,我们已经对现有数据特征进行了准备和转换,现在我们将重点转向构造全新的特征。构建有信息量的特征对于提升模型性能非常重要,因为新特征可以捕捉到复杂的关系或业务背景下的独特理解,而这些仅凭原始变量可能无法显现。
本章介绍从数据中构造有用特征的方法:
我们将使用Python实现这些技术,主要借助Pandas进行数据处理,并使用Scikit-learn提供的专门特征工程工具。
5.1 创建新特征的动机
5.2 交互特征
5.3 多项式特征
5.4 基于日期/时间数据的特征构建
5.5 数值特征分箱
5.6 领域特征工程
5.7 自动化特征生成(引言)
5.8 动手实践:构建新特征