趋近智
在前述单变量和双变量分析方法的基础上,本章将扩展我们的分析工具箱。我们会先查看用于发现多个变量之间规律的可视化图表,例如成对图。您还将学习如何优化这些图表以更好地传达信息。
在可视化之后,我们将转向特征工程的介绍。这涉及运用在EDA(数据概览分析)过程中获得的理解,来修改现有特征或创建新特征。我们将介绍实用的技术,例如数据缩放、归一化和分类数据编码,这些通常是在应用机器学习算法之前必需的步骤。最后,我们将探讨如何组织和展示在整个EDA(数据概览分析)过程中收集到的看法。
5.1 多元数据可视化:对图
5.2 自定义图表以提高清晰度(标题、标签、图例)
5.3 特征工程思想介绍
5.4 从现有特征生成新特征
5.5 基本数据转换:缩放与归一化
5.6 处理分类特征:编码方法
5.7 降维思路介绍
5.8 汇总和报告EDA结果
5.9 实践操作:特征创建与归纳
© 2026 ApX Machine Learning用心打造