在前述单变量和双变量分析方法的基础上,本章将扩展我们的分析工具箱。我们会先查看用于发现多个变量之间规律的可视化图表,例如成对图。您还将学习如何优化这些图表以更好地传达信息。在可视化之后,我们将转向特征工程的介绍。这涉及运用在EDA(数据概览分析)过程中获得的理解,来修改现有特征或创建新特征。我们将介绍实用的技术,例如数据缩放、归一化和分类数据编码,这些通常是在应用机器学习算法之前必需的步骤。最后,我们将探讨如何组织和展示在整个EDA(数据概览分析)过程中收集到的看法。