趋近智
在上一章单独分析了变量之后,我们现在将重心转向理解变量对之间如何关联。这一过程,被称为双变量分析,有助于发现数据集中两个不同特征之间可能存在的关联、依赖性或模式。
在本章中,你将学习以下方法:
我们将使用 Pandas 等 Python 库进行计算,并使用 Matplotlib/Seaborn 创建富有信息量的可视化图表,以有效地考察这些成对的关系。理解这些交互作用对于形成对数据的直观认识和指导后续建模步骤非常重要。
4.1 数值变量与数值变量:散点图
4.2 数值变量与数值变量:相关性分析
4.3 相关性可视化:热力图
4.4 数值型与分类型:比较图表
4.5 分类变量与分类变量:交叉制表
4.6 分类变量间的可视化:堆叠条形图与分组条形图
4.7 动手实践:双变量分析