趋近智
在学习了概率的理论基础之后,我们现在转向理解数据集的实际任务。原始数据通常需要初步汇总,以在其进行更复杂的分析或建模之前展现其核心特征。本章介绍描述性统计——一种定量描述数据集主要特点的方法。
你将学会计算和解释主要的汇总指标:
我们还将强调相关性与因果关系之间的重要区别,并演示如何使用Python中的Pandas库高效计算这些统计量,同时结合直方图和箱线图等可视化方法。本章结束时,你将能够有效地概括和传达数据集的主要特性。
3.1 集中趋势的度量:均值、中位数、众数
3.2 离散度量:方差、标准差、极差
3.3 理解偏度和峰度
3.4 百分位数和四分位数
3.5 相关性分析
3.6 区分相关性与因果关系
3.7 数据总结的可视化
3.8 使用 Pandas 计算描述性统计量
3.9 实践:总结数据集
© 2026 ApX Machine Learning用心打造