原始数据,无论是实验数据还是日志数据,通常表现为大量数字或分类的集合。为了理解这些数据,我们需要方法来概括其主要特点。本章主要讲述描述性统计,即用于描述和概括数据集特点的方法。您将学习如何计算和解读:集中趋势量度:均值、中位数和众数,用于确定数据的中心位置。离散程度量度(或离散程度):全距、方差和标准差,描述数据点之间的差异程度。位置量度:百分位数和四分位数,有助于理解数据分布情况。我们还将介绍基本的数据可视化技术,例如直方图和箱线图,作为理解这些概括结果的视觉辅助。在本章中,您将看到如何使用Python的NumPy和Pandas库高效地计算这些统计量。