在上一章概率基础之上,我们现在将重点放在描述随机变量不同结果发生可能性的特定数学函数上:概率分布。这些分布是数据中固有不确定性建模的重要工具,这也是机器学习中常见的一项工作。本章将介绍统计分析中常用到、并作为机器学习模型组成部分的几种常见分布。您将学习如何:识别并说明主要的离散分布:伯努利分布、二项分布($n, p$)和泊松分布($\lambda$)。识别并说明主要的连续分布:均匀分布、正态分布($\mu, \sigma^2$)和指数分布($\lambda$)。理解使每种分布适合对特定类型数据或现象进行建模的属性。应用Python库(特别是SciPy)来计算概率(例如概率密度/质量函数和累积分布函数)、生成随机样本以及可视化这些分布。在本章结束时,您将能够识别并使用这些标准分布,从而更好地分析数据并理解机器学习中使用的统计方法。