迄今为止,我们一直专注于使用描述性统计来描述已有的数据,并通过概率了解随机性规律。然而,通常情况下,我们在机器学习和数据分析中的目标不仅仅是描述所收集的数据;更重要的是,要基于有限的数据(样本)对更大的群体(总体)做出明智的推测或判断。从样本中得出关于总体的结论的这一过程被称为统计推断。本章将讲解统计推断的基本原理。你将学习到:从样本数据对总体特征(例如平均值)进行估计的方法,也就是点估计。如何使用置信区间量化这些估计值的不确定性。假设检验的原理:这是一种对总体相关论断做出判断的正式方式,包括建立原假设与备择假设以及解释p值。这些推断方法如何与评估机器学习结果的重要性相关联。我们将以前几章的描述性统计和概率知识为基础,以理解如何超出当前数据进行归纳。