本章将为理解概率与统计在机器学习中的应用打下铺垫。我们将首先定义这些学科,并说明它们与构建和解释机器学习模型有何直接关联。你将学习如何:在数据分析背景下定义概率与统计。认识到这些内容对机器学习任务的重要性。区分不同类型的数据(例如:类别数据、数值数据)。理解总体与样本之间的差异。使用NumPy和Pandas等库搭建基本的Python环境。使用Python加载数据集并进行初步检查。学完本章,你将清晰地掌握核心内容,并能够进行初步的数据加载和查看,为后续学习统计方法做好准备。