机器学习的核心是高效处理数值数据。尽管 Python 内置列表灵活多用,但它们并未针对数据分析和模型构建中常见的大规模数值运算进行优化。NumPy (Numerical Python) 正是在此时发挥作用。它为 Python 中的科学计算提供了核心支持,引入了强大的 N 维数组对象,即 ndarray。本章旨在让你熟练掌握 NumPy。你将学习如何:使用多种方法创建 NumPy 数组。进行基本的数组操作,包括索引、切片和形状变换。使用通用函数 (ufuncs) 在整个数组上高效应用数学和逻辑运算。理解广播机制,即 NumPy 用于对兼容形状的数组执行操作的方式。使用 NumPy 进行基本的线性代数任务和统计计算。从文件读取数据并将数组数据保存到文件。掌握 NumPy 是有效使用 Pandas 和 Scikit-learn 等其他基于它构建的数据科学库的必要一步。到本章结束时,你将能够处理机器学习工作流程中核心的数值数据结构和操作。