确立向量和矩阵作为表示和处理数据的工具后,我们现在考察这些操作发生的底层构造。本章侧重于向量空间,它是向量组的正式数学背景。我们将研究这些空间的性质,以及它们如何帮助我们理解数据结构和关系。具体而言,您将学习定义向量空间并识别这些空间内的子空间。我们将考察向量如何组合形成线性组合,并定义一组向量的张成。一个重要侧重点是线性独立,这是理解特征冗余和选择有信息量变量的重要思想。在此基础上,我们将定义向量空间的基及其维度,量化空间的基本构成和“大小”。我们还将考察与矩阵相关的几个子空间,即列空间和零空间,并理解矩阵秩的意义。这些思想为分析机器学习中的特征向量、理解模型复杂度以及为降维等算法准备数据提供了理论基础。我们将看到这些抽象代数思想如何直接关联到实际数据分析任务。