趋近智
标量只给我们单个信息,但多数数据并非如此简单。想象一下,要为房地产网站描述一栋房子。你不会只列出它的价格。你会列出它的面积、卧室数量和浴室数量。像这样有顺序的数字列表就是一个向量。
向量是存储具有多个属性的数据的一种基本方式。如果一栋房子有1500平方英尺,3间卧室和2间浴室,我们可以用向量 x 来表示它:
x=[1500,3,2]向量中的每个数字都是一个元素或分量。顺序很重要。向量 [3,2,1500] 将代表一栋完全不同的房子,一栋有3平方英尺、2间卧室和1500间浴室的房子,这没有什么意义。
向量作为数字的简单载体,具有强大的几何意义。为简单起见,我们只考虑一个有两个分量的向量,例如 v=[3,4]。我们可以在二维(2D)坐标系中将其可视化。
有两种常见的思考方式:
这种箭头视图尤其有益,因为它赋予了向量两个明显的属性:大小(箭头有多长?)和方向(箭头指向何处?)。
向量 v=[3,4] 被可视化为从原点出发的箭头和二维平面中的一个点。
在机器学习中,我们经常处理多维度的数据,远超我们容易可视化的两或三维。例如,一个表示28x28像素灰度图像的向量将有 28×28=784 个分量。即使我们无法绘制784维空间,长度和方向的几何观念仍然适用,并且它们是许多算法的核心。
在教科书和数学论文中,你会看到几种常用的向量记法。
列向量将其分量垂直排列:
v=[34]行向量则将其分量水平排列,就像我们目前为止所写的那样:
v=[3,4]当我们开始将向量与矩阵相乘时,这种区别就显得关键。目前,只需认识到这两种形式都存在。向量中分量的数量决定了它的维度。向量 [3,4] 是二维的,而 [1500,3,2] 是三维的。
向量提供了一种封装单个数据点特征的方式。但常见的数据集包含许多数据点。为了组织一整个向量集合,我们需要下一个构成要素:矩阵。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造