趋近智
在机器学习中,我们处理数据。大量的数据。这些数据可以是客户购买记录、传感器读数,也可以是图像和文本文档。为了将数学算法应用于这些各类数据,我们首先需要一种一致的方法来表示它们。这就是向量的用武之地。
可以将向量视为一个有序的数字列表。此列表中的每个数字代表单个数据点的特定属性或特征。通过将这些特征组织成向量,我们创建了一个算法可以处理的数学对象。
设想您有关于房屋的数据,并且您想预测它们的价格。对于每个房屋,您可能会记录几个特征:
机器学习中的数据需要一种一致的表示方式。例如,一个特定的房屋(如房屋 A)可能具有以下特点:1500 平方英尺,3 间卧室,20 年房龄,距离学校 0.5 英里。为了对这类数据应用数学算法,房屋 A 的这些特点可以表示为一个向量:
vA=15003200.5
这个列向量vA常被称为特征向量。每个元素都按预定顺序对应一个特定的特征。另一个房屋,房屋 B(2100 平方英尺,4 间卧室,5 年房龄,距离学校 1.2 英里),将由另一个向量表示:
vB=2100451.2
这种表示方法极其灵活:
将数据表示为向量使我们能够从几何角度思考。如果一个数据点有两个特征(例如身高和体重),我们可以将其表示为二维向量。我们可以将此向量可视化为从原点 (0, 0) 开始,终止于由特征值(身高,体重)在二维平面中定义的点处的箭头。
两个数据点 A=(2, 5) 和 B=(4.5, 3),表示为从二维特征空间原点出发的向量。
如果我们有三个特征,每个数据点就成为三维空间中的向量。对于具有 n 个特征的数据(如我们的房屋示例中 n=4),每个数据点对应于 n 维空间中的一个向量,这个空间常被称为特征空间。虽然我们无法轻易可视化超过三维的空间,但数学原理保持不变。
这种向量表示是大多数机器学习算法所基于的形式。它提供了一种结构化形式,使我们能够:
在接下来的章节中,我们将了解您可以在这些向量上执行的基本运算,以及这些运算与机器学习任务的关系。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造