趋近智
在数据中,最基本的信息单元是一个单一的值。在线性代数中,我们称之为标量。你可以把标量看作一个普通的数字。它有大小,但没有方向。它是我们能处理的最简单的数据元素。
例如,当我们测量房间温度时,会得到一个单一数值,比如 21°C。当我们查看商品价格时,会看到一个单一数值,例如 49.95 美元。这些独立的数字就是标量。
在机器学习中,标量随处可见。它们常用于表示特定的单一量:
数学上,标量通常写成小写斜体字母,例如 c、k 或 x。你可能还会看到它们用希腊字母表示,比如 α (阿尔法) 或 λ (拉姆达)。例如,我们可以定义一个标量 s 如下:
s=5标量不需要任何特殊结构来容纳它;它本身就是一个值。
标量是一个单一的数值量。它是构成更复杂数据结构的基本部分。
在 Python 中,标量由你可能已经熟悉的标准数值数据类型表示:int 用于整数,float 用于浮点(小数)数。没有特殊的“标量”对象。
以下是如何在 Python 中定义一些标量:
# 一个整数标量
sample_count = 150
# 一个浮点标量
learning_rate = 0.001
# 另一个表示模型参数的标量
bias_term = -2.5
print(f"Sample count: {sample_count} (Type: {type(sample_count)})")
print(f"Learning rate: {learning_rate} (Type: {type(learning_rate)})")
输出证实这些只是普通的 Python 数字:
Sample count: 150 (Type: <class 'int'>)
Learning rate: 0.001 (Type: <class 'float'>)
尽管简单,理解标量是第一步。它们是我们将用来构建向量和矩阵的基本单元,这对于表示数据集合和整个数据集是必不可少的。接下来,我们将看到如何将这些标量组合起来形成向量。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造