趋近智
机器学习 (machine learning)模型的核心,是一种旨在从数据中学习模式的数学构造。看待许多监督学习 (supervised learning)模型,最直接的方法是将其视为函数。正如一个数学函数 接收输入 并生成输出 一样,机器学习模型接收输入数据(特征)并生成输出(预测或决策)。
我们来分解这些组成部分:
输入(特征): 这些是你输入模型的数据的可测量属性。如果你正在预测房价,输入可能包含房屋的面积、卧室数量和房龄。在机器学习 (machine learning)中,我们常将这些输入表示为一个向量 (vector),通常用 表示。向量中的每个元素对应一个特定特征。例如,。
输出(预测): 这是模型根据输入生成的结果。对于房价预测,输出将是预测价格(一个连续值)。对于图像分类,它可能是一个标签,例如“猫”或“狗”(一个离散类别),或是每个类别的概率。我们常将模型的预测表示为 (读作“y-hat”),以与真实目标值 区分开。
模型参数: 这些是模型从训练数据中学习到的内部变量。它们定义了从输入到输出的特定转换。可以将它们视为在训练过程中调整的“旋钮”,使模型的预测 尽可能接近实际目标值 。参数常以希腊字母表示,例如 (theta),或特定符号,如表示权重 (weight)的 和表示偏差的 。
我们可以使用函数表示法来表达输入、参数 (parameter)和输出之间的关系:
这个等式表明预测 由函数 生成,该函数接收输入特征 并由参数 进行配置。函数 的具体形式定义了模型的类型。
考虑最简单的模型之一:具有单个输入特征的线性回归。目标是找到一条最能拟合输入 (例如,工作年限)与输出 (例如,薪资)之间关系的直线。
此模型的函数就是一条直线的方程:
这里:
学习过程包括寻找 和 的最佳值,使预测薪资 与训练数据中的实际薪资 紧密匹配。
一个简单的线性回归模型 ,表示为拟合数据点的直线。参数 和 定义了直线的斜率和截距。
虽然线性回归提供了一个清晰的示例,但这种函数表示方法适用于远为复杂的模型:
"将模型视为函数 来理解是根本。它将机器学习 (machine learning)任务构筑为为所选函数 寻找最佳参数 ,以使其输出 准确地反映结果 。这种视角自然引出了优化的思路,我们需要工具来衡量 的变化如何影响模型的性能。这正是微积分,特别是导数和梯度,变得不可或缺的地方,正如我们将在接下来的章节中看到的。"
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•