趋近智
您已经了解向量 (vector)如何表示单个数据点或特征,以及矩阵如何组织整个数据集或表示线性变换。现在,我们将这些内容与机器学习 (machine learning)中的一个常见任务关联起来:为模型找到最优参数 (parameter)。通常,此任务归结为求解线性方程组。
考虑最基本的一个模型:线性回归。其目标是根据一组输入特征 预测目标值 。该模型假设存在线性关系:
这里, 是模型参数(或权重 (weight)、系数),我们需要根据训练数据来确定它们。如果我们有 个数据点,可以将特征表示为矩阵 (其中每行是一个数据点,通常会添加一列1以表示截距项 ),并将目标值表示为向量 。参数构成一个向量 。
线性回归的目标通常是使预测值与实际值之间的平方差之和最小化。微积分和线性代数表明,实现此最小化的最优参数向量 满足正规方程:
仔细看这个方程。
突然间,训练线性回归模型的问题转变为求解熟悉的矩阵方程:
这正是本章关注的 形式。找到线性回归的最优参数需要求解此方程组,以得到未知向量 (它代表 )。
这种模式不局限于简单的线性回归。
因此,理解如何表示和求解像 这样的线性方程组不仅仅是线性代数中的理论练习。它是实现和理解几种重要机器学习算法背后机制的实际要求。在阐明了求解这些系统在机器学习中为何相关之后,接下来的部分将讨论用于找到解向量 的方法,从矩阵逆的思路开始。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•