趋近智
这是“平均绝对误差 (MAE)”部分的详细内容。
在评估回归模型时,我们的首要目标是弄清楚模型的预测与实际值之间存在多大偏差。一种直接的衡量方法就是平均绝对误差,简称 MAE。
假设您的模型预测房价。对于一套房屋,模型预测价格为 25 万美元,但实际售价为 26 万美元。误差是 1 万美元(26 万美元 - 25 万美元)。对于另一套房屋,模型预测价格为 31 万美元,但实际售价为 30.5 万美元。这里的误差是 -5 千美元(30.5 万美元 - 31 万美元)。
如果我们直接对这些误差(1 万美元和 -5 千美元)取平均值,正负值可能会相互抵消,从而给出整体表现的误导性信息。为避免这种情况,MAE 使用每个误差的绝对值。绝对误差只是误差的大小,不考虑其正负号。因此,我们示例中的绝对误差分别是 ∣10,000∣=10,000 和 ∣−5,000∣=5,000。
MAE 接着计算您的测试数据集中所有预测的这些绝对误差的平均值。它平均地告诉您,无论预测值是过高还是过低,您的预测与真实值之间的偏差有多大。
MAE 的公式是:
MAE=n1i=1∑n∣yi−y^i∣我们来分解一下这个公式:
我们来看一个小例子。假设我们有一个包含 4 个数据点的测试集,我们的模型对目标变量(如摄氏温度)做出以下预测:
| 数据点 | 实际值 (yi) | 预测值 (y^i) | 误差 (yi−y^i) | 绝对误差 (∣yi−y^i∣) | | :--------- | :------------------- | :---------------------------- | :------------------------ | :------------------------------------ | | 1 | 22 | 24 | -2 | 2 | | 2 | 15 | 14 | 1 | 1 | | 3 | 30 | 27 | 3 | 3 | | 4 | 19 | 20 | -1 | 1 |
现在,我们应用 MAE 公式:
因此,该模型在这个小型测试集上的 MAE 为 1.75。
示例中计算的四个数据点的绝对误差。MAE 代表这些柱子的平均高度。
MAE 值直接衡量了目标变量原始单位中平均预测误差的大小。在我们的例子中,MAE 是 1.75 摄氏度。这意味着,平均而言,模型的温度预测与实际值相差 1.75 摄氏度,无论方向(过高或过低)。
MAE 具有一些显著的特点:
然而,它线性处理所有误差(10 美元的误差贡献是 5 美元误差的两倍)这一事实,如果您应用中特别担心大误差,可能就不那么理想。在您需要强烈惩罚大偏差的情况下,MSE 或 RMSE 等其他指标可能更合适。
总的来说,MAE 提供了一种清晰、易于理解的平均预测误差衡量方法,是理解回归模型表现的有用工具,尤其当你偏好对异常预测不那么敏感的指标,或者平均误差大小的直接可读性最受关注时。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造