趋近智
时间序列模型如ARIMA和SARIMA,通过拟合 (overfitting)历史数据来理解趋势、季节性和自相关等模式。这些模型是预测的强大工具。然而,仅仅构建一个模型并不能保证它在预测方面的实用性。要判断一个复杂的SARIMA(1,1,1)(1,1,0,12)模型在预测下个月销售额方面是否真的比更简单的ARIMA(2,1,0)模型,甚至是朴素预测更好,需要仔细评估。这就是模型评估变得必不可少的原因。
试想一下:最终目标通常是预测模型在训练过程中未曾见过的未来值。一个模型可能非常出色地捕获了历史数据,几乎完美地拟合了训练点,但在要求它推断未来时却表现非常差。这种被称为过拟合的现象发生在模型学习了训练数据的噪声和特定特性,而非潜在信号时。仅凭模型训练过的数据来评估模型可能会导致误导性的乐观结果。
因此,我们需要一种结构化的方法来评估模型在新数据上的表现。模型评估有几个重要目的:
如果没有正式的评估过程,选择和部署预测模型就会变成猜测。您可能会选择一个比简单模型表现更差的复杂模型,或者部署一个不可靠的未来预测模型。本章的后续部分将为您提供时间序列预测中使用的标准技术和指标,以执行这种必要的评估,首先是关于如何正确划分数据,然后计算像、这样的指标,以及使用像这样的准则来指导您的模型选择过程。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•