趋近智
在拟合了多个备选模型(例如不同的ARIMA配置,或比较ARIMA与SARIMA)之后,目标是选择在未见过的数据上表现最好的模型。这种比较需要使用评估指标和标准,并且要对所有竞争模型一致地使用。
基本流程包括以下步骤:
我们假设已经为训练数据拟合了两个模型:一个非季节性ARIMA(1,1,1)和一个SARIMA(1,1,1)(1,1,0,12),后者旨在捕捉年度季节性(m=12)。我们现在在测试集上评估它们。
比较测试集上的指标
在为测试期生成两个模型的预测后,我们计算误差指标。假设我们得到以下结果:
| 模型 | MAE | RMSE | MAPE (%) | AIC(来自训练数据) | BIC(来自训练数据) |
|---|---|---|---|---|---|
ARIMA(1,1,1) |
15.2 | 19.8 | 8.5 | 950.5 | 962.1 |
SARIMA(1,1,1)(1,1,0,12) |
9.8 | 12.5 | 5.1 | 885.2 | 902.6 |
解读这些结果:
在这种情况下,测试集表现和信息准则都指向SARIMA(1,1,1)(1,1,0,12)模型是该数据集的更好选择,这可能是因为原始数据表现出季节性,而简单的ARIMA模型无法有效捕捉。
可视化比较
除了数值指标之外,将不同模型的预测结果与测试集中的实际值绘制在一起,可以提供有价值的视觉洞察。
实际测试数据与ARIMA和SARIMA模型预测结果的比较。SARIMA预测更贴近实际数据。
这种可视化方式让您可以看到每个模型在哪些地方表现良好或不佳。一个模型是否持续高估或低估?它是否能更好地捕捉转折点?上图中SARIMA的预测结果似乎比简单的ARIMA预测更贴近实际数据,这进一步证实了从指标得出的结论。
选择“最佳”模型
通常,一个模型会在大多数指标上明显优于其他模型,这使得选择变得直接明了。然而,有时您可能会面临权衡:
在这种情况下,请考虑:
模型比较是一个迭代过程。通过系统地计算指标、审查信息准则以及直观地查看保留测试集上的预测结果,您可以为您的特定时间序列问题做出关于哪个模型提供最可靠和准确预测的明智决定。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造