趋近智
自回归积分滑动平均(ARIMA)模型,记作,是捕捉时间序列数据中序列相关性和趋势的有用工具。这些模型通过将序列的当前值与其自身的历史值(AR部分)以及过去的预测误差(MA部分)关联起来发挥作用,通常在应用差分以实现平稳性之后(I部分)。
"然而,许多时间序列都表现出季节性,这是一种在固定已知周期内重复出现的模式。可以想想月度零售销售数据常在节假日之前达到峰值、季度公司财报,或者每日网站流量显示出工作日/周末的变化。这些周期以规律的间隔出现(例如,每12个月、4个季度或7天)。"
标准的模型在处理强烈的季节性时面临挑战。原因如下:
考虑一个代表空调月度销售额的时间序列,其销售额可能每年在夏季月份达到峰值。
示例月度销售数据显示出明显的年度季节性模式。销售额每年在6-8月(夏季)达到峰值。
一个尝试预测明年7月销售额的ARIMA模型将主要查看6月、5月、4月等的销售额(滞后1、2、3...)。尽管这些近期值提供了一些信息,但由于需求的季节性,去年7月的销售额(滞后12)通常是更强的预测因素。标准ARIMA模型不明确使用这个滞后12的信息,除非或设置为12或更高,这,如前所述,会创建一个效率低下的模型结构。
此外,如果我们查看这类季节性数据(在可能使其平稳之后)的自相关函数(ACF)图,我们经常会看到明显的自相关性,这不仅仅在短期滞后处,而且在与季节频率对应的滞后处(例如,月度数据的12、24、36)。
具有月度季节性数据ACF图示例。请注意滞后12和滞后24处的明显峰值,这表明除了短期滞后相关性之外,在季节频率处存在强相关性。虚线表示近似置信区间。
标准ARIMA模型没有结构能有效地捕捉ACF中这些独特的季节性峰值。它们尝试从滞后1开始模拟衰减模式,但没有专门针对滞后等的特定项。
由于这些局限性,仅依靠处理强季节性数据通常会导致次优的预测结果。模型可能无法准确捕捉重复出现的峰谷,或需要过多的参数。这使得我们需要一种扩展,它能明确地纳入季节性成分,从而引出季节性ARIMA(SARIMA)模型。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造