趋近智
自回归 (AR) 模型运用过往值,而移动平均 (MA) 模型则使用过往误差。ARMA 模型结合了这两种思路。然而,AR、MA 和 ARMA 模型的一个重要假设是,基础的时间序列数据必须是平稳的。其统计特征,如均值和方差,不应随时间变化。
当我们遇到实际数据时会怎样?这些数据经常显示出趋势或其他形式的非平稳性。将 ARMA 模型直接应用于这类数据会导致不可靠的结果。这就是 ARIMA 中“I”的作用所在。
ARIMA 代表差分整合自回归移动平均。“整合”部分解决了非平稳性问题。回顾第2章“时间序列分解与平稳性”,差分是一种常用方法,用于将非平稳序列转换为平稳序列。我们通过计算连续观测值之间的差值来实现这一点。有时,如果第一次差分未能得到平稳序列,我们可能需要多次应用差分。
“整合”一词表明建模过程包含了这个差分步骤。它指的是一个思路,即原始非平稳序列可以被认为是差分的逆过程,本质上是平稳差分序列的求和或(在离散意义上的)积分。
ARIMA 模型的特点是三个参数:(p,d,q)。
p 相同,但它是根据差分后的序列确定的。q 相同,应用于差分后的序列。因此,ARIMA(p, d, q) 模型实际上是将 ARMA(p, q) 模型应用于时间序列在经过 d 次差分之后。
流程图说明了差分 (d) 如何使数据平稳,从而可以确定 ARMA(p, q) 结构,最终将 ARIMA(p, d, q) 模型应用于原始数据。
如果时间序列已经平稳,我们设置 d=0,ARIMA(p, 0, q) 模型将直接简化为 ARMA(p, q) 模型。ARIMA 的优点在于它能够处理更广泛的时间序列,特别是那些经过一次或多次差分后变得平稳的序列。
在使用像 Python 中的 statsmodels 这样的库时,您通常指定 (p,d,q) 阶数并提供原始的非平稳时间序列。库会在模型拟合过程中在内部处理差分。通常不需要在将数据传递给 ARIMA 函数之前手动进行差分,尽管理解差分步骤 (d) 对于选择正确的模型阶数很重要。
在接下来的章节中,我们将讨论选择 p、d 和 q 适当值的策略,如何使用 Python 拟合模型,以及如何评估其性能。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造