自相关函数(ACF)和偏自相关函数(PACF)是时间序列分析中的基本工具,用于理解数据结构并指导模型选择。这些图揭示了表明平稳时间序列数据具有自回归 (autoregressive)(AR)、移动平均(MA)或组合ARMA特征的模式。ACF和PACF的解读通常在确保时间序列平稳之后进行,这通常通过差分来实现。
核心思想是,纯AR和MA过程在其ACF和PACF图上具有明显的理论特征。通过将您数据图中的模式与这些理论特征进行匹配,您可以提出所需模型的阶数假设。
阅读图表:显著性边界
在解读模式之前,请回顾ACF/PACF图通常包含表示显著性边界的阴影区域(通常是95%置信区间)。落在此边界之外的值被认为在统计上显著异于零。边界之内的值通常被认为在统计上不显著(与零相关性一致)。我们关注那些相关性峰值超出这些边界的滞后阶数。
识别AR(p)模型
阶数为p的自回归 (autoregressive)模型,记作AR(p),表明序列的当前值与其前p个值呈线性关系。
Yt=c+ϕ1Yt−1+ϕ2Yt−2+⋯+ϕpYt−p+ϵt
其中 ϵt 是白噪声。
一个AR(p)过程的理论特征是:
- ACF: 逐渐拖尾。随着滞后阶数的增加,自相关性呈指数衰减或通过阻尼正弦波模式减弱。它不会突然降至零。
- PACF: 在滞后阶数p之后急剧截断。偏自相关性在前p个滞后阶数上显著,然后对于随后的滞后阶数急剧降至统计上不显著(在边界内)。
因此,如果您观察到:
- ACF图中相关性缓慢衰减。
- PACF图在滞后阶数p之前有显著峰值,然后立即落入显著性边界内。
这种模式强烈表明**AR(p)**模型是合适的。阶数p由PACF图中最后一个显著滞后阶数决定。
AR(2)过程的PACF图示例。注意在滞后阶数1和2处的显著峰值,随后值位于显著性边界内(虚线/阴影区域)。这表明p=2。
识别MA(q)模型
阶数为q的移动平均模型,记作MA(q),表明序列的当前值与当前及前q个白噪声误差项呈线性关系。
Yt=c+ϵt+θ1ϵt−1+θ2ϵt−2+⋯+θqϵt−q
一个MA(q)过程的理论特征与AR(p)过程本质上相反:
- ACF: 在滞后阶数q之后急剧截断。自相关性在前q个滞后阶数上显著,然后急剧降至统计上不显著。
- PACF: 逐渐拖尾。随着滞后阶数的增加,偏自相关性减弱。
所以,如果您的图表显示:
- ACF图在滞后阶数q之前有显著峰值,然后立即落入显著性边界内。
- PACF图中相关性缓慢衰减。
这种模式强烈表明**MA(q)**模型是合适的。阶数q由ACF图中最后一个显著滞后阶数决定。
MA(1)过程的ACF图示例。仅在滞后阶数1处出现显著峰值,随后值为不显著。这表明q=1。
识别ARMA(p,q)模型
自回归 (autoregressive)移动平均模型ARMA(p,q)结合了AR和MA两部分。
Yt=c+ϕ1Yt−1+⋯+ϕpYt−p+ϵt+θ1ϵt−1+⋯+θqϵt−q
一个ARMA(p,q)过程的理论特征不那么明显:
- ACF: 在滞后阶数q之后逐渐拖尾。
- PACF: 在滞后阶数p之后逐渐拖尾。
如果ACF和PACF图都显示出逐渐衰减的模式(无论是指数型还是正弦型),这表明**ARMA(p,q)**模型可能适用。
直接从图表中识别具体的阶数p和q比纯AR或MA模型更具挑战性。“拖尾”行为不会给出精确的截断点。在实际应用中,如果两个图都拖尾,您可能会假设较低阶模型,如ARMA(1,1)、ARMA(2,1)或ARMA(1,2),然后使用模型选择准则(如AIC或BIC,第六章讨论)和残差分析(第四章)来选择最合适的模型。
ARMA(1,1)过程的ACF和PACF图示例。两个函数都表现出拖尾行为,仅凭这些图难以精确识别阶数。
解读指导总结
| 模型 |
ACF模式 |
PACF模式 |
| AR(p) |
逐渐拖尾 |
在滞后阶数p后截断 |
| MA(q) |
在滞后阶数q后截断 |
逐渐拖尾 |
| ARMA(p,q) |
在滞后阶数q后拖尾 |
在滞后阶数p后拖尾 |
实际考量
- 需要平稳性: 这些解读适用于平稳时间序列。非平稳序列的ACF图通常显示非常缓慢的衰减,这种衰减会覆盖任何其他模式。始终首先确保平稳性。
"* 真实数据存在噪声: 理论模式是清晰的。数据图表可能会显示一些因随机因素而略微超出边界的峰值,尤其是在较高滞后阶数处。请寻找清晰的截断点或明显的拖尾模式。不要过度解读微小偏差。"
- 季节性: 如果您的数据具有季节性(例如,月度销售数据),您通常会在季节性滞后(例如12、24、36)处看到ACF/PACF中出现显著峰值。这表明需要季节性模型,如SARIMA,我们将在第五章讨论。非季节性阶数(p,q)有时仍可从初始非季节性滞后的行为中推断出来。
- 起点: 使用这些图表作为指导,提出候选模型阶数(p,q)。差分阶数d来自平稳性分析(第二章)。它们共同构成了尝试ARIMA(p, d, q)模型的基础,我们将在第四章中进一步分析。
通过仔细检查平稳时间序列的ACF和PACF图,您可以对其底层结构获得有价值的理解,为构建有效的ARIMA预测模型提供了坚实的基础。