自回归 (AR) 模型捕捉过去值对当前值的直接作用。相比之下,移动平均 (MA) 模型则关注另一种时间依赖来源:过去预测误差的影响。这可以想象成驾驶一艘船;有时你的调整不仅取决于你之前的位置,还取决于你之前的修正偏离了多少。MA 模型提出,当前观测值 ($Y_t$) 是当前误差项 ($\epsilon_t$) 和一个或多个过去误差项的线性组合。这些误差项表示过去影响序列的随机冲击或不可预测的分量。MA(q) 模型方程一个 $q$ 阶的移动平均模型,记作 MA(q),数学定义为:$$Y_t = \mu + \epsilon_t + \theta_1 \epsilon_{t-1} + \theta_2 \epsilon_{t-2} + \dots + \theta_q \epsilon_{t-q}$$让我们分解一下这些分量:$Y_t$: 时间序列在当前时间点 $t$ 的值。$\mu$: 序列的均值或基准水平。对于零均值过程,此项可能被省略。$\epsilon_t$: 时间 $t$ 的白噪声误差项。这代表当前时间步的不可预测冲击。我们假设这些误差是独立同分布的,通常服从均值为零、方差为常数 ($\sigma^2$) 的正态分布。$\epsilon_{t-1}, \epsilon_{t-2}, \dots, \epsilon_{t-q}$: 前 $q$ 个时间段的误差项。这些是过去的预测误差。请注意,这些通常无法直接观测,而是作为模型拟合过程的一部分进行估计。$\theta_1, \theta_2, \dots, \theta_q$: MA 模型的参数。这些系数决定了每个过去误差项对当前观测值 $Y_t$ 的权重或影响。$q$: MA 模型的阶数,表明模型中包含多少个过去的误差项。本质上,MA(q) 模型表明,过去 $q$ 个时期的随机冲击或误差会继续回响并影响序列的当前值。MA 模型的特点平稳性: 与 AR 模型不同,AR 模型根据其参数可能不平稳,而有限阶 MA(q) 模型总是弱平稳的。这是因为 $Y_t$ 被定义为白噪声项的有限线性组合,而白噪声项具有常数均值(零)和常数方差。$Y_t$ 的均值为 $\mu$,其方差和自协方差结构不依赖于时间 $t$。有限记忆: 其主要特点是过去误差项的影响仅持续 $q$ 个周期。误差 $\epsilon_{t-k}$ 直接影响 $Y_{t-k}, Y_{t-k+1}, \dots, Y_{t-k+q}$,但对 $Y_{t-k+q+1}$ 或后续值没有直接影响。这与 AR 模型形成对比,AR 模型中过去值的影响理论上可以无限期持续,尽管通常随时间衰减。使用 ACF 图确定 MA 阶数 (q)如第 3 章所述,自相关函数 (ACF) 图有助于确定潜在 MA 模型的阶数 $q$。对于一个真实的 MA(q) 过程:ACF 在滞后 1 到 $q$ 处将出现统计上显著的尖峰。ACF 将在滞后 $q$ 之后突然截断。这意味着所有大于 $q$ 的滞后 ($k > q$) 的自相关将统计上不显著(即,落在零附近的置信区间内)。考虑 MA(2) 过程的理论 ACF:{"data": [{"x": [1, 2, 3, 4, 5, 6, 7], "y": [0.485, 0.224, 0.0, 0.0, 0.0, 0.0, 0.0], "type": "bar", "name": "自相关", "marker": {"color": "rgb(34, 130, 230)"}}], "layout": {"title": {"text": "MA(2) 的理论 ACF", "font": {"size": 20}}, "xaxis": {"title": {"text": "滞后", "font": {"size": 16}}, "tickmode": "array", "tickvals": [1, 2, 3, 4, 5, 6, 7], "range": [0.5, 7.5], "dtick": 1, "zeroline": true, "zerolinewidth": 1, "zerolinecolor": "black"}, "yaxis": {"title": {"text": "自相关 (ACF)", "font": {"size": 16}}, "range": [-0.3, 0.6], "zeroline": true, "zerolinewidth": 1, "zerolinecolor": "black"}, "shapes": [{"type": "line", "xref": "paper", "yref": "y", "x0": 0, "y0": 0.2, "x1": 1, "y1": 0.2, "line": {"color": "rgb(173, 181, 189)", "width": 1, "dash": "dash"}}, {"type": "line", "xref": "paper", "yref": "y", "x0": 0, "y0": -0.2, "x1": 1, "y1": -0.2, "line": {"color": "rgb(173, 181, 189)", "width": 1, "dash": "dash"}}], "margin": {"l": 60, "r": 30, "b": 60, "t": 60, "pad": 4}, "plot_bgcolor": "white", "paper_bgcolor": "rgb(233, 236, 239)", "height": 450, "width": 700}}MA(2) 过程的理论 ACF 图。在滞后 1 和 2 处存在显著相关性,之后相关性急剧下降到不显著范围(虚线表示置信区间)。如果您在您的平稳时间序列数据(如果需要,在差分之后)的 ACF 图中观察到这种急剧截断的模式,这表明 MA(q) 模型可能适用,其中 $q$ 是 ACF 截断的滞后阶数。反之,MA(q) 过程的偏自相关函数 (PACF) 通常呈“拖尾”现象,意味着它会更缓慢地衰减到零。作为构成要素的 MA 模型虽然纯 MA 模型有时用于预测,但它们更常作为更一般的 ARMA 和 ARIMA 框架中的组成部分出现。理解 MA 模型如何捕捉对过去误差的依赖,是理解 ARMA 模型如何结合过去值和过去误差信息,以及 ARIMA 模型如何将其扩展到非平稳数据的根本。在接下来的章节中,我们将了解如何结合 AR 和 MA 分量形成 ARMA 模型,然后加入差分,得到功能多样的 ARIMA 模型类。