标准向量自回归 (VAR) 模型擅长捕捉时间依赖性并同时预测多个时间序列,格兰杰因果检验评估预测影响力,但它们往往无法辨识结构性因果关系。如前一节所述,VAR模型中的简化形式误差 ($u_t$),即 $Y_t = c + \sum_{i=1}^p A_i Y_{t-i} + u_t$,通常具有同期相关性 ($E[u_t u_t'] = \Sigma_u$,其中 $\Sigma_u$ 是非对角矩阵)。这种相关性遮蔽了某个变量在同一时期内对另一个变量的即时、结构性影响。将观察到的误差相关性归因于特定的因果联系,需要施加额外的结构约束。结构向量自回归 (SVAR) 精确地扩展了VAR框架以应对这一难题。它使我们能够从单纯的预测或预测性因果关系,转而估计变量间的同期因果效应,借助于对底层数据生成过程的理论假设或领域知识。从简化形式到结构形式SVAR的核心思想是设定一个与简化形式VAR相关的结构模型。考虑一个由向量 $Y_t$ 表示的包含 $k$ 个内生变量的系统。SVAR模型可以写为:$$ B_0 Y_t = k + \sum_{i=1}^p B_i Y_{t-i} + \epsilon_t $$其中:$Y_t$ 是时间 $t$ 时的 $k \times 1$ 变量向量。$B_0$ 是一个 $k \times k$ 矩阵,表示变量间的同期关系。$B_0$的非对角线元素代表变量 $j$ 在时间 t 对变量 $i$ 的直接因果影响。$k$ 是一个截距向量。$B_i$ 是滞后变量的 $k \times k$ 系数矩阵。$\epsilon_t$ 是一个 $k \times 1$ 的结构冲击(或新息)向量。这些被假定为彼此不相关,代表了潜在的外生经济或系统扰动。通常,它们的协方差矩阵 $E[\epsilon_t \epsilon_t'] = \Sigma_\epsilon$ 被假定为对角矩阵,为简便起见,常标准化为单位矩阵 $I$。通过乘以 $B_0^{-1}$(假设 $B_0$ 可逆),我们可以将SVAR与标准VAR关联起来:$$ Y_t = B_0^{-1} k + \sum_{i=1}^p (B_0^{-1} B_i) Y_{t-i} + B_0^{-1} \epsilon_t $$将此与简化形式VAR,$Y_t = c + \sum_{i=1}^p A_i Y_{t-i} + u_t$,比较,我们得到以下映射关系:$c = B_0^{-1} k$$A_i = B_0^{-1} B_i$$u_t = B_0^{-1} \epsilon_t$ (这些是简化形式残差)简化形式残差的协方差矩阵 $\Sigma_u$ 与结构冲击 $\epsilon_t$ 和同期效应矩阵 $B_0$ 相关:$$ \Sigma_u = E[u_t u_t'] = E[(B_0^{-1} \epsilon_t) (\epsilon_t' (B_0^{-1})')] = B_0^{-1} E[\epsilon_t \epsilon_t'] (B_0^{-1})' = B_0^{-1} \Sigma_\epsilon (B_0^{-1})' $$如果我们假设 $\Sigma_\epsilon = I$(不相关的单位方差结构冲击),那么:$$ \Sigma_u = B_0^{-1} (B_0^{-1})' = (B_0' B_0)^{-1} $$或等价地,$$ B_0' B_0 = \Sigma_u^{-1} $$识别问题标准VAR估计可以得到 $A_i$ 和 $\Sigma_u$ 的估计值。SVAR中的挑战在于从估计的 $\Sigma_u$ 中恢复结构参数,特别是同期效应矩阵 $B_0$ 和结构冲击 $\epsilon_t$ 的特性(如果假定为对角线,通常只关心它们的方差)。方程 $B_0' B_0 = \Sigma_u^{-1}$(假设 $\Sigma_\epsilon = I$)涉及 $B_0$ 中 $k^2$ 个未知元素。然而,由于 $\Sigma_u^{-1}$ 是对称的,此方程仅提供 $k(k+1)/2$ 个独立的约束。为了唯一确定 $B_0$ 的 $k^2$ 个元素,我们需要额外的 $k^2 - k(k+1)/2 = k(k-1)/2$ 个约束。这些约束必须来自模型外部,通常基于经济理论、领域信息或关于因果结构的特定假设。这就是SVAR中的识别问题。常用识别策略存在多种策略来施加必要的约束以识别 $B_0$:短期约束(递归排序): 这也许是最常用的方法,由克里斯托弗·西姆斯开创。它假定同期效应具有递归结构。具体来说,它对 $B_0$ 矩阵的某些元素施加零约束,使其成为下(或上)三角矩阵。对于下三角矩阵 $B_0$,假设系统中第一个变量($Y_{1t}$)只受自身冲击($\epsilon_{1t}$)的同期影响,第二个变量($Y_{2t}$)受 $\epsilon_{1t}$ 和 $\epsilon_{2t}$ 的影响,依此类推。最后一个变量($Y_{kt}$)可以同期受到所有结构冲击的影响。机制: 下三角 $B_0$ 恰好提供了所需的 $k(k-1)/2$ 个零约束。实现: 这种结构直接对应于估计的方差-协方差矩阵 $\Sigma_u$ 的乔利斯基分解。如果 $P$ 是一个下三角乔利斯基因子,使得 $P P' = \Sigma_u$,那么将 $B_0^{-1} = P$(考虑列的缩放/符号)就能满足 $\Sigma_u = B_0^{-1} (B_0^{-1})'$。注意: 识别结果严重依赖于所选的变量排序。不同的排序意味着不同的因果假设,可能导致截然不同的结果。理想情况下,排序应通过关于响应速度的强有力理论论证来支持。digraph G { rankdir=LR; node [shape=circle, style=filled, fillcolor="#a5d8ff"]; edge [color="#495057"]; subgraph cluster_t { label = "时间 t"; style=dashed; Y1_t [label="Y1"]; Y2_t [label="Y2"]; Y3_t [label="Y3"]; } subgraph cluster_shocks { label = "结构冲击 εt"; style=dashed; e1 [label="ε1", shape=plaintext, fontcolor="#f03e3e"]; e2 [label="ε2", shape=plaintext, fontcolor="#1c7ed6"]; e3 [label="ε3", shape=plaintext, fontcolor="#37b24d"]; } e1 -> Y1_t [color="#f03e3e"]; e1 -> Y2_t [color="#f03e3e"]; e1 -> Y3_t [color="#f03e3e"]; e2 -> Y2_t [color="#1c7ed6"]; e2 -> Y3_t [color="#1c7ed6"]; e3 -> Y3_t [color="#37b24d"]; Y1_t -> Y2_t [label="b21", style=dashed]; Y1_t -> Y3_t [label="b31", style=dashed]; Y2_t -> Y3_t [label="b32", style=dashed]; }对于 $k=3$ 的递归(下三角 $B_0$)结构。变量 $Y_1$ 只对冲击 $\epsilon_1$ 产生同期响应。$Y_2$ 对 $\epsilon_1, \epsilon_2$ 和 $Y_1$ 产生响应。$Y_3$ 对所有冲击和变量产生响应。虚线表示 $B_0$ 中潜在的非零非对角线元素。长期约束(布兰查德-夸赫方法): 该方法不是限制即时效应($B_0$),而是对某些冲击的长期效应施加约束。长期影响矩阵由 $\sum_{i=0}^\infty C_i$ 给出,其中 $C_i$ 是表示脉冲响应的移动平均(MA)系数矩阵。施加约束,使得某些冲击(例如,供给冲击)对某些变量(例如,产出)产生永久性影响,而其他冲击(例如,需求冲击)只产生暂时性影响。这需要对系统长期行为进行假设。符号约束: 这种方法利用定性理论知识。它不是将 $B_0$ 或长期矩阵中的特定系数设为零,而是限制某些变量对特定冲击在给定时间范围内的脉冲响应的符号(例如,积极的货币政策冲击在某些时期应降低通胀和产出)。这种方法不会产生唯一的 $B_0$,而是一组与符号约束一致的可能模型。推断通常通过分析这组模型的结果分布来完成(例如,使用中位数响应和置信区间)。计算上要求更高,因为它涉及对可能的旋转矩阵进行搜索或抽样。代理SVAR / 外部工具变量: 该方法使用与特定感兴趣的结构冲击相关,但与其他结构冲击不相关,且除通过该特定冲击外不直接影响内生变量的外部变量(代理变量)。这类似于在时间序列背景下使用工具变量(如第4章所述)。寻找有效且有力的代理变量是主要难题,但当有可用时,此方法对于识别特定冲击是有效的(例如,使用高频金融数据作为货币政策冲击的代理)。分析SVAR输出:IRF和FEVD一旦SVAR模型被识别(即 $B_0$ 被估计),因果解释的主要工具是:结构脉冲响应函数 (IRF): 它们描绘了一个单位(或通常是一个标准差)结构冲击($\epsilon_{j,t}$)对所有内生变量($Y_{k, t+h}$,其中 $h=0, 1, 2, \dots$)未来路径的动态影响。与显示对相关残差 $u_t$ 响应的简化形式IRF不同,结构IRF分离了不同、不相关潜在冲击的因果影响。这有助于更具意义的因果描述(例如,“政策利率意外上调1%对未来24个月的通货膨胀和失业率有什么影响?”)。{"data": [{"x": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10], "y": [0.5, 0.3, 0.15, 0.05, 0, -0.02, -0.03, -0.02, -0.01, 0, 0], "type": "scatter", "mode": "lines", "name": "Y1 对 Y2 冲击的响应", "line": {"color": "#1c7ed6"}}, {"x": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10], "y": [0.8, 0.9, 0.85, 0.7, 0.5, 0.3, 0.1, 0, 0, 0, 0], "type": "scatter", "mode": "lines", "name": "Y2 对 Y2 冲击的响应", "line": {"color": "#f03e3e"}}], "layout": {"title": "结构脉冲响应示例 (Y2 冲击)", "xaxis": {"title": "时间范围 (期)"}, "yaxis": {"title": "响应"}, "legend": {"orientation": "h", "yanchor": "bottom", "y": -0.3, "xanchor": "center", "x": 0.5}}}脉冲响应示例,显示了源自变量 Y2 的一个标准差结构冲击在10个时期内对 Y1 和 Y2 的动态影响。预测误差方差分解 (FEVD): FEVD将每个变量($Y_k$)在不同时间范围($h$)的预测误差方差分解为归因于每个结构冲击($\epsilon_j$)的比例。它有助于量化驱动每个变量随时间波动变化的各种变异来源或因果影响的相对重要性。例如,FEVD可能显示通货膨胀12个月预测误差方差的60%归因于供给冲击,30%归因于需求冲击,10%归因于货币政策冲击。实际考量与局限性尽管功能强大,SVAR分析仍依赖于多项假设并面临局限性:识别的有效性: SVAR结果的可信度完全取决于所选识别方案(递归、长期、符号、代理)的有效性。这些约束通常是源自理论的不可检验假设。强烈建议进行敏感性分析,评估其他可行的识别方案。平稳性: 基本SVAR假定时间序列是平稳的。如果变量是非平稳且协整的,则需要结构向量误差修正模型(SVECM)。线性: 关系被假定为线性。非线性SVAR模型存在但更为复杂。滞后阶数: 为底层VAR选择合适的滞后阶数 $p$ 很重要。通常使用标准信息准则(AIC, BIC, HQIC),但也需要检查残差自相关。参数不确定性: IRF和FEVD基于估计参数,因此存在不确定性。应该始终报告和考量置信区间(通常通过自举法生成)。维度: VAR/SVAR中的参数数量($k^2 p$ 个自回归系数加上协方差矩阵元素)随变量数量 $k$ 的增加呈二次方增长。当 $k$ 较大时,估计会变得不可靠。在高维环境下施加结构识别之前,可能需要采用正则化技术(LASSO VAR)或贝叶斯VAR(BVAR)作为预处理手段。SVAR提供了一个框架,用于向多元时间序列模型施加因果结构,从而能够估计同期效应,并通过结构冲击分析动态因果影响。它的识别高度依赖于外部假设,这使得仔细的论证和敏感性分析成为任何应用SVAR研究的必要组成部分。通过IRF等途径获得的观点对于理解动态系统,以及在存在时间动态和反馈的背景下为政策或商业决策提供参考,都具有重要价值。