趋近智
识别因果效应,即 ,可以通过多种方法实现。例如,后门和前门调整准则为许多有向无环图 (DAGs) 描述的常见场景提供了解决方法。然而,这些准则仅涵盖了可识别情况的一个子集。系统常出现未观测混杂或复杂因果路径等问题,这些标准调整准则无法直接处理。结构因果模型 (SCMs) 和 do-演算的框架提供了一个更全面的工具集,用于处理这些更具挑战性的识别问题。
回顾do-演算的三个规则,它们允许我们在满足特定图条件的情况下,仅使用观测到的量来操纵涉及干预( 算子)的概率分布。
do-演算的意义不仅在于提供充分条件;它为 DAG 中的非参数 (parameter)识别提供了一个完备算法。如果一个因果效应 可以使用源自通过 DAG 表示的 SCM 的观测分布 来表达,那么系统地应用 do-演算规则将推导出该表达式。如果这些规则未能消除 -算子,则通常无法仅从观测数据中识别该效应,除非有进一步的假设。
考虑一个比典型后门或前门情况稍微复杂一点的场景:
一个未观测混杂因素 同时影响 和 。 介导 对 的影响,而 混杂 和 但可观测。传统后门方法因 而失效。前门方法失效,因为仅靠 无法阻断 到 的路径(由于 路径)。
在此,识别 需要仔细应用 do-演算规则,通常涉及依次对 和 等观测变量进行条件化和边际化。例如,可以尝试首先调整 ,然后使用与介导变量 相关的属性。
当未观测变量混淆处理 和结果 之间的关系时,一个主要挑战就出现了。虽然 do-演算在这种情况下仅从观测数据来看表明无法识别,但特定结构或辅助变量有时可以实现识别。
经典方法是工具变量 (IV)。工具变量 是一个影响 的变量,但它只通过影响 来影响 ,并且不与 共享任何共同原因(除了可能通过 )。
典型的 IV 图结构。尽管存在未观测混杂因素 ,但 使得识别 对 的效应成为可能。
在某些假设下(通常是简单估计的线性假设),IV 估计量可以恢复因果效应。例如,在线性、同质效应设定中:
这识别了 对 的平均因果效应。实践中寻找有效工具变量是出了名的困难。它们必须满足相关性条件( 导致 )和排他性限制( 只通过 影响 且独立于 )。我们将在第 4 章中介绍高级 IV 方法。
近端因果推断是一个更新的框架,在直接工具变量不可用但未观测混杂因素的代理变量存在时,它提供了一种替代方案。假设 是 和 之间的未观测混杂因素。近端推断寻求两个观测变量:
重要的是, 和 必须满足某些条件独立性假设,它们基本上充当潜在混杂因素 的噪声测量。
近端因果推断设置。 和 是未观测混杂因素 的观测代理。
在特定条件下,特别是求解积分方程(实践中常需要正则化 (regularization)或核方法),近端方法可以识别因果效应 。例如,一种识别策略涉及从观测数据中求解桥函数 和 ,然后通过潜在混杂因素 将它们关联起来。这在高维设置中特别相关,其中 可能很复杂,但高维代理 和 可用(例如,文本嵌入 (embedding)、过去的用户行为)。我们将在第 4 章中介绍此内容。
有时可以通过调整一组变量来实现识别,这些变量不满足标准后门准则,但满足替代图条件。例如,如果调整仅在其他变量的特定分层内有效,则条件后门准则可能适用。其他准则可能涉及在特定图结构下调整处理变量的后代,以及更简单的前门设置。这些方法通常源于仔细应用 do-演算或分析图结构,以寻找阻断混杂路径的替代方法。
对于可能包含未观测混杂因素的 DAG(通常在最大祖先图 MAGs 等相关图中用双向边表示),Tian 和 Pearl 开发了一种可证明完备的算法,通常称为 ID 算法。给定一个因果查询 和一个因果图(可能包含隐藏变量),ID 算法会确定该查询是否可以从观测到的联合分布中识别。如果可以,算法将输出相应的估计量作为观测分布的函数;否则,它会正确报告不可识别性。
虽然该算法本身很复杂,涉及图分解和 do-演算逻辑的递归应用,但它的存在在理论上具有重要意义。它保证任何可识别的效应都可以被系统地发现。诸如 DoWhy 等库中存在实现,允许实践者检查复杂自定义图的可识别性。
区分非参数识别和参数识别很重要。
虽然非参数识别通常因其稳定性而受青睐,但参数假设有时是必要的,特别是在处理反馈循环或某些非参数方法失效的未观测混杂类型时。
采用超出常规准则的方法,为在更具挑战性、更贴近实际的环境中进行因果推断带来了可能性。然而,这些高级策略伴随着注意事项:
因此,虽然这些方法扩展了我们的能力,但它们要求仔细考虑潜在假设,并更加关注敏感性分析(下一节会涉及),以评估结论对这些假设潜在违反的稳定性。系统地应用 do-演算或使用算法识别工具可以提供正式依据,但专业知识对于验证图结构的合理性和所需的识别假设仍然不可或缺。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•