趋近智
图卷积网络 (GCN) 是一种基础架构,它为消息传递框架提供了一种具体且高效的实现方式。它借鉴了计算机视觉中的卷积操作,并将其改进以适应图的非规则、非欧几里得结构。CNN 卷积核在固定的像素网格上滑动,而 GCN 层则处理来自节点局部图邻域的信息。
GCN 层的主要操作可以用一个简洁的传播规则来表示,该规则能够同时更新图中所有节点的特征。
对于 GCN 层,从当前层输入特征 生成下一层输出特征 的过程由以下公式定义:
这个方程起初看起来可能很复杂,但每个部分都有其明确且易于理解的作用。我们逐个变量进行分析:
[输入特征数, 输出特征数]。ReLU),应用于每个元素。与其他神经网络一样,它引入了非线性,使模型能够学习更复杂的联系。GCN 公式中最特别的部分是 。这一部分负责核心的图卷积操作,是根据图的结构构建的:
:这是图的邻接矩阵 加上单位矩阵 后的结果,即添加了自环。添加自环是一个简单但操作。它确保了当节点聚合邻居特征时,也会包含自己上一层的特征信息。如果没有这一步,节点自身的表征在更新时会被忽略。
:这是 的对角度矩阵。每个对角线元素 包含节点 的度(包括其自环)。所有非对角线元素均为零。
对称归一化 (normalization):完整项 对邻接矩阵进行了对称归一化。这一步对于稳定训练非常。如果只乘以 ,则会简单地累加邻居节点的特征向量 (vector)。然而,这会导致度数非常高或非常低的节点出现问题。高度数节点的嵌入可能会呈指数级增长,而低度数节点的嵌入可能会缩小,从而导致梯度不稳定。通过度矩阵 进行归一化,可以有效地对邻居消息取平均,防止节点嵌入的规模受节点度数的影响而产生偏差。
下图说明了单个节点 的 GCN 更新过程。它的新特征 是通过聚合其自身之前的特征 以及邻居特征 、 和 计算得出的。
节点 的更新涉及对第 层局部邻域特征的归一化求和,随后进行线性变换和非线性激活,从而产生其在第 层的新特征。
GCN 公式提供了前一章讨论的 AGGREGATE(聚合)和 UPDATE(更新)步骤的一个具体实例。GCN 层的优点在于它将这些步骤合并为一个高效的矩阵乘法。
聚合: 乘以 执行了聚合操作。对于每个节点,此操作收集其邻居(及其自身)的特征,计算归一化 (normalization)总和,并生成聚合消息。这是一种加权平均,权重 (weight)由源节点和目标节点的度数决定。
更新: 随后乘以权重矩阵 并应用激活函数 (activation function) 构成了更新步骤。此步骤将聚合的消息转换为节点在下一层的新嵌入 (embedding)。
通用的消息传递方案通常将这些描述为独立的函数,而 GCN 则将它们合并为一次操作。这使其非常高效,尤其是在使用稀疏矩阵乘法库实现时。
由于其简单性和有效性,GCN 被广泛用作许多图学习任务的起点。
优势:
局限性:
尽管存在这些局限性,图卷积网络仍是 GNN 领域的常用模型。它的公式为从抽象的消息传递想法到用于图上学习的实用算法提供了清晰的桥梁。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•