趋近智
虽然前面章节主要关注现有图数据的分析和学习,但高级图机器学习 (machine learning)的一个重要方向是生成类似图的新图结构。图生成模型旨在从一组已观测的图中学习一个潜在的概率分布,然后从这个学到的分布中采样新的图。这项能力对于发现新颖的分子结构、模拟社交网络演变、生成合成图数据用于基准测试或数据增强,以及理解图形成的基本规律等任务都很重要。
与生成图像或文本相比,生成图具有独特的挑战。图是离散结构,通常具有可变数量的节点和边。此外,图的表示并非唯一;不同的邻接矩阵可以表示同一个图(排列不变性),这使得学习变得复杂。图神经网络 (neural network)在许多现代图生成模型中扮演核心角色,通过有效地捕捉图中复杂的结构依赖关系。
构建图生成模型存在几种模式,通常采用GNN作为核心组成部分:
序列式(自回归 (autoregressive))生成: 这类模型逐步生成图,通常是逐节点或逐边进行。在每个步骤中,模型决定是添加新节点、在现有节点间添加边,还是停止生成过程。
digraph G { rankdir=LR; node [shape=box, style=rounded, fontname="sans-serif", fillcolor="#e9ecef", style=filled]; edge [fontname="sans-serif"];
Start [label="开始生成"];
Step1 [label="生成节点1"];
Step2 [label="生成节点2\n(决定边1-2)"];
Step3 [label="生成节点3\n(决定边1-3, 2-3)"];
Stop [label="满足停止条件"];
GNN [shape=ellipse, label="GNN状态\n更新", fillcolor="#a5d8ff", style=filled];
Decision [shape=diamond, label="下一步动作?", fillcolor="#ffec99", style=filled];
Start -> GNN;
GNN -> Decision;
Decision -> Step1 [label="添加节点"];
Step1 -> GNN;
Decision -> Step2 [label="添加节点/边"];
Step2 -> GNN;
Decision -> Step3 [label="添加节点/边"];
Step3 -> GNN;
Decision -> Stop [label="停止"];
} ``` > 自回归图生成过程的高级流程,其中GNN在每次结构添加后更新状态。
图的变分自编码器(VAEs): VAEs提供了一个概率框架来学习潜在表示。对于图,VAEs包括:
图的生成对抗网络 (GAN)(GANs): GANs采用生成器和判别器之间的双人博弈。
digraph GAN { rankdir=LR; node [shape=box, style=rounded, fontname="sans-serif", fillcolor="#e9ecef", style=filled]; edge [fontname="sans-serif"];
Noise [label="随机噪声 (z)", shape=ellipse, fillcolor="#bac8ff", style=filled];
Generator [label="生成器 (G)\n(输出图)", fillcolor="#b2f2bb", style=filled];
FakeGraph [label="生成的图 (Ĝ)", shape=Mdiamond, fillcolor="#fcc2d7", style=filled];
RealGraph [label="真实图 (G)", shape=Mdiamond, fillcolor="#96f2d7", style=filled];
Discriminator [label="判别器 (D)\n(GNN分类器)", fillcolor="#ffd8a8", style=filled];
Decision [label="真实 / 虚假?", shape=circle, fillcolor="#ffec99", style=filled];
Noise -> Generator;
Generator -> FakeGraph;
RealGraph -> Discriminator;
FakeGraph -> Discriminator [style=dashed];
Discriminator -> Decision;
} ``` > 使用GAN进行图生成的对抗性设置。生成器创建图,判别器(一个GNN)尝试区分真实图和生成的图。
评估生成图的质量并非易事。常见的评估方法包括:
由GNN驱动的图生成模型已在以下方面得到应用:
图生成模型代表了GNN的一个高级应用,扩展了图数据可以实现的功能。尽管仍存在挑战,特别是在可扩展性、离散生成和评估方面,但通过计算生成真实且新颖图结构的能力,为各个科学和工业范畴带来了重要机会。理解这些技术使您不仅能够分析,还能创建复杂的关联数据。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•