趋近智
要将机器学习 (machine learning)模型应用于图数据,我们首先需要将节点和边的抽象结构转换为算法可以处理的数值格式。正如我们将图像表示为像素值网格,或将文本表示为数值向量 (vector)序列一样,我们需要一种标准的方法来对图进行编码。这主要通过两个矩阵来实现:捕获图拓扑结构的邻接矩阵,以及保存每个节点属性的特征矩阵。
表示图中连接关系最直接的方法是使用邻接矩阵,通常记为 。对于一个拥有 个节点的图,邻接矩阵是一个大小为 的方阵。
填充该矩阵的规则很简单。对于无权图,第 行第 列的元素 为:
按照惯例,节点通常不被视为与自身相连,因此对角线元素 通常设置为 0。
以下面这个包含四个人的简单社交网络图为例。
一个包含四个节点(0-3)的无向图,节点代表个人,边代表友谊关系。
该 4 节点图对应的邻接矩阵 为:
请注意该矩阵的几个特性:
对于边具有不同强度(如交互频率)的有权图,矩阵条目 将包含边的权重 (weight),而不仅仅是 1。
在大多数应用中,节点本身包含有用的信息。社交网络中的用户拥有个人资料(年龄、位置),生物网络中的蛋白质具有化学性质。这些信息存储在节点特征矩阵中,通常记为 。
对于一个拥有 个节点且每个节点有 个特征的图,特征矩阵 的维度为 。矩阵的每一行 对应于节点 ,并包含其特征向量 (vector)。
让我们为示例图中的每个人分配两个特征:年龄和所属组别(编码为 0 或 1)。
这些信息可以组织成一个 的特征矩阵 :
第一列代表年龄,第二列代表组别。该矩阵在学习开始前提供了每个节点的初始状态或属性。图神经网络 (neural network)的目标通常是利用这些特征以及图结构,学习出更具表达力的节点表示。
邻接矩阵 和节点特征矩阵 共同构成了一个带属性图的完整数值表示。它们是几乎所有图神经网络 (neural network)模型的核心输入。
图神经网络的核心操作(我们将在下一章中分析)涉及使用由 定义的结构来传播和转换 中包含的信息。这使得每个节点都能从其邻居那里学习,并整合自身属性和局部网络背景信息。
另外值得注意的是,在某些图中,边也可能具有特征。例如在分子图中,代表化学键的边可以有不同的类型(单键、双键)。这些信息通常存储在单独的边特征张量中。目前,我们将专注于 和 这一基础组合。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•