趋近智
从本质上讲,图是一种用于表示对象之间关系的结构。以社交网络为例,人是其中的对象,而他们之间的友谊则是关系。或者考虑一个分子,原子是对象,化学键则是关系。这种由对象和连接构成的结构是许多复杂系统的骨架,从交通网络到蛋白质相互作用图谱皆是如此。
在数学定义上,图 被定义为一个二元组 ,其中 是顶点(通常称为节点)的集合, 是表示节点对之间连接的边的集合。
让我们拆解一下在处理图数据时会遇到的主要组成部分。
节点是图中基本的实体。在社交网络图中,一个节点代表一个人。在网页图中,一个节点可以是一个单独的网页。
边是节点之间的连接。两个节点之间的边表示它们之间存在某种形式的关系。对于社交网络,边可能意味着两人是朋友。对于网页图,边可以表示从一个页面指向另一个页面的超链接。
一个包含五个节点(A, B, C, D, E)和四条连接边的简单图。
对于机器学习应用,仅靠图的结构通常是不够的。我们会用数据来丰富这个结构,这些数据被称为特征或属性。
并非所有图都是一样的。它们的性质各不相同,理解这些区别对于建立正确的模型非常有用。
在无向图中,边是双向的。如果节点 A 与节点 B 相连,那么 B 也与 A 相连。Facebook 的好友关系就是一个例子,这种关系是相互的。
在有向图中,边具有方向。从节点 A 到节点 B 的连接并不意味着从 B 到 A 也有连接。想想 Twitter,你可以“关注”某人,而对方不必回关。这些有向边通常用箭头表示。
无向关系是相互的,而有向关系具有特定的起点和终点。
在无权图中,所有边都被同等对待。它们的存在仅仅表示一种连接。相比之下,加权图为每条边分配一个数值权重,用以表示连接的强度或成本。例如,在航线图中,边权重可以代表两个城市之间的飞行距离或票价。
同构图是指所有节点和边都属于同一种类型的图。Cora 引用网络是一个常见的基准数据集,它是同构的:所有节点都是研究论文,所有边都是引用关系。
异构图包含不同类型的节点或边。以电子商务平台为例:你可能有“用户”、“商品”和“品牌”节点。边也可以是不同的类型,例如“用户-购买-商品”、“用户-评分-商品”以及“品牌-生产-商品”。这些图代表了更复杂的系统,需要专门的 GNN 架构来处理。
理解图的这些基本性质是应用机器学习的第一步。节点、边和特征构成的这种结构正是我们表示互连数据的方式,为我们在后续章节中构建专门的模型做好了准备。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造