关键词:
网络表示学习
深度学习
异质信息网络
属性网络
自监督学习
摘要:
现实世界中的复杂系统通常可以建模为网络的形式,如社交网络、交通网络、引文网络等等。网络在生活中是无处不在的,对网络数据进行分析在各个学科及应用领域中都具有非常重要的意义。近些年,网络表示学习技术逐渐成为网络数据分析方向的一个研究热点。网络表示学习又名网络嵌入,它的本质是将网络映射到一个低维稠密的向量表示空间,同时又能够最大化地保存原始网络的拓扑结构及其属性特征等信息。网络表示学习为大数据的处理和挖掘提供了一种高效的网络表示形式,即将网络化的数据转化为向量,使其能够方便地应用到后续的节点分类、节点聚类、链路预测等多种下游机器学习任务中。然而,随着数字经济时代下社会的发展,真实世界中的网络逐渐呈现出大规模性、异质性等特征,如何对这样的庞大的复杂网络进行高效地处理及分析成为一个亟待解决的问题。尽管现有的网络表示学习方法在处理各种网络分析任务上已具有一定优势,但仍然还存在一些值得深入研究的地方。首先,现实世界中的网络是由不同对象及复杂的关系构成的异质信息网络,如何在进行异质信息网络表示学习的同时,对网络结构和复杂语义之间的潜在关联展开探索是待深入研究的难题。其次,除了网络本身的拓扑结构外,网络中的节点还具有各自特有丰富的外部属性信息,如何在保存网络结构特征同时有效融入这些非线性外部属性信息到节点表示学习过程是属性网络表示学习研究的关键。最后,现有的许多表示学习方法都遵循的一个共同前提是原始网络是可靠的,而通常这种可靠性在很大程度上无法得到绝对保证。为此,针对以上三个方面的问题,本文围绕保存网络语义的异质信息网络表示学习,探索了外部信息与网络拓扑之间潜在关联的属性网络表示学习,以及在不可靠原始网络上进行的基于结构增强的自监督异质网络表示学习,展开了基于深度学习的网络表示学习方法研究。本文完成的主要工作如下:(1)针对单视图网络难以描述异质信息网络中节点之间的复杂关系,设计了一种基于多视图的异质信息网络表示学习方法。首先基于元路径得到的网络语义将原始的复杂异质信息网络进行拆分,并构建多视图语义网络。在生成的多视图网络之上,通过提出的单视图网络语义保存和增强的视图协作机制建模网络结构与语义之间的联系。最终结合注意力机制对各个视图表示进行加权融合得到节点表示。(2)针对节点外部属性信息与网络拓扑之间的潜在非线性关联,设计了一种联合深度网络结构注意和属性注意的属性网络表示学习方法。首先,利用网络邻接矩阵和属性相似度矩阵探索了一种结合节点属性保存网络高阶信息的融合矩阵。其次,为了捕获到网络结构和属性之间的高度非线性关联,设计了一个基于深度属性注意的结构嵌入和基于深度结构注意的属性嵌入模块,两个模块在训练的时候分别能够表现出对结构和属性特征的学习偏好。最后通过联合两个模块的隐层输出作为最终的节点表示结果。(3)针对真实网络数据的可靠性难以得到保证,通常伴有噪声和不完整的特点,设计了一种基于结构和语义感知的自监督异质信息网络表示学习方法。首先,对于可能包含噪声和不完整的原始异质信息网络,采用一种基于节点属性的结构增强方法进行处理。然后,一方面通过节点级注意和类型级注意对网络模式结构进行了探索,实现节点局部邻域结构的保存。另一方面用深度神经网络探索了保存网络高阶语义的交换矩阵。通过以上两个方面的处理,最后设计了一个特定自监督学习优化损失函数,以从数据本身挖掘监督信号的方式对模型进行训练并得到最终节点表示。最后,在多个不同的数据集上,对上述提出的表示学习方法进行了实验验证,并与现有的网络表示学习方法进行了比较。实验结果论证了提出的方法在链路预测、节点分类等多个网络分析任务上的有效性。