关键词:
图表示学习
进化算法
图生成对抗网络
图神经网络
摘要:
图表示学习是一种分析与处理图数据的重要方法,该方法利用图中节点和边所构建的关系网络提高数据的表征能力,进而学习最优的图结构和相应的图表示。尽管图表示学习在图数据处理方面具有重要作用,但由于图数据的复杂性致使其面临着一些挑战。首先,大多数图表示学习模型直接学习现实世界中的图数据,很少考虑能否学到图数据的有效分布,这会使其生成图质量低,生成的图在多样性上失衡从而不符合图数据的结构和特征,导致模式崩塌。其次,图表示学习模型在学习存在异常边图数据的过程中,容易过度拟合图数据训练中的噪声从而降低模型的泛化能力。另外,存在异常边的图数据严重扰乱图的原始结构,进而影响图表示学习模型的下游任务性能,突显其鲁棒性较弱的问题。进化算法利用变异操作不断更新更好的图结构,使模型学习到更多的图数据分布,避免模型陷入单一的模式并克服模式崩塌问题。进化算法使用适应性评价选择优异个体,使模型更好地学习到图数据的分布特征,提高模型泛化能力与鲁棒性。基于进化算法的图表示学习方法及其应用研究,具有深刻的理论价值和广泛的实际应用前景。
本文针对图表示学习优化问题开展深入研究,主要研究内容如下:
(1)针对图生成对抗网络模型在训练过程中易发生模式崩塌的问题,本文提出基于进化算法的图生成对抗网络模型。首先,生成器接受随机噪声作为输入,通过不同的变异函数生成不同的图个体,每种图个体对应不同的图数据分布。然后,鉴别器接受真实数据分布和生成器生成的数据分布作为输入,利用适应度函数对生成器生成的图个体做出适应性评估,适应度好的个体能够被保留下来用于下一阶段的训练,适应性差的个体将被淘汰。鉴别器和生成器交替训练生成图数据,生成器可以更全面地学习图数据分布,避免陷入模式崩塌并提高生成器生成高质量图数据的能力。本文在多个数据集上实验并与多种基线方法进行比较,实验验证了该模型具有良好的分类、预测性能与图推荐能力。
(2)针对属性图神经网络模型训练存在异常边的图数据时存在过拟合问题,本文提出基于进化算法的属性图神经网络模型。首先,该模型利用范数最小化和拉普拉斯矩阵归一化保持被异常边所影响的图具备低秩、稀疏和特征平滑属性。其次,该模型在图重建的过程中使用进化算法生成不同的图个体。然后,该模型使用适应性函数对不同的图个体做出评价并进行选择,适应性好的图个体会被保留下来共同学习图神经网络参数和干净图共同训练神经网络模型处理下游任务。本文在多个数据集上与多种基线方法进行了节点分类实验与比较,验证了该模型具有良好的分类性能。
(3)针对异常边的存在导致图神经网络鲁棒性较弱的问题,本文提出基于节点重要性估计的进化算法图神经网络方法。首先被异常边所影响的图通过邻居节点重要性估计删除异常边并逐层更新节点嵌入表示,得到新的图结构。随后该图结构的邻接矩阵通过变异函数再次产生新的不同邻接矩阵,这些新矩阵在视图估计器中被重新估计为新的图。然后,这些图通过质量评估得到不同的质量得分,得分最优的图被保留下来用于图神经网络下游任务的训练,有效提升图神经网络模型的鲁棒性。本实验在多个数据集上与多种基线方法进行对比,证明了该模型具备良好的分类性能。
本文的最后对研究内容进行了总结,并对优化进化算法与其他图表示学习优化方法做出了展望。