关键词:
知识表示
知识图谱补全
链接预测
关系模式
复杂关系
摘要:
知识图谱由谷歌提出并应用于其搜索引擎,极大增强了搜索引擎的语义搜索能力。近年来,在互联网海量数据的支撑下以及机器学习技术的提升,知识图谱得以迅速发展,并成功应用于问答系统、推荐系统等方向。常见的知识图谱包括Word Net、Free Base和YAGO等。如今构建的知识图谱规模日益庞大,然而,由于其大都由人工或半自动方式构建导致知识图谱并不完整,知识图谱补全愈发重要。知识图谱补全的一种重要方法是知识表示学习,通过将知识向量化表示,在向量空间内高效的计算以搜索潜在的实体或关系继而补全知识图谱。
现有的知识图谱表示工作主要对复杂关系与关系模式建模,然而,忽略了两者之间的紧耦合性。一种有效的知识表示学习方法应该能同时对复杂关系与关系模式进行表示,以增强其表示性能。基于此,本文提出一种基于复数空间内动态映射的知识表示学习模型(Knowledge Representation Learning via Complex Space Dynamic Mapping,KRLCSDM),该模型可同时表示复杂关系与关系模式。本文的主要研究内容如下:
(1)知识图谱中存在了大量的复杂关系(主要表现形式为一对一、一对多、多对一、多对多关系)以及关系模式(主要存在形式为对称关系模式8)、反对称关系模式(69)48))、逆关系模式49))、组合关系模式(88)),为同时表示两者,本文提出KRLCSDM模型。首先该模型将实体以及实体间关系表示为离散的复数矢量,其次,构造动态映射将离散的复数矢量聚簇为相近的矢量,用于表示实体间的复杂关系。然后,利用复数空间的旋转策略,以表示离散复数矢量之间的对称关系模式8)、逆关系模式49))、组合关系模式(88)。
(2)本文利用多个基准数据集进行链接预测实验,验证KRLCSDM的准确性。实验结果表明,KRLCSDM模型能有效进行缺失预测。特别地,相比Rotat E模型,在YAGO3-10数据集上KRLCSDM的平均排名提升18%,平均倒数排名提升5.2%,数据集中链接预测实体排在第一名的比例提升6.0%,实体排在前三名的比例提升4.9%,实体排在前十名的比例提升3.5%。通过可视化方式以及对数据集中复杂关系分类实验,表明KRLCSDM可有效建模关系模式和复杂关系。本文将KRLCSDM结合关系路径进行训练,实验表明在结合关系路径后,KRLCSDM表示更加准确。
(3)利用KRLCSDM训练后的向量,在关系丰富的数据集FB15k-237上进行进行规则挖掘。实验结果显示基于KRLCSDM的规则挖掘算法可挖掘到高质量以及合理的规则,侧面验证了KRLCSDM对组合关系模式(88)建模的准确性。