关键词:
知识表示学习
知识图谱
深度嵌入
链接预测
三元组分类
摘要:
知识表示学习是人工智能研究中的一个重要方向,涵盖了语义、逻辑、推理等多个领域,其目标是将自然语言文本或其他形式的知识转换为机器可识别的形式,以便机器能够利用这些知识来进行推理、决策和问题解答等任务。本文致力于研究知识图谱表示学习的相关嵌入模型,这些模型可以将抽取的知识通过合理的嵌入方式,表示为简洁高效的向量形式,以便于计算机进行处理和分析,同时与知识图谱进行融合,提高知识图谱的表达能力和推理能力。基于翻译的知识图谱表示学习是知识表示学习领域中备受关注的研究方向,其原理是将知识图谱中的实体和关系表示为低维向量,并通过向量之间的几何变换来衡量两者之间的语义相似度和关联程度。然而,大多数模型是基于现有事实直接进行嵌入的,忽略了不同类型对象的差异,同时对于嵌入向量的处理也较为简单,导致向量的表现能力不足。而且,大多数模型也存在无法处理多种复杂关系的短板。本文对知识图谱表示学习方法进行了全面分析,针对现有的表示模型存在的问题,提出以下两种解决方案,并对知识表示模型的相关应用进行探索:(1)现有的基于平移距离的嵌入模型在独立空间中建模实体与关系时,只考虑了关系的不同类型,忽视了实体类型,同时存在无法高效推理反向关系的短板。针对上述问题,本文提出了一种基于实体关系映射矩阵的多模式深度嵌入知识表示模型。在该模型中,首先在考虑多种关系类型的基础上,利用实体关系映射矩阵加入了对于实体类型的衡量;然后引入多模式深度嵌入概念,同时将正向平移几何距离模型、逆向平移几何距离模型和对称关系模型相融合,从而消除了处理反向关系时的缺陷,提高了对称关系的处理效率。实验结果表明,该模型在推理缺失信息方面的能力有了显著提高,并且在处理复杂关系模式方面的能力也有了明显增强,相较于其他的基线模型,该模型具有显著的优势。(2)现有的基于旋转的嵌入模型将实体和关系映射到复数向量空间时,通常会导致复数空间中的实体嵌入向量之间缺少联系,而且嵌入向量表现力不足、实体和关系的旋转灵活度不高。针对上述问题,本文提出了一种基于深度卷积四元数的反向关系旋转嵌入知识表示模型。在该模型中,首先利用四元数扩展复数向量空间,引入表现力更强的超复数表示;然后使用不同的嵌入生成类来为头实体和尾实体生成嵌入向量,在将关系定义为空间中头实体到尾实体旋转的基础上,再引入一个反向关系向量,增强头实体和尾实体之间的关联性;最后,将四元数嵌入使用卷积神经网络进行深度处理,从而提高模型链接预测准确性。实验结果表明,相比于其他基线模型,该模型能够更加合理的表示实体与关系,并能够对复杂关系模式进行有效建模与推理,提升了知识表示的有效性。(3)针对医疗领域中知识表示模型的应用进行了研究。采用本文提出的基于实体关系映射矩阵的多模式深度嵌入模型与基于深度卷积四元数的反向关系旋转嵌入模型,并结合社交平台提取的相关医学研究成果数据集进行了实验,旨在探索两种知识表示模型在链接预测最新医疗研究成果方面的有效性。实验结果表明,本文提出的两种知识表示模型在医学研究成果的链接预测任务中都有出色的表现。因此,在社交平台上利用两种知识表示模型向医生预测推送最新的医学研究成果具有明显的优势。