分享自:

一种用于时间感知知识图补全的两阶段框架

期刊:Springer Nature Switzerland AGDOI:10.1007/978-3-030-60259-8_16

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:

主要作者与机构

该研究的主要作者包括Jiasheng Zhang、Yongpan Sheng、Zheng Wang和Jie Shao。他们分别来自贵州大学、重庆大学和电子科技大学等机构。该研究于2020年10月发表在Springer Nature Switzerland AG出版的会议论文集APWeb-WAIM 2020中,具体章节为第16章。

学术背景

该研究的主要科学领域是知识图谱(Knowledge Graph, KG)的补全任务,特别是针对时间感知知识图谱(Temporal-aware Knowledge Graph, TKG)的补全问题。知识图谱作为一种结构化的知识表示方式,广泛应用于信息抽取、语义搜索和问答系统等领域。然而,大规模的知识图谱通常是不完整的,因为其中的事实主要从非结构化数据中通过机器学习和信息抽取技术挖掘而来,而这些技术并不完美。因此,知识图谱补全(KG Completion)成为了一个长期存在但日益重要的研究任务。

传统的方法主要将知识图谱视为静态图,假设其中的事实是普遍成立的。然而,现实世界中的许多事实具有时效性,仅在特定时间段内有效。因此,研究时间感知知识图谱的补全问题具有重要意义。现有的方法主要关注建模时间顺序关系,但忽略了关系链中时间顺序关系的演化强度,并且缺乏对候选预测结果的进一步修正。为了解决这些问题,本研究提出了一种新颖的两阶段框架TKGFrame,旨在提高时间感知知识图谱补全任务的性能。

研究流程

TKGFrame框架包括两个主要模型:关系演化增强模型(Relation Evolving Enhanced Model)和优化模型(Refinement Model)。以下是详细的研究流程:

第一阶段:关系演化增强模型

该模型的目标是增强同一关系链中成对关系的演化强度表示,从而生成更准确的时间感知知识图谱嵌入(TKG Embeddings)。具体步骤如下: 1. 时间演化矩阵的引入:基于Jiang等人的工作,引入了一个改进的时间演化矩阵(Temporal Evolving Matrix)来增强同一关系链中成对关系的演化强度表示。例如,对于与同一人相关的关系链,时间顺序关系“wasbornin”需要比“graduatedfrom”更强的演化强度。 2. 优化问题的构建:将时间感知知识图谱嵌入学习问题构建为一个优化问题,使用时间感知正则化项来约束学习过程。具体来说,对于任何两个正训练四元组,如果它们的时间顺序关系是正序的,则其得分应低于逆序关系对的得分。 3. 损失函数的设计:设计了一个时间损失函数,用于控制正序和逆序关系对的绝对得分,并保留TransE模型的边际排序准则特性。

第二阶段:优化模型

在获得第一阶段生成的时间感知知识图谱嵌入后,优化模型的目标是通过解决一个约束优化问题来修正候选预测结果,从而进一步提高预测性能。具体步骤如下: 1. 整数线性规划(ILP)问题的构建:将候选预测结果的合理性度量问题构建为一个整数线性规划问题,使用二元决策变量表示每个候选四元组是否被保留。 2. 约束条件的引入:引入两类与时间相关的常识性约束:时间不重叠约束(Temporal Disjointness Constraint)和时间顺序约束(Temporal Ordering Constraint)。前者要求具有相同功能关系和相同头实体的两个事实的时间区间不重叠,后者要求某些时间关系必须按顺序发生。 3. ILP模型的求解:使用Python中的PuLP库求解ILP模型,以最小化候选四元组的总体得分,同时满足时间约束条件。

主要结果

研究在三个真实世界的数据集(YAGO11k、Wikidata12k和Wikidata11k)上进行了广泛的实验,验证了TKGFrame框架的有效性。以下是主要结果: 1. 实体预测任务:TKGFrame在所有数据集上均显著优于现有的最先进基线方法。具体来说,在YAGO11k、Wikidata12k和Wikidata11k数据集上,原始平均排名(MR)分别降低了6.8%、30.3%和14.8%,过滤后的命中率(Hit@10)分别提高了39.1%、7.0%和8.3%。 2. 关系预测任务:TKGFrame在关系预测任务中也表现出色,原始平均排名(MR)分别降低了14.4%、0%和3.7%,过滤后的命中率(Hit@1)分别提高了13.3%、3.5%和4.3%。

结论

TKGFrame框架通过关系演化增强模型和优化模型的有机结合,显著提高了时间感知知识图谱补全任务的性能。关系演化增强模型通过引入改进的时间演化矩阵,增强了同一关系链中成对关系的演化强度表示,从而生成了更准确的时间感知知识图谱嵌入。优化模型则通过解决约束优化问题,进一步修正了候选预测结果,提高了预测的准确性和可解释性。

研究亮点

  1. 新颖的两阶段框架:TKGFrame是第一个将关系演化增强模型和优化模型结合起来的框架,显著提高了时间感知知识图谱补全任务的性能。
  2. 改进的时间演化矩阵:通过引入改进的时间演化矩阵,增强了同一关系链中成对关系的演化强度表示,从而生成了更准确的时间感知知识图谱嵌入。
  3. 约束优化问题的应用:通过解决约束优化问题,进一步修正了候选预测结果,提高了预测的准确性和可解释性。

其他有价值的内容

研究团队已经公开了实验细节和模型的源代码,便于其他研究者复现和进一步研究。此外,研究还提出了未来的研究方向,包括考虑更多类型的辅助信息(如类型一致性信息和精确的文本信息)来增强时间敏感事实的表示,以及探索使用时间戳标签传播方法进一步挖掘时间顺序关系。

TKGFrame框架为时间感知知识图谱补全任务提供了一个强有力的工具,具有重要的科学价值和应用前景。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com