本文由Yonghong Chen(扬州协同创新研究院有限公司)、Hao Li与Han Li(河海大学计算机与信息学院)、Wenhao Liu(扬州协同创新研究院)、Yirui Wu与Qian Huang(河海大学计算机与信息学院)、Shaohua Wan(电子科技大学深圳研究院)共同撰写,于2022年11月22日发表在期刊《Journal of Sensor and Actuator Networks》(简称JSAN)上,标题为《An Overview of Knowledge Graph Reasoning: Key Technologies and Applications》。该论文属于类型b——一篇系统性综述,全面梳理了知识图谱推理(Knowledge Graph Reasoning, KGR)的核心技术与应用进展。
知识图谱(Knowledge Graph, KG)作为结构化知识表达的重要形式,在互联网数据爆炸的背景下,成为组织、计算和分析海量知识的关键工具。知识图谱推理旨在通过已有知识推导新知识或识别错误知识,其技术多样性与图谱的表达灵活性密切相关。本文围绕知识图谱推理的四大方法(基于规则、分布式表示、神经网络和混合推理),系统总结了近年来的研究进展,并探讨了未来方向。
论文将知识图谱推理方法分为四类:
- 基于规则的推理(Symbolic-based Reasoning):
依赖一阶谓词逻辑或描述逻辑,典型方法包括ILP(Inductive Logic Programming,归纳逻辑编程)和AMIE(Association Rule Mining under Incomplete Evidence,不完全证据下的关联规则挖掘)。AMIE通过三种操作(悬挂边、实例边和闭合边)扩展规则体,学习高置信度规则。优势在于解释性强,但搜索空间大且规则覆盖率低。
*证据*:AMIE在Freebase数据集上验证了规则自动发现的可行性,但生成规则对预测效果的提升有限(文献[31])。
基于分布式表示的推理(Embedding-based Reasoning):
核心是将符号表示映射到向量空间,通过几何运算(如平移或旋转)捕捉实体与关系的隐含关联。典型模型包括TransE(Translating Embedding,平移嵌入)、TransR(分空间投影)和RESCAL(三阶张量分解)。TransE提出“头实体+关系≈尾实体”的假设,适用于一对一关系,但难以处理多对多关系。
*证据*:TransR在链接预测任务中优于TransE,因其将实体与关系映射到独立空间(文献[60])。
基于神经网络的推理(Neural Network-based Reasoning):
利用神经网络强大的表达能力,如NTN(Neural Tensor Network,神经张量网络)通过双线性层直接关联实体向量计算关系得分;R-GCN(Relational Graph Convolutional Network,关系图卷积网络)引入关系特定的变换,适用于多关系图谱。
*证据*:R-GCN在实体分类和关系预测任务中通过权重共享减少参数爆炸(文献[34])。
混合推理(Mixed Reasoning):
结合符号逻辑、嵌入学习和神经网络的互补优势。例如,Neural-LP(神经逻辑编程)将规则学习与LSTM结合,实现可微分的多步推理;RULE(Rule-Guided Embedding)通过迭代输入规则约束表示学习。
*证据*:Neural-LP在WN18和FB15k数据集的实体预测任务中,Top 10准确率分别达99.8%和91.6%(文献[35])。
论文详细梳理了知识图谱构建的三大技术支柱:
- 知识表示(Knowledge Representation):
早期采用RDF、OWL等语义网标准语言,现代方法转向低维稠密向量(如TransE)。Freebase和Wikidata的专有框架支持复杂结构,但需通过嵌入技术(如PTranse考虑路径信息)解决语义计算问题。
*证据*:PTranse通过路径嵌入提升关系推理能力(文献[41])。
知识抽取(Knowledge Extraction):
包括命名实体识别(NER)、关系抽取和事件抽取。深度学习方法(如BiLSTM-CRF)取代传统规则或统计模型,BERT和ERNIE通过预训练提升语义表征能力。
*证据*:BERT在NER任务中无需手工特征,实现端到端学习(文献[46])。
知识融合(Knowledge Fusion):
涉及实体链接(Entity Linking)与知识合并。例如,Wu等[56]使用两阶段嵌入对齐实体,Zhu等[59]通过联合嵌入实现跨图谱实体对齐。
论文列举了知识图谱推理的四大应用领域:
- 无线通信网络(WCN):
通过构建基站知识图谱,动态管理网络参数,解决传统关系数据库的静态性缺陷(文献[7])。
- 智能问答(QA):
R-GCN建模对话结构,TransE结合搜索技术实现基于嵌入的问答(文献[34,28])。
- 推荐系统:
KGAT(Knowledge Graph Attention Network)融合TransR与注意力机制,挖掘用户-商品潜在关系(文献[73])。
- 个性化搜索:
将用户-文档交互建模为知识图谱,利用TransE推理个性化结果(文献[28])。
该论文为研究者提供了知识图谱推理的技术全景,并指出跨方法融合与动态推理是突破当前瓶颈的关键路径。