这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
本研究的核心作者团队来自中国人民大学高瓴人工智能学院(Jinhao Jiang, Wayne Xin Zhao等)、中国人民大学信息学院(Kun Zhou)以及BOSS直聘的南贝壳实验室和职业科学实验室(Yang Song, Chen Zhu等)。研究成果发表于计算语言学领域顶级会议ACL 2025(Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics),收录于会议长论文集(Volume 1: Long Papers)。
研究领域:自然语言处理(NLP)与知识图谱(Knowledge Graph, KG)的交叉领域,聚焦于大语言模型(Large Language Models, LLMs)在复杂知识推理任务中的能力增强。
研究动机:尽管LLMs(如GPT系列)在多项NLP任务中表现优异,但其依赖参数化知识的特性导致其在多跳推理(multi-hop reasoning)和知识密集型任务中存在局限性。知识图谱(KG)以结构化三元组形式存储海量事实知识,可作为外部知识库补充LLMs。然而,现有方法存在两大缺陷:
1. 交互机制僵化:LLM与KG的交互流程多为预定义(如人工设计的多轮计划),难以灵活适应复杂任务需求;
2. 依赖闭源大模型:现有方法需调用ChatGPT、GPT-4等强LLM API,而蒸馏的推理计划可能无法适配小模型。
研究目标:提出KG-Agent框架,实现两大突破:
1. 自主决策:无需人工干预,LLM可主动制定推理决策;
2. 小模型高效推理:仅需70亿参数(如Llama2-7B)即可完成复杂推理,摆脱对闭源API的依赖。
为解决LLMs难以操作结构化数据的问题,研究团队设计了多功能工具箱,包含三类工具:
- 抽取工具(Extraction Tools):如get_relation(获取实体关联关系)、get_tail_entity(根据关系获取尾实体);
- 逻辑工具(Logic Tools):如count(实体计数)、intersect(实体集交集);
- 语义工具(Semantic Tools):如retrieve_relation(基于预训练模型的语义关系检索)。
get_relation(e)→get_tail_entity(e,r));KG-Agent框架包含四大组件:
- LLM规划器(Planner):基于知识记忆(Knowledge Memory)选择工具;
- KG执行器(Executor):执行工具调用并更新记忆;
- 迭代机制:循环“工具选择→记忆更新”直至推理完成。
示例流程:
> 问题:“C罗2011年效力的最后成立的球队是?”
> 1. 调用get_relation获取“C罗”关联关系(如“teams”);
> 2. 调用get_tail_entity获取球队实体;
> 3. 通过get_entity_by_constraint筛选“成立时间=2011”的球队;
> 4. 用argmax找出最晚成立的球队并返回答案。
科学价值:
1. 首个自主KG推理框架:实现小模型(7B)的复杂推理,突破闭源LLM依赖;
2. 方法论创新:通过代码化指令合成和工具箱设计,弥合LLMs与结构化数据间的鸿沟。
应用价值:
- 低成本部署:小模型+少量数据即可适配多领域KG(如医疗、金融);
- 灵活扩展:工具箱支持自定义工具,适配不同KG结构。
(报告总字数:约1600字)