分享自:

融合知识图谱与大模型的零件工艺设计知识问答

期刊:计算机技术与发展DOI:10.20165/j.cnki.issn1673-629x.2025.0056

《计算机技术与发展》期刊于2025年3月10日网络首发了题为《融合知识图谱与大模型的零件工艺设计知识问答》的研究论文,作者为田小贵、许建新和张振明,均来自西北工业大学机电学院。该研究旨在解决零件工艺设计领域中知识碎片化、结构化程度低的问题,提出了一种融合知识图谱(Knowledge Graph, KG)与大模型(Large Language Model, LLM)的知识问答方法,以辅助设计人员高效获取和应用工艺知识。

研究背景与目标

零件工艺设计是航空发动机等复杂零件制造中的关键环节,其设计质量依赖于大量工艺知识的支持。然而,当前制造企业积累的工艺数据碎片化严重,结构化程度低,导致设计人员难以高效获取和应用知识。知识问答(Question Answering, QA)是知识应用的重要方式,但现有的基于知识图谱的问答方法存在意图识别和系统泛化能力不足的问题,而大模型虽然具备强大的自然语言处理能力,但在专业领域中容易产生“幻觉”问题(即生成不准确或不符合事实的答案)。因此,本研究提出了一种融合知识图谱与大模型的知识问答方法,以航空发动机零件工艺为例,旨在实现知识的准确应用,辅助设计人员进行高效的工艺设计。

研究方法与流程

研究主要分为三个部分:零件工艺知识图谱构建、大模型技术架构设计以及知识问答系统的实现。

1. 零件工艺知识图谱构建

知识图谱是实现知识结构化表达的核心工具。本研究采用自底向上和自顶向下结合的构建方法,具体流程包括模式层设计、数据层构建、知识抽取、知识融合以及知识存储与更新。

  • 模式层设计:模式层是知识图谱的核心,定义了实体、关系和属性的规范。本研究从零件工艺设计需求出发,结合专家经验,采用自顶向下的方法构建了零件工艺信息模式层。
  • 数据层构建:数据层通过三元组形式表示知识,具体包括实体、关系和事实。本研究采用多策略知识抽取方法,从结构化、半结构化和非结构化数据中抽取知识。
    • 结构化与半结构化数据抽取:通过本体映射和正则表达式等方法,从工程数据库和工艺文件中抽取实体、关系和属性。
    • 非结构化数据抽取:采用基于BERT-BiLSTM-CRF(Bidirectional Long-Short Term Memory-Conditional Random Field)的深度学习模型进行实体识别,并通过LSTM(Long Short-Term Memory)架构进行关系抽取。
  • 知识融合:通过Jaccard相关系数计算实体相似度,对抽取的知识进行融合,确保知识图谱中领域知识的一致性。
  • 知识存储与更新:采用Neo4j图数据库存储知识图谱,并通过Cypher语言进行知识查询和更新。

2. 大模型技术架构

本研究选用清华大学研发的ChatGLM3-6B-32K大模型,并通过提示学习(Prompt Learning)方法对其进行微调,以增强其在零件工艺设计领域的适用性。

  • 大模型微调:采用离散提示与连续提示结合的方法,将领域知识注入大模型,提升其意图识别和复杂问题处理能力。
    • 离散提示:通过特定工艺词汇(如“铣削加工”、“公差范围”)触发大模型调用知识。
    • 连续提示:采用P-tuning方法,通过虚拟标记嵌入模型,帮助模型理解领域知识的复杂语义和逻辑。

3. 知识问答系统实现

本研究设计了基于知识图谱与大模型融合的知识问答系统,具体流程包括问答信息识别与处理、专业领域知识问答以及知识转化输出。

  • 问答信息识别与处理:通过微调后的大模型识别用户意图,并结合提示示例生成Cypher检索语句,从知识图谱中获取专业知识。
  • 专业领域知识问答:采用两种问答方式:一是有专业知识注入的问答,从图谱中获取知识并注入大模型,生成专业回答;二是仅依赖大模型的问答,生成具有参考价值的经验信息。
  • 知识转化输出:通过提示将结构化的知识转化为易读的自然语言形式,供设计人员参考。

研究结果与结论

研究表明,融合知识图谱与大模型的知识问答方法能够生成更符合领域特色的专业问答结果,且问答知识具备可追溯性。与基于大模型和基于知识图谱的问答方法相比,本方法在意图识别、系统泛化能力和问答准确性方面均有显著提升。具体而言: - 知识图谱的优势:知识图谱实现了多源异构数据的结构化表达,提供了丰富的专业领域知识。 - 大模型的优势:微调后的大模型具备工艺设计领域专家级别的问题处理能力,能够结合专业知识生成复杂问题的回答。 - 融合效果:两者协同应用,克服了知识图谱问答意图识别与系统泛化能力不足的问题,同时缓解了大模型的“幻觉”问题,为零件工艺设计提供了更高质量的问答服务。

研究亮点与价值

本研究的亮点在于: 1. 创新性方法:首次提出融合知识图谱与大模型的知识问答方法,有效解决了零件工艺设计领域知识应用的难题。 2. 高效知识管理:通过知识图谱实现了多源异构数据的结构化表达,便于知识的维护与更新。 3. 专业问答能力:微调后的大模型具备领域专家级别的问题处理能力,能够生成符合设计需求的专业回答。 4. 可追溯性:问答结果可以从知识图谱中溯源,增强了问答的可信度。

该研究为零件工艺设计领域的知识应用提供了系统性解决方案,具有重要的科学价值和应用价值。它不仅提升了工艺设计的质量和效率,还为其他知识密集型领域提供了可借鉴的研究思路。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com