分享自:

利用LLM和RAG的多模态临床信息知识图谱可解释疾病诊断框架

期刊:knowledge and information systemsDOI:10.1007/s10115-025-02465-8

学术研究报告:XLr-KGDD——基于多模态临床信息的LLM与RAG知识图谱可解释疾病诊断框架


一、作者与发表信息

本研究由印度德里大学计算机科学系的Punam BediShivani Dhiman及Keshav Mahavidyalaya学院的Anjali Thukral合作完成,发表于期刊Knowledge and Information Systems(2025年5月),标题为《XLr-KGDD: Leveraging LLM and RAG for Knowledge Graph-Based Explainable Disease Diagnosis Using Multimodal Clinical Information》。


二、学术背景

科学领域:本研究属于人工智能(AI)在医疗领域的应用,结合自然语言处理(NLP)、知识图谱(Knowledge Graph, KG)与大语言模型(Large Language Model, LLM)技术,聚焦于多模态临床数据的疾病诊断与解释生成

研究动机
1. 挑战:现有LLM在医疗诊断中面临三大问题:(1)多模态数据(如影像、文本、表格)的整合困难;(2)LLM的高内存与算力需求;(3)模型幻觉(hallucination)导致诊断不可靠。
2. 目标:提出XLr-KGDD框架,通过知识图谱结构化多模态数据,结合检索增强生成(Retrieval-Augmented Generation, RAG)生成符合医学指南的诊断解释,提升临床可信度。


三、研究流程与方法

1. 多模态数据到知识图谱的映射(A2K Mapper)

  • 输入数据:来自MIMIC-EYE数据集的多模态临床信息,包括胸部X光(DICOM格式)、放射报告(文本)、人口统计表(CSV)。
  • 关键技术
    • N2K Mapper:通过自然语言处理(NLP)技术(如命名实体识别NER)从文本中提取症状、疾病等实体,结合生物医学本体(Healthcare Ontology, HO)构建三元组(subject-predicate-object)。
    • CheXzero:基于自监督对比学习的深度学习模型,分析X光图像并提取病理特征(如肺水肿),映射为知识图谱节点。
  • 输出:患者知识图谱(Patient KG),整合文本、影像与表格数据。

2. 高效微调LLM(Q-FT组件)

  • 方法:采用QLoRA(Quantized Low-Rank Adaptation)技术,将LLM(Llama-3、Llama-2、Mistral)量化为4位精度,减少内存占用(如Llama-2 7B参数模型内存需求从14GB降至3.5GB)。
  • 输入:通过提示工程(Prompt Engineering)将Patient KG转换为诊断提示(Diagnosis Prompt)。
  • 实验设计:对比不同token长度(128/512)与训练轮次(2/5)对性能的影响。

3. 基于RAG的解释生成(REX组件)

  • 外部知识库:标准化医学指南(如美国心脏协会心衰指南)。
  • 流程
    • 使用递归文本分割器(RecursiveCharacterTextSplitter)将指南分块,生成768维嵌入向量(基于all-mpnet-base-v2模型)。
    • 通过最大边际相关性算法(Maximal Marginal Relevance)检索与诊断相关的文本块,输入Llama-2生成自然语言解释。

4. 实验验证

  • 数据集:MIMIC-EYE(含心衰CHF与尿路感染UTI病例)。
  • 评估指标:准确率、F1值、ROC曲线下面积(AUC-ROC)、PR曲线下面积(AUC-PR)。

四、主要结果

  1. 诊断性能

    • Llama-3在512 token长度与5轮训练下表现最优,CHF诊断的AUC-ROC达0.88,AUC-PR达0.91;UTI诊断的AUC-ROC为0.90。
    • 对比基线:优于Gemini模型(精确率0.97但召回率仅0.69)与GPT-3.5(F1值0.86)。
  2. 解释生成

    • 生成的解释引用医学指南(如“心率140次/分高于正常范围60-100”),经临床医生评估确认其相关性。
    • 解决LLM幻觉问题,如避免模糊表述(如“正常体温”误为“升高”)。
  3. 效率优化

    • QLoRA使Llama-3在Kaggle平台(16GB GPU)上可微调,内存需求降低75%。

五、结论与价值

  1. 科学价值

    • 首次将知识图谱、LLM微调与RAG结合,实现多模态临床数据的端到端诊断与解释。
    • 提出QLoRA在医疗LLM中的高效应用方案,为资源受限场景提供可行性。
  2. 应用价值

    • 提升AI诊断的透明性,助力医生信任建立;可扩展至其他疾病(如癌症、糖尿病)。

六、研究亮点

  1. 多模态整合:通过KG统一处理影像、文本、表格数据,突破传统LLM仅限文本输入的局限。
  2. 抗幻觉设计:RAG确保解释基于权威指南,而非LLM固有知识。
  3. 低资源适配:QLoRA技术使大规模LLM可在消费级GPU运行。

七、其他价值

  • 局限性:数据不平衡可能引入偏差;量化技术可能轻微降低模型性能。
  • 未来方向:优化数据平衡、探索更高精度量化方法(如8-bit)。

(报告字数:约1500字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com