分享自:

基于知识增强的网络健康信息多维评估智能体研究

期刊:医学信息学杂志DOI:10.3969/j.issn.1673-6036.2025.11.002

针对网络健康信息良莠不齐、现有评估方法存在局限的问题,本研究设计并构建了一种基于知识增强和大型语言模型(Large Language Model,LLM)的网络健康信息多维评估智能体。该研究由江西中医药大学智能医学与信息工程学院的熊建英、熊科云、杨洋共同完成,并发表在《医学信息学杂志》2025年第46卷第11期。

一、研究的学术背景与目的

随着互联网的普及,海量的健康养生信息深刻影响着公众的健康观念和行为决策。然而,其中充斥着大量通过夸大疗效、隐匿风险等手段误导用户的虚假或低质信息,构成了显著的公共健康风险。尽管国家已出台相关方案强调健康内容监管与公众素养提升,但现有治理手段面临严峻挑战。静态辟谣平台更新缓慢,难以应对信息海量动态增长;基于机器学习或深度学习的分类模型虽在识别上有一定效果,但其“真/假”二元的简单分类模式无法提供批判性解释,也无法适配用户的个体健康状况;而强大的LLM技术虽具备优秀的语义理解能力,但在缺乏领域知识的情况下,容易产生“幻觉”(Hallucination),输出错误或过于普适、难以理解的内容。因此,将健康信息鉴别从表层的“语言分类”升级为基于证据的深度“风险评估”成为迫切需求。

本研究旨在解决上述问题。其目标在于设计并实现一个融合领域知识库与用户特征的智能体框架。该框架的核心意义是模拟医学专家的评估行为,通过整合权威医学证据和用户个性化信息,为每一条待评估的健康信息提供多维、可解释、个性化的评估报告,从而不仅提升网络健康信息评估的准确性,也增强其作为决策支持工具的有效性,最终助力于公众健康信息素养的提升。

二、详细的研究工作流程与方法

本研究是一项系统性的框架设计与原型验证工作,其核心流程围绕智能体的构建与评估展开,主要包括以下几个关键步骤:

步骤一:构建医学领域知识库。 这是整个智能体框架得以实现证据支持决策的基础。研究者并非使用单一或未经验证的数据源,而是精心构建了一个遵循权威性、时效性、结构化原则的双层知识体系。其知识来源分为三层:1) 核心层:包括中华医学会临床指南、美国国立临床诊疗指南数据库等权威机构发布的静态标准知识;2) 官方数据层:涵盖国家药食同源目录、世界卫生组织事实清单等;3) 学术文献层:包括高质量教科书和权威期刊的疾病机制综述。针对这些异构数据,研究采用了分类存储策略:将实体关系知识(如药物相互作用)构建为知识图谱存储于图数据库;将文本证据知识(如指南条文)进行向量嵌入后存入向量库以便语义检索;而原始文档(如PDF指南)则完整存入文档库用于溯源引用。知识库的更新机制结合了自动化爬虫(扫描官网、期刊目录触发增量更新)与医学专家组定期人工审核,确保了知识的持续更新与质量。

步骤二:设计与构建智能体框架。 研究者以LLM为核心引擎,构建了一个包含观察、思考、行动、记忆四大模块的智能体。观察模块负责接收用户提交的多模态信息(文本、链接、图片、视频)并转化为文本,同时引导用户提供年龄、基础疾病等个性化信息。思考模块是核心,负责信息解析、知识检索与匹配、风险评估等推理任务。行动模块通过调用各种工具(如知识库查询接口、互联网搜索引擎)来执行思考模块的指令。记忆模块则存储用户档案和对话历史,以实现持续的个性化交互。智能体的具体工作流程分为三层:1) 输入层:用户通过小程序、App等接入,系统识别信息类型并引导补充用户个人信息。2) 处理层:这是核心评估环节。首先,LLM对用户输入的待验证信息进行解构,抽取出核心“主张”、“证据”与医学“实体”。接着,启动知识检索增强机制:LLM先将用户口语化查询(如“血糖高”)优化为专业术语(如“糖尿病前期”);检索时遵循“本地权威知识库优先”原则,若未找到相关证据,则触发互联网检索,并实施来源分级控制(学术数据库 > 政府网站 > 三甲医院官网 > 科普平台),同时自动屏蔽自媒体营销号等低质来源;最后对检索结果进行验证,要求核心论点与原始查询高度相似,且证据需来自不少于两个独立权威信息源。获取证据后,LLM基于预设的提示词,生成结构化的四维评估内容。3) 输出层:将生成的评估内容以分层、可视化的方式展示给用户,形成一份个性化的信息评估解释报告。

步骤三:开发智能体原型并进行案例实证分析。 为了验证所提出框架的可行性与优势,研究者在Coze平台上实现了该智能体的工作流原型。用户可以通过界面输入待验证信息(例如“每日饮用大量芹菜汁可以根治糖尿病”)。系统的工作流依次为:语义解析 → 知识检索 → 决策分析 → 报告生成。生成的报告严格遵循“四维评估”模型进行结构化输出:1) 可信解释维度:用通俗化类比辅助专业解释,提高可读性。2) 风险提示维度:提供风险等级标签和具体的医疗风险说明。3) 证据引用维度:明确标注所引用证据的等级和具体来源(如临床指南名称、文献标题)。4) 个性化建议维度:结合用户画像,给出包含“推荐、禁止、注意”的行动导向建议。可视化展示时,采用不同色彩和信息分层来区分这四个维度的内容。

三、研究的主要结果

通过构建上述框架并进行原型验证,本研究取得了以下具体结果:

  1. 成功构建了一个集成化的智能体框架与知识库系统:研究不仅提出了理论框架,还具体实现了包含双层知识体系、分类存储方案及“爬虫+专家审核”更新机制的知识库。同时,设计并实现了以LLM为调度中心,集成多模态解析、知识检索增强、个性化推理与结构化输出的完整智能体工作流程。这证明了将领域知识、检索增强生成(Retrieval-Augmented Generation, RAG)技术与智能体能力相结合应用于健康信息评估的技术可行性。

  2. 实现了从“分类”到“多维评估”的范式转变:以“芹菜汁根治糖尿病”为例的对比分析结果清晰地展示了本方法的优势。传统文本分类模型仅能输出“虚假信息”的单一标签,无法提供任何解释或建议。通用LLM直接提问后,其输出为一段缺乏证据引用、可能包含“幻觉”且完全普适的概括性文字。而本研究构建的智能体,则能生成一份结构清晰的报告:在解释维度说明糖尿病不可“根治”及芹菜汁的实际作用;在风险维度提示过度饮用可能存在的电解质紊乱风险;在证据维度引用多个权威医学资料指出当前证据不足以支持其“根治”主张;在建议维度,若用户是糖尿病患者,会明确建议其遵循医嘱而非依赖此偏方。这四项内容均紧密依托于检索到的权威证据。

  3. 验证了框架在多个评估指标上的优越性:通过定性对比,本研究总结出智能体在四个关键指标上显著优于传统方法:评估维度丰富性(四维 vs. 单一标签或普适文本)、证据引用程度(100%主动提供可溯源证据 vs. 不提供或来源不可考)、结果可读性(层次分明、通俗化解释 vs. 专业术语堆砌或结构混乱)以及个性化支持(主动结合用户画像 vs. 无或非主动)。这些结果直接支持了研究关于提升评估准确性和决策支持有效性的结论。

四、研究的结论与价值

本研究得出结论:所提出的基于知识增强和LLM的智能体框架,能够有效将网络健康信息评估从传统的“文本分类”升级为“医学证据支持下的个性化风险评估”。该框架通过集成多模态解析、知识检索增强与四维评估反馈,构建了一个从信息输入到可信度验证的闭环流程。

其科学价值在于为健康信息学领域提供了一种融合前沿人工智能技术与领域专业知识的新研究范式。它不再是简单的算法优化,而是构建了一个模拟专家决策过程的复杂系统,强调了证据链、可解释性和用户中心设计在健康信息处理中的核心地位。

其应用价值非常显著:首先,它为公众提供了一个潜在的、实时可靠的健康信息“过滤镜”和“解读器”,有助于提升公众的健康信息素养和批判性思维能力。其次,它为监管部门提供了健康信息自动化、智能化治理的新思路与技术参考。原型实践表明,该方法在提升信息可读性、增强决策支持以及改善用户风险认知方面具有明显优势。

五、研究的亮点与特色

本研究的亮点主要体现在以下几个方面: 1. 研究视角的创新性:首次将“健康信息评估”系统地定义为一个需要结合权威领域知识、检索增强、用户画像和多维度解释的复杂决策支持任务,而非简单的自然语言处理分类问题。 2. 技术框架的集成性与闭环设计:创造性地将LLM智能体、结构化医学知识库、RAG技术以及人机交互设计融为一体,形成了“输入-处理-输出”的完整闭环,特别是“四维评估模型”的设计,全面覆盖了用户理解信息所需的核心要素。 3. 对“证据”和“个性化”的高度重视:研究核心围绕如何为LLM注入高质量、结构化的医学证据,并设计了严格的检索优先级和验证机制来保证证据质量。同时,将用户特征作为风险评估的关键变量,实现了从普适性判断到个性化风险评估的跨越。 4. 原型系统的可行性与验证充分性:研究不仅停留在理论框架,还通过实际平台开发了工作原型,并选取典型案例与现有主流方法进行多维度对比,直观、有力地论证了所提方法的有效性和进步性。

六、其他有价值的内容

研究也坦诚指出了当前工作的局限性,主要是领域知识库的覆盖广度与更新机制仍有待完善。这为未来研究指明了方向,包括:进一步扩展知识库的疾病和药物覆盖范围;优化检索增强的算法以提高证据匹配的精准度;探索更复杂的医学逻辑推理算法;以及开展大规模用户实验以验证其在实际应用中的效果和用户体验。这些后续工作对于该框架从研究原型走向实际应用至关重要。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com