学术研究报告:面向心血管疾病的人工智能中医诊疗辅助系统的设计与实现
一、 研究团队与发表信息
本研究由来自辽宁中医药大学的马凯文、赵瑞祥、孙艳秋、燕燕共同完成。该研究成果以《面向心血管疾病的人工智能中医诊疗辅助系统的设计与实现》为题,于2026年3月31日在《中华中医药学刊》(*Chinese Archives of Traditional Chinese Medicine*)上进行了网络首发。
二、 学术背景与研究目的
本研究属于中医药信息学与人工智能交叉领域,具体聚焦于心血管疾病的中医智能化诊疗。其背景在于,尽管中医药在冠心病、高血压、心力衰竭等心血管疾病防治中具有“整体观念”和“辨证论治”的独特优势,但其诊疗知识多散在于古籍、医案和经验中,存在数据记录不规范、诊疗流程不统一、缺乏智能辅助工具等突出问题,严重制约了其现代化传承与发展。近年来,自然语言处理(NLP)、知识图谱、大语言模型(LLM)等人工智能技术虽已开始应用于中医领域,但针对心血管疾病这类常见慢病、能够结合其“本虚标实”、“痰瘀互结”等核心病机特点进行深度辨证建模与处方推荐的智能系统,尚处于探索阶段,缺乏可参考的成熟解决方案。
因此,本研究旨在填补这一空白,其核心目标是构建一个面向心血管疾病的人工智能中医诊疗辅助系统。该系统旨在通过整合多源异构诊疗数据,建立符合心血管中医诊疗特点的标准化术语体系,并设计相应的智能辨证与处方推荐模型,最终实现诊疗流程的标准化、知识的系统化管理,并为临床提供具有明确中医理论依据和临床证据支持的辅助决策,从而推动中医药在心血管疾病领域的精准化与数字化发展。
三、 详细研究流程与方法
本研究是一项系统的工程设计与开发研究,其核心是构建一个完整的“数据-知识-决策”一体化智能系统。研究流程主要包括系统总体设计、核心功能模块开发、数据处理与质量控制、以及初步的实践验证。
1. 系统总体架构设计: 研究首先确立了系统的分层技术架构,自下而上包括: * 数据采集层: 负责采集电子病历、历史医案、名老中医经验、诊疗指南等多源异构数据。该层内置了基于LangChain框架的模块化解析流水线,并定制了中医实体识别模块,结合预训练语言模型(PLM)与大语言模型(LLM)协同抽取医案中的实体与属性。 * 存储层: 采用PostgreSQL、MongoDB和对象存储的混合方案,分别存储结构化业务数据、半结构化原始医案及中间结果、以及舌象面象等多媒体数据,并通过唯一标识符关联,确保数据一致性。 * 分析层: 这是系统的智能核心,集成了模型推理、知识检索与数据分析服务。使用TorchServe部署基于PyTorch训练的专科辨证与处方推荐模型;利用FAISS库构建知识库的向量索引以支持快速检索;基于Apache Airflow构建自动化批处理任务流,用于规律挖掘和模型再训练。 * 应用层: 通过Vue.js和Spring Boot框架构建了Web前端与后端API,为用户提供交互界面和集成接口,具体功能体现在“专家看诊系统”和“用药分析系统”两大模块中。
2. 核心功能模块的开发: 本研究针对心血管疾病诊疗的三个关键环节,开发了以下核心模块: * 诊疗数据标准化模块: 为解决中医数据非结构化、术语不统一的根本问题,研究团队创新性地设计了一种“LLM与PLM协同”的数据治理流程。具体步骤为:首先,利用LLM(如GPT系列模型)强大的开放式理解和泛化能力,从整段病历描述中初步提取出所有症状和体征的自然语言短语(如“阵发性心前区刺痛”)。然后,将由RoBERTa-wwm-ext-large等预训练模型微调而成的领域专用PLM,对这些短语进行精准的序列标注,识别核心实体及其属性(性质、部位、程度等),并映射到统一的中医标准术语编码。最后,依据“证素”理论,对症状的严重程度进行量化,生成可供模型学习的结构化特征向量。针对心血管专科,该流程还特别对“胸痛”等症状进行了精细化拆解与病机关联编码,使数据结构能直接反映“心血瘀阻”等病机特征。 * 智能模型引擎模块: 该模块包含两个核心模型。 * 智能辨证模型: 为解决心血管疾病“证型兼夹”的复杂情况,本研究设计了一个多标签辨证模型。其创新之处在于:① 特征交互强化机制: 在模型注意力层中,为“刺痛”、“舌紫”等心血管病机高鉴别价值属性分配更高权重。② 融合标签共现关系的多标签学习框架: 基于历史数据计算证型间的共现概率矩阵,并通过两种方式融入模型:一是在损失函数中加入基于该矩阵的正则化项(公式1),鼓励模型对高频共现证型(如“气虚血瘀证”与“痰浊闭阻证”)做出相似预测;二是将证型作为节点、共现矩阵作为邻接矩阵,构建图卷积网络(GCN),让分类器学习证型组合规律。模型使用1,641例临床数据进行训练和验证。 * 中医处方智能推荐模型: 针对现有推荐模型结果多为“药物集合”、缺乏方剂结构的问题,本研究提出了“核心方结构引导的处方推荐模型”。其核心创新包括:① 核心方组成语义向量的构建与注入: 将经典方剂的药物组成及“君臣佐使”关系编码为语义向量,作为先验知识引导模型。② 结构感知的推荐损失函数: 在标准的序列生成损失(负对数似然损失)基础上,增加“经方结构一致性”惩罚项(公式2、3),通过计算推荐处方向量与经典方剂向量的余弦相似度,确保推荐处方在结构上趋近经典方剂。③ 核心方识别与智能化裁建议: 模型能识别潜在核心经方,并基于患者具体情况给出加减建议,使推荐从“药物罗列”升级为“有方有法”。 * 智能辅助诊断系统模块: 此模块将上述技术封装为面向临床的两大应用。专家看诊系统是一个交互式工作台,医师录入症状后,系统通过LLM+PLM流程解析,并行调用辨证模型和推荐模型生成诊断与处方建议,并同步通过检索增强生成(RAG)技术从知识库中检索相关典籍、指南和相似病案作为循证依据附于结果之后。用药分析系统则提供数据挖掘工具,支持对特定患者队列进行用药频次统计、性味归经分析、基于Apriori算法的药物组合关联规则挖掘,以及基于最小方差法的药物聚类网络分析,服务于经验传承和科研。
3. 数据处理、质量控制与实践验证: 研究建立了涵盖数据采集、处理、存储全流程的质量控制体系,包括人机协同的数据标注校验、全链路溯源机制,以及严格的数据安全与隐私保护措施(如数据脱敏、差分隐私、访问控制等)。为验证系统有效性,研究整合了辽宁省名中医工作室的1,641例心血管疾病患者(共3,848人次就诊记录)的临床数据,构建了专科数据平台。利用该数据,研究不仅用于训练和测试核心模型,还通过系统的“用药分析”功能进行了队列分析实践,例如挖掘出“当归-神曲”、“神曲-麦芽”、“当归-黄芪”等高频共现药对,展示了系统在规律挖掘方面的能力。
四、 主要研究结果
本研究取得了一系列具体且可量化的成果: 1. 数据标准化流程的有效性: 成功构建并应用了“LLM初步提取 → PLM精准标准化”的协同治理框架。该流程能够将自由文本的中医病历描述,转化为深度结构化、量化的知识单元,为后续建模提供了高质量输入。例如,将“心前区针刺样疼痛,劳累后发作”转化为包含性质(刺痛,编码xy_z001,评分+3)、诱因(劳累诱发,编码xy_y005,评分+2)等维度的特征向量,直接关联病机。 2. 核心模型的性能表现: 基于1,641例临床数据的验证,系统核心的智能辨证模型对心血管常见证型的综合识别F1值达到了0.89。这表明模型具有较高的诊断准确性。更重要的是,该模型通过融入标签共现关系,在识别“兼夹证”(即多个证型同时存在)方面表现优于通用辨证模型。同时,处方推荐模型所推荐的处方与专家处方基本一致,且由于引入了经方结构引导,其推荐结果不再是简单的药物堆砌,而是具备了“君臣佐使”的组方逻辑和明确的加减化裁建议,临床实用性更强。 3. 系统功能的实践验证: 系统成功对“胸痹”、“心悸”等疾病的诊疗规律进行了量化分析。例如,通过Apriori关联规则挖掘(设置最小支持度25%,最小置信度50%),自动发现了“当归-神曲”(支持度32.39%,置信度58.70%)等具有临床意义的常用药对。这证明了系统不仅能够辅助个体诊疗,还能服务于群体水平的用药规律研究和名医经验挖掘。 4. 全流程辅助决策的实现: 集成了RAG技术的“专家看诊系统”,能够为每一次智能辨证和处方推荐结果提供来自权威典籍、临床指南和相似病案的“溯源依据”,形成了“症状输入-智能辨证-处方推荐-循证参考”的闭环辅助流程,显著增强了系统输出的可解释性和临床医生的信任度。
这些结果层层递进:高质量的结构化数据是模型训练的基础(结果1);在此基础上开发的专科化模型取得了优异的性能指标(结果2);将模型应用于真实临床数据,验证了其挖掘规律和辅助决策的能力(结果3、4)。这些结果共同支撑了本研究成功构建了一个有效、可用且具有专科特色的中医智能诊疗辅助系统的结论。
五、 研究结论与价值
本研究成功设计并实现了一个面向心血管疾病的人工智能中医诊疗辅助系统。结论表明,该系统通过将前沿人工智能技术(LLM、PLM、多标签学习、图神经网络、RAG等)与中医诊疗逻辑(证素理论、经方结构、君臣佐使)深度融合,为破解中医心血管领域数据与诊疗流程标准化不足的难题提供了一个可行的技术方案与实践平台。
其科学价值在于:①提出了一套针对中医非结构化文本的、人机协同的深度结构化与量化方法(LLM+PLM流程);②创新性地构建了融合标签共现关系的多标签辨证模型和核心方结构引导的处方推荐模型,提升了AI模型处理中医复杂辨证和组方逻辑的能力;③建立了基于RAG的循证辅助与全链路追溯机制,增强了AI决策的可解释性。其应用价值在于:该系统能够辅助临床医师实现诊疗流程标准化、提高辨证处方效率、挖掘用药规律,并为中医心血管专病的数字化传承、智能化辅助与标准化发展提供了有力工具。
六、 研究亮点
本研究的亮点主要体现在以下几个方面: 1. 问题导向的专科化设计: 研究并非构建通用中医辅助系统,而是精准针对心血管疾病“本虚标实”、“证型兼夹”的病机特点,在数据标准化(如胸痛精细化拆解)、辨证模型(多标签兼夹证识别)、处方推荐(经方结构引导)等各个环节进行了深度定制和优化。 2. 技术融合的创新性: 创造性地将LLM的开放式理解能力与PLM的精准结构化能力相结合,形成了高效的数据治理流水线。在建模中,巧妙地将标签共现矩阵以正则化损失和图神经网络两种形式融入多标签学习框架,有效提升了模型对临床常见证型组合的识别能力。 3. 从“数据”到“决策”的闭环体系: 研究构建了一个完整的体系,涵盖了从原始数据治理、知识表示、智能模型构建到临床辅助应用、结果循证溯源、以及数据反馈迭代的全流程,形成了可持续发展的闭环。 4. 注重可解释性与临床贴合度: 通过RAG提供循证依据、在处方推荐中明确标注核心方来源及加减依据,极大地增强了AI系统的透明度和临床医生的接受度。处方推荐模型追求“有方有法”,而非“药物堆砌”,更符合中医临床思维。
七、 其他有价值内容
研究在最后部分坦诚地讨论了当前面临的挑战与未来展望。关键问题包括:中医诊断主观性强导致的数据标准化根本难题、高质量中医数据稀缺且难以共享、以及中西医数据融合困难导致系统推荐结果可能偏向单一数据来源(合作机构)的经验。针对这些挑战,作者提出了推进多学科协作(中医专家与数据科学家深度合作)和呼吁建设促进数据共享的政策与法律环境的对策。未来工作将朝向多中心数据协同、拓展至全科疾病辅助诊疗、以及深入进行中西医疗效对比研究等方向努力,体现了研究的持续性和开放性。