《四诊合参智能化发展现状及实现路径》学术报告
本文由赵文(福建中医药大学中医证研究基地)、张佳(厦门大学)、徐佳君、辛基梁、周常恩、李绍滋(厦门大学)、李灿东(福建中医药大学中医证研究基地)等学者合作完成,发表于《中医杂志》2020年1月第61卷第1期。文章围绕中医诊断智能化领域的核心问题——四诊合参(Four Diagnosis Integration)的现状与实现路径展开系统性综述,结合多学科交叉视角,提出基于人工智能技术的解决方案。
中医诊断强调“四诊合参”,即通过望诊(inspection)、闻诊(listening and smelling)、问诊(inquiring)、切诊(palpation)四类信息的融合实现全面辨证。然而,当前四诊客观化研究面临以下瓶颈:
1. 单诊技术局限性:各诊法设备分类标准不统一,数据来源异构性强;
2. 融合难度高:传统方法难以处理多源数据的冗余性与互补性;
3. 中医思维适配不足:现有技术缺乏对“整体观”和“动态辨证”的体现。
本文旨在梳理四诊智能化技术进展,提出通过多源数据融合(multi-source data fusion)提升合参准确性的路径,为中医诊断智能化提供方法论支持。
望诊:
- 技术进展:采用snake算法、Otsu阈值分割、JSEG算法等提升舌象、面色识别精度;深度卷积神经网络(如DeepGestalt)在遗传综合征面部识别中超越医生水平。
- 问题:眼神、舌体动态等抽象信息难以量化;数据标注不规范;隐私伦理风险。
闻诊:
- 技术进展:隐马尔可夫模型(HMM)、高斯混合模型用于语音分析;金属氧化物传感器阵列优化气味检测。
- 问题:缺乏标准化声音/气味数据库;多学科技术融合不足;设备依赖性强。
问诊:
- 技术进展:隐结构法、贝叶斯网络构建证候模型;多标记学习用于慢性胃炎辨证。
- 问题:中医术语复杂性(如通假字、歧义词)导致计算机识别困难;数据标准化程度低。
脉诊:
- 技术进展:希尔伯特黄变换(HHT)、BP神经网络分析脉象信号;阵列式传感器研发。
- 问题:脉象“位、数、形、势”四要素提取不完整;缺乏与其他诊法的协同分析。
核心矛盾:单诊技术虽进步,但“合参”仍受限于数据异构性与算法适配性。
作者提出三种多源数据融合方法:
- 协同训练法(Collaborative Training):通过未标记数据的迭代训练,提升不同诊法数据间的一致性(图1)。例如,利用未标记的面诊与脉诊数据互相优化分类器,减少人工标注需求。
- 多核学习法(Multi-Kernel Learning):将异构数据(如舌象图像、语音信号)映射到不同核空间,加权融合后提升分类性能(图2)。例如,舌诊采用图像核,脉诊采用时序核,组合后增强辨证准确性。
- 基于子空间学习法(Subspace Learning):将多源数据投影到共享低维子空间,消除冗余信息(图3)。例如,通过潜在子空间关联问诊文本与脉象波形,捕捉互补特征。
技术优势:
- 协同训练法解决标注数据不足问题;
- 多核学习法保留各诊法数据特性;
- 子空间学习法降低维度灾难风险。
本文不仅是一篇技术综述,更为中医现代化提供了“数据驱动”与“知识驱动”双轨并行的研究范式,具有重要的学术与实践价值。