本研究由来自北京安贞医院(首都医科大学附属)、东南大学、首都医科大学和中国人民解放军总医院等多个机构的Chenglong Guo、Binyu Gao等学者合作完成,并于2025年发表在《BMC Cardiovascular Disorders》期刊上。研究聚焦心血管疾病领域,旨在开发一种可解释的人工智能(AI)模型,用于预测急性心肌梗死(acute myocardial infarction, AMI)后心力衰竭(heart failure, HF)的严重程度。
学术背景
急性心肌梗死(AMI)是全球范围内导致死亡和残疾的主要原因之一,而心力衰竭(HF)是AMI后常见的严重并发症。Killip分级是临床常用的AMI后HF严重程度评估工具,但其依赖主观判断,且难以全面反映HF发展的复杂机制。近年来,人工智能技术在医学领域的应用日益广泛,尤其是深度学习模型在处理复杂临床数据方面展现出优势。然而,现有研究多集中于HF的二元预测(是否发生HF),而针对Killip多分类预测的研究较少,且模型的可解释性不足。因此,本研究旨在利用多维临床数据构建可解释的AI模型,以更准确地预测AMI后HF的严重程度,并通过SHAP(Shapley Additive Explanations)方法增强模型的可解释性。
研究流程
数据收集与预处理
- 研究对象:回顾性纳入2017年至2022年在北京宣武医院确诊为I型AMI的2993例患者,最终筛选出1574例具备完整关键特征(如NT-proBNP、左心室射血分数LVEF、GRACE/TIMI评分)的患者。
- 数据内容:涵盖人口统计学特征(年龄、性别、BMI)、临床评分(GRACE评分、TIMI评分)、病史(高血压、糖尿病、房颤等)、实验室检查(血常规、生化指标、炎症标志物等)、影像学指标(超声心动图参数)及住院时长等41项特征。
- 数据预处理:连续变量标准化(均值为0,方差为1);针对Killip分类不平衡问题(Killip 1占63.8%,Killip 4仅1.8%),采用SMOTE(Synthetic Minority Over-sampling Technique)过采样技术生成少数类合成样本。
模型构建与优化
- 模型选择:对比两种机器学习模型(随机森林RF、XGBoost)和两种深度学习模型(多层感知机MLP、TabNet)。
- 模型训练:数据集按80:20划分为训练集和测试集,采用五折交叉验证和网格搜索优化超参数。
- 评估指标:以AUROC(受试者工作特征曲线下面积)、AUPRC(精确率-召回率曲线下面积)、F1分数和精确率为主要评价指标。
模型解释与可视化
主要结果
模型性能
- TabNet在四分类(Killip 1-4)和二元分类(Killip 1 vs. 2-4)任务中均表现最佳,AUROC分别为0.827和0.831,显著优于其他模型(MLP、RF、XGBoost)。
- 深度学习模型整体优于传统机器学习模型,表明其对复杂临床数据的高维特征捕捉能力更强。
关键预测因子
- SHAP分析显示,GRACE评分、TIMI评分、NT-proBNP、肌酐、住院时长与HF严重程度呈正相关;LVEF和CCR(肌酐清除率)则呈负相关。
- 例如,GRACE评分≤150或LVEF≥48%的患者更可能被预测为Killip 1级,而NT-proBNP>2500 pg/mL或TIMI评分>3分则提示更高Killip分级。
临床应用验证
- 模型通过网页平台实现便捷的临床部署,医生输入患者数据后可即时获得Killip分级预测及关键影响因素的可视化解释。
结论与价值
科学价值
- 首次将TabNet模型应用于AMI后HF的Killip多分类预测,填补了现有研究空白。
- 通过SHAP方法揭示了HF发展的关键临床因素(如炎症标志物IL-6、hs-CRP与肾功能指标),为病理机制研究提供新线索。
应用价值
- 模型可早期识别高风险患者,指导个体化干预(如强化抗炎或肾功能保护),改善预后。
- 开源平台降低了AI技术的使用门槛,促进临床转化。
研究亮点
方法创新
- 结合TabNet的注意力机制与SMOTE过采样技术,有效解决医学数据不平衡问题。
- 首次在HF预测中实现Killip四分类的高精度建模(AUROC>0.82)。
临床意义
- 模型超越传统Killip分级的主观局限性,整合多维数据提供客观风险评估。
- 可解释性设计增强医生对AI结果的信任,推动其在临床决策中的应用。
局限性
- 单中心数据可能限制模型泛化能力,需多中心外部验证。
- SHAP解释为相关性分析,需进一步实验验证因果机制。
- 未纳入影像组学或基因组学数据,未来可扩展多模态分析。
该研究为AMI后HF的精准预测提供了创新工具,兼具学术前沿性与临床实用性,有望成为心血管风险分层的重要辅助手段。