学术报告
研究主要作者及机构、发表期刊与时间
本文的主要研究作者包括 Minyue Yin, Jiaxi Lin, Yu Wang 等。研究单位主要涉及苏州大学附属第一医院消化科、江苏大学附属金坛医院普通外科、湖南省人民医院肝胆外科等多家医疗和科研机构。研究成果发表在 International Journal of Medical Informatics 期刊第184卷(2024年),文章编号为 “105341”,于 2024年1月20日线上公开。
研究背景
本文的研究领域属于医学信息学和人工智能在医学中的应用。主要研究背景如下:
急性胰腺炎(Acute Pancreatitis,AP)是一种常见的消化系统疾病,其中约25%的病例会发展为中重度急性胰腺炎(Severe Acute Pancreatitis,SAP)。SAP 具有较高的住院死亡率(5-10%),因此对早期识别高风险患者并进行及时干预成为有效降低并发症和死亡率的关键。
然而,传统的评分系统如 Ranson、MCTSI 和 BISAP 存在一定的局限性,这些系统基于少量结构化的变量,应用于复杂的临床实践中需要医生具备较高经验。此外,数据维度的单一性限制了预测精度。而基于人工智能(Artificial Intelligence,AI)的方法则通过处理多模态异质性数据和复杂的非线性特征,展现出更大的潜力。
目前多模态模型通过融合电子健康记录(Electronic Health Records,EHRs)、影像组学(Radiomics)和深度学习特征(Deep Learning Features)提高了预测精度,但针对 SAP 的综合性研究仍然较少。因此,该研究旨在开发和验证一个基于多模态数据融合的早期 SAP 预测模型 Prismsap,以克服单一模态模型的局限性。
研究设计与流程
研究设计
这是一项回顾性多中心研究,由苏州大学附属第一医院伦理委员会批准(批准编号:2022098)。研究时间跨度为2017年1月至2021年12月。数据来源于三家医疗中心,目的在于开发多模态结合的预测模型。
研究对象
本研究纳入了1221名急性胰腺炎患者,这些患者依据 2012 年亚特兰大分类标准分为 SAP 和非 SAP 两组。研究排除标准包括:有慢性肝肾疾病、血液病、胰腺肿瘤或切除术史的患者;妊娠期患者;以及接受化疗或放疗的患者。
流程步骤
数据收集
- 收集患者入院后24小时内的电子健康记录(EHRs)数据,包括年龄、性别、既往病史、实验室指标(如血常规、肝肾功能等)。
- 收集入院后72小时内的腹部三维 CT 扫描和二维 CT 图像。术语如“Regions of Interest (ROIs)”指患者胰腺病灶的指定范围。
特征提取与降维
- EHRs 数据特征提取:共提取46个潜在变量,通过最小收缩选择算子(LASSO,Least Absolute Shrinkage and Selection Operator)回归筛选出9个主要特征(如 pleural effusion、systemic inflammatory response syndrome (SIRS)、ALT、RDW 等)。
- Radiomics 数据:从3D-CT图像提取107种影像组学特征,采用主成分分析(PCA)降维到6个主成分。
- 深度学习特征:基于 Densenet-121、Mobilenet-V2 和 Visual Transformer 预训练模型处理二维 CT 图像,生成单一的预测分数。
模型开发与训练
- 单模态模型开发:使用 Automated Machine Learning (AutoML) 工具分别基于电子健康记录、影像组学和深度学习特征开发三个单模态模型(模型命名为 Model α、Model β、Model γ)。
- 多模态融合:结合 LASSO 筛选的9个电子健康记录特征、PCA筛选的6个影像组学特征以及深度学习生成的预测值。在 AutoML 的自动算法调优后,选择性能最佳的模型,命名为 Prismsap(Model δ)。
- 数据集划分:内部数据集按 7:2:1 随机分为训练集、验证集、内测集。同时,来自湖南和江苏省的两家三甲医院提供226名新患者用于外部验证。
模型解释
- 使用 Local Interpretable Model-Agnostic Explanation (LIME) 方法解释预测特征对模型结果的权重影响。
- 使用 Gradient-weighted Class Activation Mapping (Grad-CAM) 生成热力图,显示深度学习模型在 CT 图像上的特征区域识别能力。
研究主要结果
单模态模型结果
- Model α(基于电子健康记录):外部数据集上 AUC 值为 0.709,F1-score 为 0.452。
- Model β(基于影像组学):外部数据集上 AUC 为 0.749,F1-score 为 0.435。
- Model γ(基于深度学习):外部数据集上 AUC 为 0.687,F1-score 为 0.430。
多模态模型 Prismsap
- 内部测试集的 AUC 为 0.874,外部测试集的 AUC 为 0.916,显著优于所有单一模态模型。
- Prismsap 模型的灵敏度为 0.909,特异性为 0.835,F1-score 达到 0.701。
- 校准曲线和决策曲线分析显示 Prismsap 的预测值与真实值高度一致,并且在较宽的高风险阈值范围(10%-90%)内具有较高的净获益。
模型解释性
- LIME 算法显示,pleural effusion 和 SIRS 是 Prismsap 中最重要的两个特征。
- Grad-CAM 热力图显示深度学习模型能够有效地关注胰腺病灶。
研究结论与意义
研究开发了一个名为 Prismsap 的多模态预测模型,通过整合 EHRs 特征、CT 影像组学特征和深度学习特征,实现了对 SAP 的早期预测。Prismsap 在外部验证数据集上表现出较高的预测精度和稳定性,显著优于传统评分系统和单模态模型。
科学价值与应用意义: 1. Prismsap 改进了对 SAP 的早期预测能力,可帮助临床医生对高危患者进行早期干预。 2. 该模型展示了多模态数据与人工智能技术在医学领域融合的前景,为未来于其他疾病或临床场景中的应用提供了借鉴。 3. 研究强调了模态融合与数据维度异构性处理的重要性,提示未来可以结合更大规模和多样化的数据进一步优化。
研究亮点
- 开创性首次将 EHRs、影像组学和深度学习特征结合用于 SAP 预测。
- 使用 AutoML 提高建模效率和模型性能的稳定性。
- 通过 LIME 和 Grad-CAM 增强模型的可解释性,使其更符合临床应用需求。
未来展望
研究提到下一步将重点推进模型的临床部署,以实现更高的自动化水平并减少数据清洗的额外工作。此外,研究的局限性如 ROI 标注耗时长、设备间差异性等也为未来研究提供了改进方向。