分享自:

基于放射组学和深度学习的预测重症急性胰腺炎多模态模型的开发与验证

期刊:international journal of medical informaticsDOI:10.1016/j.ijmedinf.2024.105341

学术报告

作者及研究单位

本文作者包括Minyue Yin, Jiaxi Lin, Yu Wang等,主要作者为Department of Gastroenterology, The First Affiliated Hospital of Soochow University的研究团队,部分作者还来自Suzhou Clinical Centre of Digestive Diseases, Jiangsu University, Changshu Hospital和其他医疗机构及大学。研究发表于2024年1月20日的《International Journal of Medical Informatics》,论文编号为105341。


背景介绍:研究领域、目的及意义

本研究属于医学信息学与人工智能(AI)的交叉领域,致力于通过多模态数据融合预测重症急性胰腺炎(Severe Acute Pancreatitis, SAP)。急性胰腺炎(Acute Pancreatitis, AP)是一种常见消化系统疾病,多数患者症状轻微,但约25%的患者会发展为中重度胰腺炎,其中SAP的死亡率高达5-10%。常规的预测评分系统(如Ranson评分、MCTSI、BISAP)由于过于依赖临床医生的经验和有限的输入参数,存在复杂性并表现出局限性。

近年来,依托人工智能尤其是机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)技术,基于医疗大数据的模型越来越广泛应用于疾病早期预测。本研究目标是基于多模态(Multimodal Fusion)数据,开发并验证一款名为PRISMSAP的预测模型,通过整合电子健康记录(Electronic Health Records, EHRs)、三维CT扫描中的放射组学特征(Radiomics)与二维CT图像的深度学习特征,提升SAP预测的准确性和临床适用性。


研究流程与方法

此项研究为多中心回顾性队列研究,由以下步骤与流程组成:

数据和研究样本
  1. 数据来源和样本收集

    • 数据来源于中国江苏省的三家医院(Hospital #1, #2, #3),时间跨度为2017年至2021年。
    • 数据涵盖1,221例符合诊断标准的急性胰腺炎患者,其中SAP患者135例(11.06%)。
    • 外部测试数据集来自湖南与江苏的两家医院(Hospital #4, #5),包含226例患者数据。
  2. 样本的筛选与排除标准

    • 排除标准包含慢性肝肾疾病、血液系统疾病、慢性/复发性/创伤性胰腺炎等。
数据处理与分析
  1. 多模态数据处理
    • 电子健康记录(EHRs):包含人口统计学信息(年龄、性别、吸烟史等)、实验室检测结果(血液学指标、肝肾功能、血糖等)及AP特定临床信息(例如血管外渗等)。通过LASSO(Least Absolute Shrinkage and Selection Operator)回归分析从46项原始特征中筛选出9个关键特征。
    • 放射组学特征(Radiomics):从患者的3D-CT扫描中提取107项放射组学特征,经主成分分析(Principal Component Analysis, PCA)降维,最终提取6个主成分用于建模。
    • 深度学习(DL)特征:对二维CT影像进行处理,图像输入DenseNet-121、MobileNet-V2和ViT三种预训练网络,输出预测变量以用于模型融合。
模型开发与验证
  1. 单模态模型的建立

    • Model α(EHRs特征模型):通过Automated Machine Learning(AutoML)工具建立,在Deep Neural Network(DNN)算法下表现最佳。
    • Model β(Radiomics模型):基于6项Radiomics主成分,经AutoML搭建,DNN表现最佳。
    • Model γ(DL特征模型):对九种超参数配置进行测试,DenseNet+特定超参数组合的模型效果最佳。
  2. 多模态模型PRISMSAP

    • 融合Model α、β、γ的特征,使用Stacked Ensemble算法搭建,最终模型δ即为PRISMSAP。
性能评估与可视化
  1. 模型评估指标

    • 模型性能通过ROC曲线、AUC(Area Under the Curve)、精确度(Precision)、灵敏度(Sensitivity)、F1-Scores等指标进行评估。
    • 按照内部验证和外部测试集数据,比较PRISMSAP与单模态模型及传统评分系统的表现。
  2. 可视化与解释

    • 使用Variable Importance Plot、LIME(Local Interpretable Model-agnostic Explanation)与Grad-CAM(Gradient-weighted Class Activation Mapping)工具解析模型。

研究主要结果

  1. 数据集分组与基本结果

    • 内部数据集分为训练集(n=864)、验证集(n=209)、测试集(n=148),外部测试集数据226例。
    • 基础特征显示SAP患者的中位年龄低于非SAP患者,但性别比例、吸烟史和糖尿病史等未显著相关。
  2. 单模态模型表现

    • EHRs模型(Model α)在外部测试集的AUC为0.709,精确度为0.699。
    • Radiomics模型(Model β)在外部测试集的AUC为0.749,灵敏度达0.955,但特异性低(0.412)。
    • DL模型(Model γ)在内部测试集的灵敏度达到0.800,而外部测试集AUC为0.687。
  3. 多模态模型PRISMSAP的表现

    • 在外部测试集中,PRISMSAP AUC值为0.916,远高于任何单模态模型,其灵敏度和特异性分别达到0.909和0.835,同时实现最高的F1评分(0.701)。
    • 分析指出,放射组学与深度学习特征为临床数据模型提供了显著补充,从而改善模型整体性能。
  4. 模型解释与变量重要性

    • 在EHRs模型中,“胸腔积液”(PE)与“SIRS评分”是重要贡献因子,而其他贡献变量包括血液指标(HCT、RDW)及肝功能指标(ALT、GGT)。
    • 随机选取的CT影像通过Grad-CAM生成了高亮区域,显示模型在预测中关注胰腺病灶区域。

研究结论与价值

  1. 研究结论:PRISMSAP模型基于多模态数据融合,较传统评分系统与现有的单模态模型表现出显著优越性,能够准确地早期预测SAP患者。这一方法为高危患者的提前干预和并发症规避提供了科学依据。

  2. 科学及应用价值

    • 科学意义:验证了多模态融合与AI在疾病预测中的优势,并展示了Radiomics和DL特征在提高预测准确性方面的潜力。
    • 临床适用性:PRISMSAP作为非侵入式早期诊断工具,有助于提高SAP的诊疗效率,降低死亡率并优化医院资源配置。
  3. 研究亮点

    • 首次融合EHRs、放射组学与DL特征建立SAP预测模型。
    • 采用大量独立的外部测试,证明模型具有良好的泛化能力。
    • 应用了AutoML技术以提高建模效率,简化流程。

研究的局限与未来展望

尽管PRISMSAP表现出色,但其仍然面临如手动ROI分割效率低下、跨中心影像数据一致性等问题。此外,该研究为回顾性设计,未来需要开展前瞻性研究及模型的临床部署与验证,以进一步提升其实用性与推广性。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com