本文的研究由Hongyin Liang, Meng Wang, Yi Wen, Feizhou Du, Li Jiang, Xuelong Geng, Lijun Tang以及Hongtao Yan等人参与完成,主要研究单位包括位于中国成都的西部战区总医院普通外科、中国电子科技大学医学院等。本研究发表于Scientific Reports,2023年第13卷,文章编号为17514,DOI为:https://doi.org/10.1038/s41598-023-44828-7。
急性胰腺炎(Acute Pancreatitis, AP)是一种在临床实践中较为常见的急性腹部疾病,其特点为病程短但具有高病死率。轻度急性胰腺炎(Mild Acute Pancreatitis, MAP)通常预后良好,而严重急性胰腺炎(Severe Acute Pancreatitis, SAP)则常伴随胰腺坏死、器官衰竭等并发症,病死率很高。因此,在疾病早期准确评估AP的严重程度对于及时干预和改善临床结局至关重要。
传统的AP严重程度评估体系(如Ranson评分、APACHE II评分、BISAP评分、Marshall评分等)虽有一定价值,但在预测SAP的效率上并不完全令人满意。此外,增强型CT扫描作为一种影像学手段,被证明在评估胰腺炎严重程度方面具有重要作用,比如基于CT扫描的CT严重度指数(Computed Tomography Severity Index, CTSI)和修正版CT严重度指数(MCTSI)。近年来,机器学习及深度学习技术逐渐应用于预测AP严重度的研究中,被赋予了新的可能性。
本研究的目标是利用基于三维DenseNet卷积神经网络(Convolutional Neural Network, CNN)的深度学习模型,分析增强型CT图像来预测急性胰腺炎的严重程度。此外,研究比较了两种标注体系——CT严重程度指数(CTSI)和2012年修订的亚特兰大分类(Atlanta Classification)的模型预测性能。
本研究采用了单中心回顾性研究设计,主要流程包括以下几步:
研究团队从一个始于2009年的急性胰腺炎数据库中提取了数据,数据库包含2009年至2022年间收集的2,571份增强型CT扫描图像。排除标准包括年龄小于18岁、有慢性胰腺炎病史、上腹部外科手术史或肿瘤等特征。经过筛选,最终纳入1,798份符合标准的增强型CT扫描。
每份CT扫描图像分别由经验丰富的放射科医生基于CTSI和亚特兰大分类进行独立标注: - CTSI评分:依据增强型CT图像,考虑胰腺炎症和坏死面积。0-3分定义为MAP,4-6分为中度严重(MSAP),7-10分为SAP。 - 亚特兰大分类:结合影像学、临床症状和系统性并发症,定义三种严重程度(MAP、MSAP、SAP)。两种分类体系之间存在一定不一致性(9.6%的病例)。
数据随机分组为训练集(1,618例)和测试集(180例),比例为9:1。为增强模型训练效果,对训练数据进行了数据扩充(如随机旋转和平移)。
本研究开发了一种基于 DenseNet 的三维 CNN模型。输入的CT图像经过预处理后被调整为64×128×128大小。模型结构包含四个模块,每个模块由密集块和过渡块组成,最终通过全连接层和softmax函数输出预测结果。
使用混淆矩阵评估分类正确率,计算AUC-ROC、宏平均F1分数(Macro Average F1 Score)等指标。此外,利用gradient-weighted class activation mappings(Grad-CAMs)技术生成可视化热图,观察模型的判别区域。
训练后的DenseNet模型在预测AP严重程度上表现良好,其性能如下: - 基于CTSI标签模型的结果:宏平均准确率为0.899,宏平均F1得分为0.835,宏平均AUC-ROC达到0.980,显示较高的预测能力。 - 基于亚特兰大分类标签模型的结果:宏平均准确率为0.809,宏平均F1得分为0.670,宏平均AUC-ROC为0.864,相较于CTSI标签模型,性能略逊一筹。
通过Grad-CAMs可视化分析发现,模型能够聚焦于胰腺及胰周坏死区域。特别是,在基于CTSI标签训练的模型中,热图显示其对胰腺坏死及周围积液的辨别能力优于基于亚特兰大分类的模型。
研究发现,两种分类系统在某些病例上的标注存在不一致性。这种不一致性或许导致了亚特兰大分类模型性能的下降。CTSI分类的纯影像学基础更有利于卷积神经网络模型的学习与预测。
本研究成功构建了一个基于增强型CT图像的三维 DenseNet CNN模型,通过CTSI及亚特兰大分类对急性胰腺炎严重程度进行精准预测。在性能对比中,模型对CTSI标注数据的预测效果优于亚特兰大分类,表明基于影像数据的标注更符合人工智能模型的特点。
这项研究为深度学习技术在医学影像的临床应用提供了新的可能性。其科学价值在于找到了一种高效、非侵入性的急性胰腺炎严重度量化方法。临床价值则体现在能够辅助医生迅速精准地评估患者病情,从而优化治疗策略并改善患者结局。
研究指出,未来可以通过以下方向进一步优化: 1. 多中心研究:通过不同地区和机构的数据验证模型的普适性和稳健性。 2. 引入ROI分割:对胰腺及坏死区域进行精准提取,可能提升模型预测性能。 3. 多模态数据融合:结合影像数据与临床数据(如实验室检查),利用多模态深度学习模型,进一步改进预测能力。
在未来的临床应用中,此类模型有望成为优化胰腺炎治疗决策的重要工具,为患者提供更高质量、个性化的医疗服务。