类型a
作者与发表信息
该研究的主要作者包括Hongyin Liang、Meng Wang、Yi Wen、Feizhou Du、Li Jiang、Xuelong Geng、Lijun Tang和通讯作者Hongtao Yan。研究由多个机构合作完成,包括西部战区总医院普通外科(成都军区总医院)、四川省胰腺损伤与修复重点实验室、放射科以及四川大学电子科技大学医学院附属肿瘤医院肝移植与肝胆胰外科等。该研究于2023年发表在《Scientific Reports》期刊上。
学术背景
急性胰腺炎(Acute Pancreatitis, AP)是一种常见的急腹症,其严重程度直接影响患者的预后。轻度急性胰腺炎(Mild Acute Pancreatitis, MAP)通常预后良好,而重度急性胰腺炎(Severe Acute Pancreatitis, SAP)常伴随胰腺坏死和器官衰竭,死亡率较高。因此,早期评估AP的严重程度对临床干预和改善患者预后至关重要。尽管已有多种评分系统(如APACHE II、Ranson评分、BISAP评分等)用于预测AP的严重程度,但这些方法的预测效果并不令人满意。近年来,机器学习和人工智能技术在医学领域的应用显示出巨大潜力,尤其是在基于影像学数据的疾病预测中。CT扫描是评估AP严重程度的重要工具,结合深度学习模型可能进一步提高预测准确性。然而,目前关于使用增强CT扫描结合卷积神经网络(Convolutional Neural Networks, CNN)预测AP严重程度的研究较少。本研究旨在评估基于三维DenseNet CNN模型的增强CT扫描在预测AP严重程度中的可行性,并比较两种常用评分系统——CT严重指数(Computed Tomography Severity Index, CTSI)和2012修订版亚特兰大分类(Atlanta Classification)——的标签化效果。
研究流程
本研究主要包括以下步骤:
1. 数据收集与处理
研究纳入了2009年至2022年间诊断为AP的患者共1,798例增强CT扫描数据。所有CT扫描均采用标准对比增强腹部CT检查,参数包括1.0 mm层厚和512×512矩阵大小。研究排除了年龄小于18岁、接受过腹膜后穿刺引流、患有慢性胰腺炎或上腹部手术史(胆囊切除术和胆管探查除外)的患者。最终数据集按9:1的比例随机分为训练集(n=1,618)和测试集(n=180)。
CT图像标注
CT图像分别根据CTSI和亚特兰大分类进行标注。CTSI评分由两位具有超过10年经验的放射科医生独立完成,标注内容包括胰腺炎症程度和坏死比例。亚特兰大分类则从数据库中提取,基于患者住院期间的记录。
模型开发与训练
研究采用了三维DenseNet CNN模型,模型架构包含四个模块,每个模块由密集块(dense block)和过渡块(transition block)组成。模型通过softmax函数生成最终预测结果。训练过程中应用了数据增强技术(如随机旋转和平移),以提高模型的泛化能力。
模型评估
模型性能通过混淆矩阵、ROC曲线下的面积(AUC-ROC)、准确率、精确率、召回率和F1分数进行评估。为了更客观地评价模型在不平衡数据集上的表现,研究采用了宏平均(macro-average)指标。此外,研究还使用梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)技术可视化模型决策过程。
主要结果
1. 模型性能
基于CTSI标注的CT扫描训练的DenseNet模型表现出优异的预测性能,宏平均准确率为0.899,宏平均F1分数为0.835,宏平均AUC-ROC为0.980。相比之下,基于亚特兰大分类标注的模型性能稍逊,宏平均AUC-ROC为0.864,宏平均F1分数为0.670。
不同严重程度的预测表现
模型对SAP的预测性能最佳,这可能是因为SAP患者的CT图像变化更为显著,易于区分。对于MAP和MSAP,模型的预测性能也达到了较高水平,表明模型能够有效捕捉AP严重程度的变化。
Grad-CAM可视化结果
Grad-CAM结果显示,模型在预测过程中重点关注胰腺及其周围区域,尤其是胰腺坏死和胰周积液区域。这表明模型能够自动提取与AP严重程度相关的关键特征。
结论与价值
本研究表明,基于三维DenseNet CNN模型的增强CT扫描可以可靠地预测AP的严重程度,验证了CNN模型在AP严重程度自动分类中的可行性。研究结果为开发结合影像学数据和临床数据的综合预测模型提供了重要参考。未来,通过改进模型结构(如引入注意力机制和时间序列模型),有望实现动态评估AP严重程度的目标。
研究亮点
1. 首次系统性评估了基于增强CT扫描的三维DenseNet CNN模型在AP严重程度预测中的应用。
2. 比较了CTSI和亚特兰大分类两种标注方法的效果,发现CTSI标注的模型性能更优。
3. 使用Grad-CAM技术揭示了模型决策过程,证明了模型对胰腺及胰周区域的关注。
其他有价值的内容
研究强调了多中心研究和外部验证的重要性,并指出未来研究可探索结合影像学数据和临床数据的混合模型,以进一步提高预测性能。此外,研究还提到ROI(感兴趣区域)提取可能有助于提升模型性能,但需要开发成熟的胰腺分割算法。