分享自:

基于薄层CT的侵袭性肺腺癌风险分层集成深度学习模型

期刊:npj digital medicine

这篇文档属于类型a,即报告了一项单一原创研究的科学论文。以下是针对该研究的学术报告:


作者及机构
本研究的作者包括Jing Zhou、Bin Hu、Wei Feng、Zhang Zhang、Xiaotong Fu、Handie Shao、Hansheng Wang、Longyu Jin、Siyuan Ai和Ying Ji。他们分别来自中国人民大学应用统计中心、首都医科大学北京朝阳医院呼吸医学研究所、中南大学湘雅三医院、长沙市中心医院、北京大学光华管理学院和北京良乡医院。该研究于2023年发表在期刊《npj Digital Medicine》上。

学术背景
肺癌是全球范围内威胁人类健康的主要癌症之一,2020年的发病率在所有癌症中排名第一,同时也是癌症相关死亡的主要原因。在中国,肺癌的发病率和死亡率均位居首位,5年生存率仅为30%左右。随着低剂量计算机断层扫描(low-dose computed tomography, LDCT)在肺癌筛查中的普及,越来越多的早期肺癌被发现。LDCT筛查在降低肺癌相关死亡率方面的作用已得到循证医学的证实。

肺腺癌(lung adenocarcinoma)是早期肺癌的主要类型,根据国际肺癌研究协会(IASLC)的分类,肺腺癌可分为两类:前浸润性腺癌(pre-invasive adenocarcinoma, pre-IA)和浸润性腺癌(invasive adenocarcinoma, IAC)。前浸润性腺癌包括非典型腺瘤样增生(atypical adenomatous hyperplasia, AAH)、原位腺癌(adenocarcinoma in situ, AIS)和微浸润性腺癌(minimally invasive adenocarcinoma, MIA)。IAC根据最新的IASLC分级系统分为三个风险等级,这一分级系统在生存率分层评估中表现出色。

目前,基于CT的肺癌筛查结果可能因不同医生的解读差异而面临挑战,这促使研究者开发自动化诊断系统。现有研究主要集中在良恶性结节的分类上,缺乏针对浸润性腺癌风险分层的模型。因此,本研究旨在开发一种基于深度学习的模型,用于肺腺癌的风险分层,为外科医生提供术前预测信息,以选择最合适的手术方式。

研究流程
本研究分为以下几个主要步骤:

  1. 数据收集与预处理
    研究纳入了来自三个医疗中心的1075个肺结节(≤30mm且≥4mm),这些结节均通过术前薄层CT扫描和手术病理确诊。训练集包括843个结节,验证集包括232个结节。所有患者均接受了厚度为0.5mm至1.5mm的薄层CT扫描。数据预处理包括CT图像的插值和归一化处理,以消除不同扫描之间的分辨率差异。

  2. 模型开发
    研究者提出了一种基于多视图3D卷积神经网络(ensemble multi-view 3D convolutional neural network, EMV-3D-CNN)的模型,用于完成三个任务:

    • 任务1:区分良恶性肺结节
    • 任务2:区分前浸润性腺癌和浸润性腺癌
    • 任务3:对浸润性腺癌进行风险分层(分为1级、2级和3级)
      模型采用了异质集成(heterogeneous ensemble, HEE)策略,结合了3D Inception、3D VGG和3D ResNet三种不同的3D CNN模型。每个模型独立训练,最终通过平均预测概率确定分类结果。
  3. 模型评估
    模型在验证集上进行了评估,并与六名医生(包括三名资深医生和三名初级医生)的表现进行了比较。评估指标包括曲线下面积(AUC)、准确率、敏感性、特异性、阳性预测值(PPV)、阴性预测值(NPV)和F1分数。

  4. 外部验证
    为了验证模型的泛化能力,研究还使用了一个独立的外部数据集(来自北京良乡医院的194个肺结节)进行测试。

主要结果
1. 任务1:良恶性结节分类
模型在验证集上的AUC为91.3%,准确率为90.3%,敏感性为92.8%,特异性为84.3%。模型的表现优于初级医生,与资深医生相当。

  1. 任务2:前浸润性腺癌与浸润性腺癌分类
    模型在验证集上的AUC为92.9%,准确率为89.0%,敏感性为85.9%,特异性为92.1%。模型的表现显著优于医生。

  2. 任务3:浸润性腺癌风险分层
    模型在验证集上的总体准确率为77.6%,显著高于资深医生(平均准确率为66.23%)和初级医生(平均准确率为56.14%)。模型在识别3级风险结节时表现最佳(AUC为94.8%),而在识别2级风险结节时表现相对较差(AUC为80.3%)。

  3. 外部验证
    在外部数据集上,模型在任务1、任务2和任务3上的准确率分别为89.7%、83.8%和70.4%,表明模型具有较好的泛化能力。

结论
本研究开发的EMV-3D-CNN模型在肺腺癌风险分层方面表现出色,能够为外科医生提供详细的术前预测信息,辅助选择最合适的手术方式。模型在良恶性结节分类、前浸润性腺癌与浸润性腺癌分类以及浸润性腺癌风险分层任务中均取得了优于医生的表现,尤其是在风险分层任务中,模型的准确率显著高于资深医生。此外,模型通过外部验证证明了其在实际临床中的应用潜力。

研究亮点
1. 创新性:本研究首次开发了一种基于深度学习的模型,用于浸润性腺癌的风险分层,填补了该领域的研究空白。
2. 多任务设计:模型同时完成了良恶性结节分类、前浸润性腺癌与浸润性腺癌分类以及浸润性腺癌风险分层三个任务,具有广泛的应用价值。
3. 高性能:模型在所有任务中的表现均优于医生,尤其是在风险分层任务中,模型的准确率显著高于资深医生。
4. 实用性:研究开发了一个基于Web的平台(https://seeyourlung.com.cn),方便临床医生使用模型进行肺结节的诊断和风险评估。

其他有价值的内容
研究还提供了详细的模型代码和参数,公开在GitHub上(https://github.com/zhoujing89/emv-3d-cnn),供其他研究者使用和改进。此外,研究还讨论了模型的局限性,包括样本量较小和仅适用于薄层CT图像的问题,为未来的研究提供了方向。


这篇报告全面介绍了研究的背景、流程、结果和意义,突出了其创新性和应用价值,为其他研究者提供了详细的参考信息。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com