本文档描述了由Xianwu Xia、Jing Gong、Wen Hao、Ting Yang、Yeqing Lin、Shengping Wang和Weijun Peng等作者进行的一项关于肺癌腺癌浸润性风险预测的研究。该研究于2020年3月31日发表在期刊《Frontiers in Oncology》上,题为“Comparison and Fusion of Deep Learning and Radiomics Features of Ground-Glass Nodules to Predict the Invasiveness Risk of Stage-I Lung Adenocarcinomas in CT Scan”。
肺癌是常见的恶性肿瘤之一,而肺腺癌是肺癌中最常见的组织学亚型,占肺癌病例的近一半。在计算机断层扫描(CT)图像中,持续性存在的磨玻璃结节(Ground-Glass Nodules, GGNs)通常被认为是肺腺癌或其前体存在的标志。根据2011年国际肺癌研究协会/美国胸科学会/欧洲呼吸学会(IASLC/ATS/ERS)分类指南,肺腺癌包括非典型腺瘤样增生(AAH)、原位腺癌(AIS)、微浸润腺癌(MIA)和浸润性腺癌(IA)。不同亚型的肺腺癌具有不同的3年和5年无病生存率(DFS),尤其是对于I期肺腺癌,AIS和MIA的5年DFS为100%,而IA仅为38-86%。因此,准确区分IA和非IA(包括AIS和MIA)对于选择合适的手术治疗方案至关重要。
本研究旨在开发一种基于CT图像的人工智能(AI)方案,通过融合深度学习(Deep Learning, DL)和放射组学(Radiomics)特征来区分非IA和IA结节,从而提高分类性能。
数据收集与预处理
研究收集了来自两个中心的323名患者的373个经手术病理证实的GGNs。其中,205个为非IA结节(包括107个AIS和98个MIA),168个为IA结节。研究首先对CT图像进行预处理,包括使用三次样条插值算法将CT图像重采样为1mm×1mm×1mm的间距,并将图像强度归一化为0-255的范围。
结节分割
研究提出了一种基于U-Net的递归残差卷积神经网络(RRCNN)来分割GGNs。该模型通过卷积层、批归一化层和ReLU激活函数构建,并结合残差单元和递归单元来提高分割精度。分割模型使用LIDC-IDRI数据库中的257个GGNs进行训练,并通过数据增强技术(如旋转、翻转)来增加训练数据。
深度学习与放射组学特征提取
研究分别构建了基于DL和放射组学特征的分类模型。DL模型通过迁移学习方法,将分割模型的特征提取部分用于分类任务。放射组学特征模型则从CT图像中提取了1,218个放射组学特征,包括对数特征、小波特征、直方图特征、形状特征和纹理特征,并通过单变量特征选择方法筛选出最佳特征。
信息融合与分类
为了进一步提高分类性能,研究采用了信息融合方法,将DL模型和放射组学模型的预测分数进行融合。融合策略包括最大值、最小值和加权平均融合。最终,研究在独立测试数据集上评估了融合模型的性能,并与两名放射科医生进行了比较。
模型性能
融合模型在区分非IA和IA结节方面表现出色,其AUC值达到0.90 ± 0.03,显著优于单独的DL模型(AUC: 0.83 ± 0.05)和放射组学模型(AUC: 0.87 ± 0.04)。与两名放射科医生相比,融合模型的准确率达到了80.3%,高于放射科医生的表现(分别为67.7%和70.9%)。
特征分析
研究发现,对数特征在放射组学模型中起到了重要作用。通过对20个最佳特征的热图分析,发现这些特征在非IA和IA结节之间存在显著差异,表明它们具有区分能力。
本研究通过融合DL和放射组学特征,成功开发了一种基于CT图像的AI方案,能够有效区分非IA和IA结节。融合模型显著提高了分类性能,并在独立测试数据集上表现优于放射科医生。研究表明,DL和放射组学特征在预测GGNs的浸润性风险方面具有互补性,且通过迁移学习方法可以在有限数据集上构建高效的DL分类模型。
创新性方法
研究首次将DL和放射组学特征融合,开发了一种新的AI方案,显著提高了肺腺癌浸润性风险的预测性能。
有限数据集的应用
通过迁移学习方法,研究成功在有限数据集上构建了高效的DL分类模型,为未来在医学影像领域的AI研究提供了新的思路。
临床价值
该AI方案能够辅助放射科医生和胸外科医生在临床决策中更准确地识别GGNs的浸润性风险,从而优化治疗方案。
研究还探讨了不同融合策略对模型性能的影响,发现最大值融合策略能够获得最高的AUC值。此外,研究通过观察者研究验证了AI方案的临床适用性,表明其在真实临床环境中具有潜在的应用价值。
本研究为肺腺癌的早期诊断和治疗提供了重要的技术支撑,展示了AI在医学影像领域的巨大潜力。