本文的研究由Tafadzwa L. Chaunzwa, Ahmed Hosny, Yiwen Xu, Andrea Shafer, Nancy Diao, Michael Lanuti, David C. Christiani, Raymond H. Mak 和 Hugo J. W. L. Aerts共同完成,分别隶属于Massachusetts General Hospital (MGH)、Dana Farber Cancer Institute, Brigham and Women’s Hospital, Harvard Medical School等机构。文章发表在 Scientific Reports 期刊上,其出版时间为2021年,DOI: https://doi.org/10.1038/s41598-021-84630-x。
该研究属于医学图像分析领域,聚焦于非小细胞肺癌(NSCLC)的组织学分类问题。肺癌是癌症相关死亡的主要原因,其中超过80%的原发性肺癌被归类为非小细胞肺癌,包括腺癌(adenocarcinoma, ADC)和鳞状细胞癌(squamous cell carcinoma, SCC)。当前的标准诊断方法依赖于病理学家的组织样本评估,但这种方法因肿瘤异质性(inter- and intra-tumor heterogeneity)以及样本局限性而存在不足。此外,分子检测能够提供重要的信息,但高耗成本和技术门槛限制了其普及。因此,结合非侵入性影像数据的计算机辅助诊断(CADx)成为潜在的解决方案,尤其是深度学习方法在影像学分析中的发展为组织学分类提供了可能性。
本研究旨在通过利用深度学习算法和放射组学(radiomics)技术,从临床常规获取的CT影像中预测NSCLC的主要组织学亚型(ADC和SCC)。通过非侵入性方法建立可靠的病理分类器,为肿瘤表型识别提供支持,并探索如何增强现有诊断方案。
本研究通过多步骤实验设计,结合深度学习和传统机器学习方法,从CT影像中提取肿瘤特征并进行组织学分类。以下为具体研究流程的详细描述:
数据采集与选择
影像预处理
深度卷积神经网络(CNN)的训练
基于特征的分类分析
结果分析与模型评估
深度卷积神经网络分类表现
基于CNN特征的分类性能
模型解释性
对异质测试集的预测
该研究证明了深度学习和放射组学技术能够从非侵入性CT影像中预测NSCLC的主要组织学类型,并在数据异质性下表现出一定的鲁棒性。研究表明,这种基于深度学习的影像组学方法能够捕捉病理表型信息,并且模型的敏感性和特异性能够为临床计算辅助诊断提供保障价值。
本研究提供了非侵入性肿瘤分类的概念验证,其方法可以为病理诊断提供辅助,与传统方法形成有机补充。研究的亮点包括: 1. 实现了从CT影像中提取量化特征并高效分类常见的NSCLC组织学亚型。 2. 所用的轻量级影像预处理策略和深度学习架构减少了对人工标注和精确分割的依赖。 3. 研究使用了广泛可用的临床队列数据,同时验证了模型在独立数据集上的适用性。
未来研究应关注更大规模的多中心数据库,以进一步验证模型的外部可推广性,同时探索如何将这些非侵入性影像组学工具用于指导个体化治疗决策,并与液体活检等方法结合,为精确医学提供全方位支持。