该研究题为《Combining radiomics and deep learning features of intra-tumoral and peri-tumoral regions for the classification of breast cancer lung metastasis and primary lung cancer with low-dose CT》,由Lei Li、Xinglu Zhou、Wenju Cui、Yingci Li、Tianyi Liu、Gang Yuan、Yunsong Peng和Jian Zheng等人共同完成。这些研究人员分别来源于多个机构,包括中国科学技术大学生物医学工程学院(苏州)、哈尔滨医科大学癌症医院PET/CT中心、哈尔滨医科大学第二附属医院、贵州省人民医院等。本研究于2023年8月29日在《Journal of Cancer Research and Clinical Oncology》上在线发表。
乳腺癌是女性中最常见的恶性肿瘤之一,其远处转移是乳腺癌患者主要死亡原因之一。肺转移是乳腺癌最常见的远处转移部位之一,且乳腺癌肺转移(breast cancer lung metastasis, BCLM)和原发性肺癌(primary lung cancer, PLC)的治疗方法和预后差异较大。然而,乳腺癌患者中超过40%的肺部结节被诊断为PLC,其诊断存在较大挑战,准确区分BCLM和PLC对于优化治疗方案至关重要。
低剂量计算机断层扫描(low-dose computed tomography, LDCT)是肺癌筛查的常用影像学方法,可以显著降低肺癌死亡率。然而,仅凭LDCT影像诊断BCLM和PLC仍然面临困难。近年来,放射组学(radiomics)及深度学习技术的发展为肿瘤影像分析提供了新手段。放射组学可以从医学影像中提取高通量量化特征,而深度学习通过卷积神经网络直接提取更加复杂的特征。已有研究显示,将这两种方法结合能更深层次地挖掘影像信息。
另外,研究表明,肿瘤周围微环境对肿瘤的发生、进展和转移具有重要作用。因此,肿瘤内部区域(intra-tumoral region, ITR)与肿瘤周围区域(peri-tumoral region, PTR)的综合分析可以更全面地反映肿瘤的转移特性。基于此,本研究提出一种结合ITR和PTR影像特征的融合模型,旨在挖掘放射组学和深度学习的互补优势,开发一种非侵入性且高准确度的诊断方法用于区分BCLM和PLC。
1. 研究对象与数据收集
研究共纳入158名有乳腺癌病史并表现肺部病变的女性患者。病人数据来源于2011年1月1日至2020年11月30日在哈尔滨医科大学肿瘤医院内接受的LDCT检查。其中符合入选标准的病例有100例,其中60例为BCLM,40例为PLC。研究对象的年龄分布在32岁至82岁之间。
2. LDCT扫描与ROI的分割
LDCT扫描采用GE多层螺旋CT设备进行,参数包括120kV管电压、50 mAs管电流和1 mm切片厚度。研究中的感兴趣区域(Region of Interest, ROI)由两位经验丰富的放射科医生独立划定,并通过ITK-SNAP软件手动绘制。ROI包括ITR(肿瘤内部区域)和PTR(通过将ITR扩展5 mm获得的肺实质环区域)。每一患者的ITR和PTR图像特征均被提取。
3. 放射组学特征提取与处理
研究使用开源工具包PyRadiomics,从ITR和PTR分别提取了851种放射组学特征,包括一阶特征、形态特征、纹理特征、以及小波(wavelet)特征。通过Spearman相关性检验和LASSO(Least Absolute Shrinkage and Selection Operator)方法对提取的特征进行选择,构建线性判别分析(Linear Discrimination Analysis, LDA)分类器。研究不仅建立了基于单一区域(如ITR或PTR)的放射组学模型,还融合了ITR和PTR的特征,开发了多区域放射组学模型。
4. 深度学习特征提取
深度学习方面,研究采用ResNet18模型提取ITR和PTR的影像特征,同时搭建了多输入残差网络(multi-input residual network),结合ITR和PTR特征。CT图像预处理步骤包括窗口宽度和窗口水平调整、最小-最大归一化处理,以及基于最大横截面区域的截面切片。研究还通过迁移学习技术实现深度学习特征提取。
5. 特征融合与模型构建
研究提出了一种特征融合模型(Fusion Model, MR_DL + RAD),将ITR和PTR的深度学习特征与放射组学特征结合,用于区分BCLM和PLC。特征融合通过多层网络完成,以增强分类性能。
6. 统计分析
模型采用五折交叉验证评估其稳定性和分类性能。通过受试者操作特征曲线(ROC Curve)和曲线下面积(Area Under Curve, AUC)评估模型性能,并使用DeLong方法比较模型间性能差异。
1. 样本分析结果
BCLM和PLC患者在年龄以及病变最大直径方面没有显著差异(p=0.154),其中BCLM组肿瘤直径范围为0.6-5.8 cm,而PLC组范围为1.3-9.2 cm。
2. 模型分类性能
融合模型(MR_DL + RAD)的分类性能优于其他单一特征模型。其AUC值达到0.913(95% CI:0.840–0.960),显著高于ITR或PTR的单区域模型。
3. 深度学习与放射组学对比
融合深度学习和放射组学特征的模型表现优于仅用单一区域特征的模型。例如,在ITR区域的分类中,融合模型的AUC为0.894,而单独深度学习模型为0.811,单独放射组学模型为0.798。
4. 多区域特征分析
基于ITR和PTR构建的多区域特征模型表现最佳,其AUC为0.887,显著提升了分类性能。
本研究首次开发了基于LDCT图像的多区域多特征融合模型,用于区分乳腺癌肺转移和原发性肺癌。研究表明,融合模型能够显著提高分类性能,其综合利用了肿瘤内部和周围区域的特征,为临床非侵入式诊断提供了新思路。
该研究的科学意义在于拓宽了放射组学与深度学习的结合应用领域,同时强调了肿瘤周围微环境在疾病分类中的重要性。在应用价值上,该模型有助于实现精准医学目标,改善乳腺癌相关肺病变患者的诊断和治疗效果。
虽然研究结果令人鼓舞,但样本量较小可能限制研究的推广性;另外,模型需要纳入更多患者的临床信息以进一步优化。此外,本研究的ROI分割主要通过人工进行,未来可探索自动分割技术的应用及其对模型性能的影响。
总体而言,此研究为BCLM和PLC的诊断提供了新的技术手段,具有成为临床辅助诊断工具的潜力。