分享自:

基于深度放射组学预测非小细胞肺癌新辅助免疫化疗病理反应的回顾性多中心研究

期刊:Frontiers in ImmunologyDOI:10.3389/fimmu.2026.1770042

关于《深度影像组学预测非小细胞肺癌新辅助免疫化疗病理学缓解能力:一项回顾性多中心研究》的学术报告

一、 研究团队与发表信息

本研究由来自中国多家机构的学者合作完成。第一作者为叶元欣(Yuanxin Ye)、田雨池(Yuchi Tian)和王玲玲(Lingling Wang),他们与席子涵(Zihan Xi)、张阳帆(Yangfan Zhang)、周彤(Tong Zhou)、赵振华(Zhenhua Zhao)、郑一峰(Yifeng Zheng)共同贡献了此项工作。通讯作者为梁晓云(Xiaoyun Liang,来自东软医疗系统有限公司研究与临床创新研究所)和蒋海涛(Haitao Jiang,来自浙江省肿瘤医院放射科)。该研究于2026年2月27日发表在开放获取期刊《Frontiers in Immunology》(免疫学前沿)上,文章标题为“The capability of deep-radiomics to predict pathological response to neoadjuvant immunochemotherapy in non–small cell lung cancer: a retrospective multicenter study”。

二、 学术背景与研究目的

本研究属于医学影像人工智能与肿瘤治疗响应预测的交叉领域,具体聚焦于非小细胞肺癌(Non–Small Cell Lung Cancer, NSCLC)的精准医疗。肺癌是全球癌症相关死亡的主要原因,其中NSCLC约占所有病例的80%。新辅助免疫化疗(Neoadjuvant Immunochemotherapy, NIT)——即在手术前联合使用免疫检查点抑制剂(Immune Checkpoint Inhibitors, ICIs)和化疗——已成为改善可切除NSCLC患者生存前景的极具潜力的策略。治疗后的病理完全缓解(Pathological Complete Response, PCR),即术后病理检查中肿瘤细胞完全消失,已被证实是长期生存的强有力替代终点。

然而,当前临床实践面临一个关键挑战:PCR状态只能在术后通过病理检查确定,缺乏有效的术前无创预测手段。传统的影像学评估(如基于肿瘤大小的RECIST标准)在评估免疫治疗疗效时可能不准确。虽然一些生物标志物(如肿瘤突变负荷、PD-L1表达)与治疗反应相关,但活检存在空间和时间异质性的局限。因此,开发一种能够术前无创、准确预测NIT后PCR状态的方法,对于避免无效治疗、及时调整策略、实现个体化治疗具有重大临床价值。

近年来,医学影像分析技术,特别是影像组学(Radiomics)和深度学习(Deep Learning),为挖掘医学图像中蕴含的超出人眼识别范围的定量信息提供了强大工具。影像组学可以从CT等图像中提取大量高通量特征,描述肿瘤的异质性等特性。Δ-影像组学(Delta-radiomics)则通过分析治疗前后特征的变化,捕捉肿瘤的动态演变。深度学习,尤其是卷积神经网络(Convolutional Neural Networks, CNNs),能够自动学习图像中复杂的深层模式。

尽管已有研究分别应用影像组学或深度学习预测治疗反应,但本研究指出,尚未有研究探索将Δ-影像组学、深度学习特征与临床特征相结合,用于预测NSCLC患者NIT后的PCR。因此,本研究旨在填补这一空白,开发并验证一个创新的预测模型,该模型融合了Δ-影像组学、深度学习及临床特征,以期更全面、更准确地实现NIT后PCR的术前无创预测。

三、 详细研究流程

本研究是一项回顾性多中心研究,其工作流程系统而严谨,主要包括以下几个核心环节:

  1. 患者队列与数据收集:研究从三家中国医院(浙江省肿瘤医院、绍兴市人民医院、湖州市中心医院)回顾性收集了2018年5月至2022年11月期间接受NIT并手术的NSCLC患者。最终共纳入178例患者。纳入标准包括:接受2-4周期NIT、治疗前后均有增强CT影像、术后病理报告明确描述病理缓解情况。排除标准包括:既往接受过其他抗肿瘤治疗、影像扫描与治疗/手术间隔时间过长、或存在影响图像分割的伪影等。患者被分为三组:来自浙江省肿瘤医院的102例患者按7:3随机分为训练队列(102例)和内部测试队列(44例);来自另外两家医院的32例患者合并为外部测试队列,用于验证模型的泛化能力。本研究获得了伦理委员会批准。

  2. 影像数据获取与肿瘤分割:收集所有患者两个时间点的胸部增强CT图像:NIT治疗前(基线CT)和治疗后、手术前(术前CT)。由两位具有十年以上经验的放射科医生使用3D Slicer软件,在肺窗图像上对目标肿瘤病灶进行半自动三维分割,勾画感兴趣体积(Volume of Interest, VOI)。若存在多发病灶,则选择最大的作为目标病灶。为确保可重复性,随机选择30例病例在3个月后重新勾画,并使用组内相关系数(Intraclass Correlation Coefficient, ICC)评估特征提取的一致性(ICC > 0.75视为一致性良好)。

  3. 特征提取:这是本研究方法学的核心,涉及多维度特征挖掘。

    • 影像组学特征提取:使用Python的PyRadiomics包,从治疗前和治疗后的肿瘤VOI中分别提取了1037个影像组学特征,构成“治疗前”和“治疗后”特征集。在此基础上,进一步计算了三类Δ-影像组学特征集:Δ1(治疗后特征值 - 治疗前特征值,绝对变化)、Δ2((治疗后-治疗前)/治疗前,百分比变化)、Δ3((治疗后-治疗前)/(治疗前*免疫周期数),每周期平均百分比变化)。
    • 深度学习特征提取:本研究采用预训练的3D ResNet-18模型来提取深度学习特征。关键创新点在于,网络的输入并非整张CT切片,而是基于分割出的肿瘤VOI边界框裁剪出的三维肿瘤区域。这些区域被统一缩放到128×128×32的尺寸后输入网络。特征从最终的全局平均池化层获取,为每个样本生成一个512维的特征向量。在微调过程中,未使用数据增强,以保持临床影像模式的完整性。
    • 临床特征收集:从病历中回顾性收集了包括年龄、性别、吸烟史、病理类型、临床分期、免疫治疗药物类型、治疗周期数、血清肿瘤标志物(如CEA、CYFRA21-1等)以及基于iRECIST标准的影像学评估结果。
  4. 特征选择与模型构建:针对提取的海量特征,研究采用了严格的降维和选择流程以防止过拟合。首先,对所有特征进行标准化。为解决训练队列中PCR与非PCR样本的不平衡问题,仅在训练集内应用了合成少数类过采样技术(Synthetic Minority Over-sampling Technique, SMOTE),测试集则使用原始真实数据以避免数据泄露。接着,剔除零方差及高相关性(Spearman相关系数>0.8)的特征。然后,采用最大相关最小冗余(Maximum Relevance and Minimum Redundancy, MRMR)算法筛选出前30个最具预测性的特征。最后,使用最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator, LASSO)回归进一步压缩特征,并利用5折交叉验证确定最佳正则化参数。以筛选出的最终特征,构建逻辑回归分类器,预测PCR状态。模型预测的概率值分别被称为Rad-score(来自影像组学模型)和Deep-score(来自深度学习模型)。

  5. 联合模型构建:研究构建了多个层次的模型进行比较。首先,分别构建了基于治疗前、治疗后影像组学特征以及三种Δ-影像组学特征的单一模型。随后,将表现最佳的治疗后影像组学特征与Δ1特征结合,构建了“联合模型1”。最后,将Rad-score(源自联合模型1)、Deep-score以及单因素分析中有显著意义的临床特征(本研究确定为iRECIST)进行整合,通过多因素逻辑回归构建了最终的“联合模型2”(临床-深度-影像组学联合模型)。

  6. 统计分析:使用SPSS和R软件进行统计分析。使用受试者工作特征曲线下面积(Area Under the ROC Curve, AUC)作为评估模型性能的主要指标,并计算了准确率、敏感性、特异性等指标。此外,还使用了决策曲线分析(Decision Curve Analysis, DCA)来评估模型的临床实用性。为了解释模型,研究采用了SHAP(Shapley Additive Explanations)方法,量化每个特征对单个预测结果的贡献,增强了模型的可解释性。

四、 主要研究结果

  1. 患者特征:共178例患者入组,训练、内部测试、外部测试队列的PCR率分别为37.3%、47.7%和34.4%。各队列在年龄、病理类型及部分血清标志物上存在统计学差异,这体现了真实世界数据的异质性,也凸显了外部测试的重要性。

  2. 临床因素分析:在单因素和多因素分析中,仅iRECIST评估结果在PCR与非PCR组间显示出显著差异(p=0.007),而年龄、性别、血清肿瘤标志物等在本研究队列中未显示独立预测价值。这提示传统临床指标预测NIT疗效的局限性。

  3. 单一模型性能

    • 常规影像组学模型:治疗后影像组学模型的预测性能(训练集AUC=0.825;内部测试集AUC=0.832)显著优于治疗前模型(AUC=0.5150.619)。这符合临床直觉,即治疗后图像直接反映了早期治疗效应。
    • Δ-影像组学模型:在三种Δ特征模型中,基于绝对变化的Δ1模型表现最佳(训练集AUC=0.942;内部测试集AUC=0.810),优于Δ2和Δ3模型。这表明治疗前后特征的绝对差异比相对变化更能有效捕捉与PCR相关的生物学改变。
    • 深度学习模型:基于3D ResNet-18提取的特征所构建的模型也表现出色,在训练集和内部测试集的AUC分别为0.832和0.818。
  4. 联合模型性能

    • 联合模型1(影像组学内部联合):整合了表现最佳的治疗后和Δ1影像组学特征,性能得到提升,训练集和内部测试集AUC分别为0.939和0.849。
    • 联合模型2(多模态融合):这是本研究的核心成果。该模型融合了Rad-score、Deep-score和iRECIST临床特征。其在所有模型中取得了最佳且稳健的预测性能:训练集AUC为0.955,内部测试集AUC为0.882,外部测试集AUC为0.839。决策曲线分析也表明,该模型在广泛的阈值概率范围内具有更高的临床净收益。
  5. 结果解释与生物学意义

    • 小提琴图显示,应答者(PCR组)的Rad-score和Deep-score分布显著高于非应答者,直观证明了这些评分作为预测因子的潜力。
    • 通过SHAP分析对联合模型2进行解释,发现Rad-score和Deep-score是驱动模型预测的最重要特征。这证实了影像衍生物征的核心贡献。
    • 文章进一步分析了影响Rad-score的关键Δ1特征,并尝试解释其潜在的生物学意义。例如,delta1-log-sigma-5-mm-3d_firstorder_minimum特征值的降低可能反映了治疗后肿瘤低密度区域(如坏死)的增加;delta1-wavelet-lhh_glcm_clustershade的降低可能意味着纹理复杂性和肿瘤异质性的减少。这些变化都与积极的治疗反应相关。Deep-score则可能反映了深度学习模型从图像中自动识别的、与肿瘤增殖、免疫细胞浸润或纤维化等微观环境变化相关的高级语义形态学改变。

五、 研究结论与价值

本研究成功开发并验证了一个创新的多模态预测模型,该模型通过融合Δ-影像组学、深度学习特征及临床信息,能够术前无创、准确地预测NSCLC患者接受新辅助免疫化疗后的病理完全缓解。

  • 科学价值:研究证实,将反映肿瘤治疗前后动态变化的Δ-影像组学、能够捕捉复杂高级语义模式的深度学习以及临床评估进行整合,可以提供互补的信息,显著提升预测性能。这为利用多维度影像信息理解肿瘤微环境在免疫治疗下的时空演化提供了新范式。
  • 应用价值:该模型作为一种潜在的、易于实施的决策辅助工具,可帮助临床医生在手术前更准确地识别可能从NIT中获益极大(达到PCR)的患者,以及那些可能疗效不佳的患者。这有助于指导个体化治疗决策,例如对预测为PCR的患者采取更积极的手术或随访策略,而对预测为非PCR的患者则考虑调整治疗方案,从而避免无效治疗带来的毒副作用和经济负担,优化医疗资源分配。

六、 研究亮点

  1. 首创性的多模态融合策略:本研究是首批探索将Δ-影像组学与深度学习特征相结合,用于预测NSCLC新辅助免疫化疗疗效的研究之一。这种融合同时捕捉了肿瘤异质性的时间演变(通过Δ-影像组学)和深层的形态学转变(通过深度学习),提供了更全面的肿瘤时空表征。
  2. 严谨的方法学与验证:研究采用了严格的特征选择流程(MRMR + LASSO),并明确区分了训练、内部测试和独立外部测试队列,有效避免了过拟合,证明了模型的泛化能力。使用SHAP进行模型解释,增强了这个“黑箱”AI模型的可信度和临床可接受度。
  3. 聚焦前沿临床问题:研究直接针对当前肺癌新辅助免疫治疗领域的热点与难点——术前疗效预测,具有明确的临床导向性和重要的现实意义。
  4. 技术细节创新:在深度学习特征提取阶段,创新性地使用肿瘤分割后的三维区域(而非整个切片)作为网络输入,使模型更专注于肿瘤本身,减少了背景噪声干扰。

七、 其他有价值内容

研究也坦诚地指出了其局限性:1)样本量相对有限,尤其是外部验证队列;2)回顾性研究设计可能存在选择偏倚;3)研究主要关注短期终点(PCR),未来需要扩大样本量、进行前瞻性研究,并探索模型对长期生存结局(如无事件生存期、总生存期)的预测价值。这些为后续研究指明了方向。此外,补充材料中提供了详细的特征列表、模型构建流程图以及更深入的讨论,丰富了研究内容。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com