基于增强CT的深度学习影像组学与生物学关联预测晚期非小细胞肺癌免疫治疗效果

分享自：
基于增强CT的深度学习影像组学与生物学关联预测晚期非小细胞肺癌免疫治疗效果

信息科学
人工智能
期刊:Translational Cancer ResearchDOI:10.21037/tcr-2025-aw-2287
【点击此处】阅读全文、收藏及针对性提问
这篇研究论文发表在学术期刊《Translational Cancer Research》（翻译癌症研究），由AME出版公司出版，于2026年2月10日在线发表，卷期为第15卷第2期，第81页，DOI为10.21037/tcr-2025-aw-2287。研究的主要作者包括来自南方医科大学珠江医院放射科的Jianbin Zhu（朱建斌）、Zhibo Wen（温志波），来自南方医科大学生物医学工程学院的Huaxian Shi（施华贤）、Dong Zeng（曾东），以及南方医科大学珠江医院放射科和广州中医药大学第二附属医院放射科的Zhuofeng Liang（梁卓锋）等多位研究者。Jianbin Zhu、Huaxian Shi和Zhuofeng Liang为共同第一作者，Zhibo Wen和Dong Zeng为共同通讯作者。本研究得到中国国家自然科学基金、国家重点研发计划等多个项目资助。
学术背景与目标
本研究属于医学影像学与人工智能交叉领域，具体聚焦于利用增强CT影像的放射组学（Radiomics）和深度学习（Deep Learning）特征来预测非小细胞肺癌（Non-Small Cell Lung Cancer， NSCLC）患者免疫治疗的疗效。肺癌是全球发病率和死亡率最高的恶性肿瘤，其中NSCLC是最主要的亚型。免疫检查点抑制剂（Immune Checkpoint Inhibitors， ICIs）的出现，特别是针对程序性死亡蛋白-1/程序性死亡配体-1（PD-1/PD-L1）的抗体，极大地改变了晚期NSCLC的治疗格局。然而，临床实践中一个关键挑战是并非所有患者都能从免疫治疗中长期获益。目前，虽有PD-L1表达等预测生物标志物，但其预测能力并不完善，需要更全面、非侵入性的预测工具。
传统的疗效评估方法，如实体瘤疗效评价标准（RECIST）或其免疫治疗改良版（iRECIST），存在主观性且无法充分反映肿瘤异质性。近年来，人工智能驱动的影像组学可以从医学图像中提取大量肉眼无法识别的定量特征，而深度学习则能自动学习更高级别的影像表型。然而，单纯依赖某一种特征或缺乏生物学验证限制了现有模型的普适性和解释性。因此，本研究旨在整合临床特征、基于增强CT的放射组学特征以及深度学习特征，构建一个融合列线图（Nomogram）模型，以高精度预测晚期NSCLC患者是否能从免疫治疗中获得持久临床获益（Durable Clinical Benefit， DCB）。更深层次的目标是通过整合放射基因组学数据，为模型的预测提供生物学解释，探寻影像特征背后潜在的免疫和分子机制。
研究详细工作流程
本研究是一项回顾性分析，工作流程系统且复杂，主要包括以下七个环节：
第一，研究人群与数据收集。 研究纳入了2019年10月至2024年4月期间在南方医科大学珠江医院接受免疫治疗的201名晚期NSCLC患者。纳入标准包括经活检确诊、非手术分期为III或IV期、接受以PD-1/PD-L1抑制剂为基础的免疫治疗、治疗前2周内有基线增强CT扫描以及治疗后随访扫描等。患者被随机分为训练队列（141人）和测试队列（60人）。此外，为了进行生物学机制探索，研究还从癌症影像档案馆（The Cancer Imaging Archive， TCIA）和癌症基因组图谱（The Cancer Genome Atlas， TCGA）公共数据库中补充了62名（肺腺癌27例，肺鳞癌35例）同时拥有基线CT影像和RNA测序数据的NSCLC患者，构成独立的基因组学验证队列。
第二，临床数据、影像获取与预处理。 收集了所有患者的广泛临床、病理和血液学信息，共计38个变量，包括年龄、吸烟史、转移部位、PD-L1表达水平、血红蛋白计数等。所有患者均接受了标准化的增强CT扫描。为确保特征提取的可重复性，原始CT图像进行了重采样和体素强度标准化等预处理。由两位经验丰富的放射科医生使用3D-Slicer软件手动逐层勾画治疗前增强CT图像上的原发肿瘤区域，生成三维感兴趣区域（Region of Interest， ROI）。为评估勾画的可靠性，所有ROI在两个月后由同一位医生进行了复查。
第三，特征提取与特征筛选。 * 放射组学特征提取与筛选： 从勾画好的ROI中，根据影像生物标志物标准化倡议（Image Biomarker Standardization Initiative， IBSI）的标准，使用MATLAB软件提取了94个放射组学特征，包括一阶统计量和纹理特征。首先，通过计算组内和组间相关系数（Intraclass Correlation Coefficient， ICC）剔除了ICC<0.75的15个特征以保证稳定性。随后，使用Spearman秩相关检验初步筛选出29个关键特征。最终，应用最小绝对收缩和选择算子（Least Absolute Shrinkage and Selection Operator， LASSO）回归算法进行进一步的降维和特征选择，确定了18个最具预测价值的放射组学特征，并据此计算每个患者的放射组学评分（Rad-score）。 * 深度学习特征提取与筛选： 对于每个患者，选取ROI横截面积最大的CT层面及其相邻的两个层面，共三个二维切片。将这些切片图像调整尺寸后，输入一个在ImageNet数据集上预训练的ResNet-34卷积神经网络模型。从该网络的最后一个卷积层提取高维深度学习特征，通过全局平均池化得到512维的特征向量。同样，先通过Spearman检验初筛，再使用LASSO算法从这些特征中选出最重要的特征子集，并计算深度学习评分（DL-score）。 * 融合特征构建： 结合筛选出的放射组学特征和深度学习特征，构建了融合的放射组学-深度学习特征集，并计算了融合评分（Rad-DL-score）。
第四，预测模型构建与验证。 基于上述特征，研究构建并比较了五个预测模型： 1. 临床模型： 基于单变量和多变量逻辑回归分析筛选出的显著临床变量构建。 2. 放射组学模型： 基于筛选出的18个放射组学特征构建。 3. 深度学习模型： 基于筛选出的深度学习特征构建。 4. 放射组学列线图模型： 整合显著临床变量和放射组学特征。 5. 融合模型： 整合显著临床变量、放射组学特征和深度学习特征。 所有模型均采用逻辑回归分析构建，并在训练队列中使用10折交叉验证进行优化。模型性能通过受试者工作特征曲线下面积（Area Under the Curve， AUC）、准确率、灵敏度、特异性等指标在训练和测试队列中进行评估。此外，还通过决策曲线分析（Decision Curve Analysis， DCA）评估了模型的临床实用性，并绘制了融合模型的列线图及校准曲线。为了增强模型的可解释性，研究采用了SHAP（Shapley Additive Explanations）方法来量化每个特征对单个患者预测结果的贡献。
第五，生物学机制探索。 利用来自TCGA/TCIA的62名患者的基因组学队列，研究者根据其中位Rad-DL-score将患者分为低分组和高分组。使用DESeq2软件包分析两组间的差异表达基因（Differentially Expressed Genes， DEGs）。对筛选出的显著DEGs进行基因本体论（Gene Ontology， GO）功能富集分析和京都基因与基因组百科全书（Kyoto Encyclopedia of Genes and Genomes， KEGG）通路富集分析，以探寻与高分/低分组相关的潜在生物学过程和信号通路。
第六，统计分析。 研究使用SPSS、R和Python软件进行统计分析。连续变量比较采用t检验或ANOVA，分类变量采用卡方检验或Fisher精确检验。使用DeLong检验比较不同模型AUC的差异。显著性水平设定为P<0.05。
主要研究结果
第一，临床预测因子筛选结果。 单因素和多因素逻辑回归分析确定了四个与免疫治疗持久临床获益独立相关的临床预测因子：初始疗效（治疗2-3周期后首次影像评估结果）、是否存在脑转移、PD-L1表达水平以及血红蛋白水平。其中，初始疗效展现出高特异性（84.7%）但中等敏感度（31.7%），意味着早期影像学进展的患者很可能无法获得长期获益，但早期稳定的患者中仍有一部分最终无法获益。
第二，放射组学与深度学习特征有效性。 分析显示，在训练和测试队列中，获得持久临床获益组的Rad-score、DL-score以及融合的Rad-DL-score均显著高于未获益组，证实了这些影像衍生特征与治疗结局的统计学关联。
第三，模型预测性能比较结果。 五种模型的预测性能在测试队列中得到验证。临床模型、放射组学模型和深度学习模型的AUC值分别为0.809、0.712和0.731。将临床特征与放射组学结合的列线图模型AUC提升至0.837。而最终的融合模型（整合临床、放射组学和深度学习特征）表现最佳，在训练队列和测试队列中的AUC分别达到0.843和0.894，显著优于其他单一或组合模型（经DeLong检验，P<0.05）。决策曲线分析显示，在广泛的阈值概率范围内，融合模型能提供更高的临床净获益。校准曲线和Brier分数（测试队列0.173）表明该模型具有良好的校准度。
第四，模型可解释性分析结果。 SHAP分析清晰地展示了融合模型中各特征的贡献度排名。对持久临床获益预测最重要的五个正向预测因子依次为：较高的Rad-DL-score、较高的血红蛋白水平、无脑转移、较高的PD-L1表达水平以及积极的初始治疗反应。SHAP力图为个体化预测提供了直观解释，例如展示了一个高SHAP值（0.56）的获益患者和一个低SHAP值（-0.16）的未获益患者的特征贡献分解图。
第五，生物学机制探索初步结果。 基于Rad-DL-score对基因组学队列进行分析，在低分组和高分组之间共鉴定出974个差异表达基因，其中380个上调，594个下调。GO富集分析显示，这些基因显著富集于细胞过程、免疫系统过程、细胞外区域、结合及催化活性等生物学功能类别。KEGG通路分析进一步揭示，这些基因在神经活性配体-受体相互作用、补体和凝血级联反应、胰腺分泌、雌激素信号通路等20条通路中显著富集。这些发现暗示，本研究所构建的影像学特征标签可能与肿瘤微环境中的免疫应答、免疫调节以及特定的代谢和信号传导过程存在潜在关联。
结论与意义
本研究成功开发并验证了一个基于治疗前增强CT的融合列线图预测模型。该模型整合了临床变量、放射组学特征和深度学习特征，能够以高精度（测试AUC 0.894）预测晚期非小细胞肺癌患者接受免疫治疗后能否获得持久临床获益。这为临床医生提供了一种非侵入性、个体化的决策支持工具，有助于在治疗早期筛选出更可能受益于免疫治疗的患者，优化治疗策略，避免无效治疗带来的副作用和经济负担。
更重要的是，本研究首次尝试将这种多模态影像预测模型与生物学机制相连接。通过放射基因组学分析，研究发现模型的预测评分（Rad-DL-score）与一系列涉及免疫反应和免疫调节的基因表达变化显著相关，这为影像特征的预测能力提供了潜在的生物学解释，实现了从“黑箱”预测到“可解释”生物标志物的迈进。尽管生物学验证部分基于小样本公共数据且为探索性质，但它为理解影像表型背后的分子基础开辟了新的研究方向。
研究亮点与创新
创新性的多模态融合方法： 本研究并非简单地应用放射组学或深度学习，而是创新性地将传统的放射组学手工特征、数据驱动的深度学习自动特征以及关键的临床信息三者深度融合，构建了一个性能显著优于单一特征源模型的预测工具。
优异的预测性能与临床实用性： 模型在独立测试集中达到了0.894的高AUC值，并通过列线图、决策曲线分析等形式呈现，具有良好的校准度和临床适用性，便于转化为临床实践工具。
强调模型可解释性与生物学关联： 研究不仅追求预测精度，还利用SHAP方法增强了模型决策的透明度和个体化解释。更进一步的，通过整合转录组数据，初步探索了影像学生物标志物与肿瘤免疫微环境的潜在联系，赋予了模型生物学意义，这是超越多数同类研究的重要一步。
系统且严谨的工作流程： 研究设计涵盖了从患者入组、图像标准化处理、多维度特征提取与严格筛选、多种模型构建与比较、到模型解释和生物学验证的完整闭环，方法学描述详尽，可重复性强。
明确的局限性认知与未来方向： 作者明确指出研究的局限性，如回顾性单中心设计可能带来的偏倚、手动分割的主观性、深度学习基于2D切片而非3D全肿瘤分析、以及生物学验证的初步性等，这些为未来开展前瞻性、多中心、采用3D深度学习模型和实验验证的研究指明了方向。
这项研究代表了人工智能在肿瘤精准免疫治疗应用中的一个重要进展，它不仅提供了一个高性能的预测工具，更在连接影像表型与肿瘤生物学方面做出了有价值的探索。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问