本研究由甘肃中医药大学第一临床医学院的郑小霞、郑文霞,甘肃省人民医院放射科的马娅琼、崔雅琼、黄刚,以及飞利浦临床科研部(上海)的陈杏彪共同完成,通讯作者为黄刚。该研究发表于《临床放射学杂志》2023年第42卷第7期。
本研究属于医学影像学与肿瘤免疫治疗交叉领域,聚焦于利用先进的影像技术进行无创生物标志物预测。其学术背景源于肺癌,特别是非小细胞肺癌(Non-Small Cell Lung Cancer, NSCLC)治疗的重大进展。肺癌是全球死亡率最高的癌症,其中NSCLC占比超过85%,多数患者确诊时已处于中晚期。近年来,以程序性死亡受体-1(PD-1)及其配体(PD-L1)抑制剂为代表的免疫疗法,为驱动基因阴性的晚期NSCLC患者带来了新的希望。然而,PD-L1表达水平的评估是指导免疫治疗和预后判断的关键,目前主要依赖有创的组织活检(穿刺或手术),不仅存在出血、气胸等并发症风险,且局部取样可能无法完全代表肿瘤整体的异质性。因此,开发一种无创、全面的预测方法具有重要的临床需求。影像组学(Radiomics)作为一种新兴技术,能够从医学图像中高通量提取定量特征,量化肿瘤表型及微环境信息,为精准医疗提供新途径。此外,双层探测器光谱CT(Dual-Layer Detector Spectral CT, DLCT)能够一次扫描同步生成单能谱图像及碘密度(Iodine Density, ID)、有效原子序数(Z-effective, Z-eff)、电子密度(Electron Density, ED)等多参数功能图像,提供了比常规CT更丰富的数据维度。基于此,本研究旨在探讨基于DLCT多参数图构建的影像组学模型,在预测NSCLC患者PD-L1表达水平中的价值,以期为临床免疫治疗决策提供无创、可靠的影像学依据。
本研究是一项回顾性研究,其详细工作流程严谨而系统,主要包含以下几个核心步骤:
第一步:研究对象纳入与数据准备。 研究回顾性搜集了2020年10月至2021年12月在甘肃省人民医院就诊的NSCLC患者。纳入标准严格:1)接受过DLCT胸部增强扫描且影像资料完整;2)经手术或穿刺活检病理证实为NSCLC;3)拥有免疫组化检测的PD-L1表达数据(采用SP263 assay检测,以肿瘤细胞阳性比例分数TPS≥50%为高表达,<50%为低表达)。排除标准包括:图像质量差、既往接受过抗肿瘤治疗、CT扫描与病理取样间隔超过1个月。最终共纳入110例患者。研究记录了患者的性别、年龄、吸烟史等基本信息,并收集了其最近一次血常规结果,包括白细胞(WBC)、中性粒细胞、淋巴细胞、单核细胞、血小板计数,并计算了中性粒细胞/淋巴细胞比值(NLR)、淋巴细胞/单核细胞比值(LMR)和血小板/淋巴细胞比值(PLR)。所有患者按8:2的比例随机分为训练集(88例)和测试集(22例),以确保模型构建与验证的独立性。训练集与测试集在各项基线临床和影像特征上均无显著差异,保证了分组的均衡性。
第二步:影像数据采集与处理。 所有患者均使用飞利浦iQon Spectral CT机进行扫描。扫描方案标准化:患者仰卧位,扫描范围从肺尖至肺底,采用对比剂智能追踪触发动脉期扫描,并于动脉期后30秒进行静脉期扫描。从后处理工作站导出动脉期和静脉期的单能40 keV图像以及碘密度(ID)图、有效原子序数(Z-eff)图、电子密度(ED)图,共八组图像数据(动/静脉期 × [40 keV, ID, Z-eff, ED]),用于后续分析。
第三步:常规影像学特征分析与临床模型构建。 由两位经验丰富的放射科医师(分别具有5年以上和10年以上诊断经验)在不知病理结果的情况下,独立评估病灶的常规CT征象,包括部位、形态、大小、密度、空泡、空洞、钙化、支气管充气征、分叶、毛刺、胸膜凹陷、血管集束及胸腔积液等。意见不一致时由第三位更高年资医师(15年以上经验)仲裁。同时,在训练集中,比较了PD-L1高表达组与低表达组在临床资料、外周血免疫细胞计数和常规影像征象上的差异。统计分析发现,患者年龄、白细胞计数、中性粒细胞计数、血小板计数、NLR、病灶形态以及是否存在空洞,在两组间存在统计学显著差异(P < 0.05)。将这些有差异的变量纳入二元Logistic回归分析,构建了一个用于预测PD-L1表达的临床模型。
第四步:影像组学特征提取与可重复性验证。 这是本研究的核心技术环节。首先,由一位放射科医师在ITK-SNAP软件上,基于动脉期和静脉期的单能40 keV图像,采用半自动阈值分割法对肿瘤进行三维容积感兴趣区(Volume of Interest, VOI)勾画。随后,由另一位医师审核并修改VOI。为确保特征提取的可靠性,研究进行了观察者间一致性分析:随机选取42例患者,由两位医师分别独立勾画VOI并提取特征,计算组内相关系数(ICC)。结果显示动脉期ICC为0.77,静脉期为0.84,表明特征提取具有良好的一致性。随后,将基于40 keV图像勾画的VOI,通过空间配准映射到同期的ID、Z-eff、ED图上,确保从同一解剖区域提取多参数特征。使用FAE(Feature Analysis Explorer)软件从这八组图像(动/静脉期,各四种参数图)中分别提取影像组学特征。每组图像提取的特征数量高达2050个,包括一阶统计特征(456个)、形状特征(56个)和纹理特征(1538个,涵盖灰度共生矩阵GLCM、灰度游程矩阵GLRLM、灰度大小区域矩阵GLSZM、灰度相关矩阵GLDM和邻域灰度差分矩阵NGTDM)。由于样本量有限,在特征提取前对图像进行了对数变换和局部二进制模式变换以增强特征稳定性。
第五步:特征降维、筛选与模型构建。 面对海量的特征数据(共8组×2050个=16400个初始特征,但实际按期别分别建模),研究采用了一系列严谨的机器学习流程。首先,为消除训练集样本类别不平衡的影响,使用了合成少数过采样技术(SMOTE)进行数据平衡。接着,对特征矩阵进行Z-score标准化。然后,采用主成分分析(PCA)对高维特征进行降维处理,将特征转换为一组相互独立的主成分。在训练集上,分别对动脉期和静脉期降维后的特征,采用Kruskal-Wallis检验和多变量方差分析(ANOVA)进行特征筛选,最终从动脉期筛选出2个主成分特征,从静脉期筛选出9个主成分特征。这些筛选出的特征在PD-L1高、低表达组间差异显著,且彼此间相关性低。基于筛选出的特征,分别构建了动脉期模型(使用高斯过程分类器)和静脉期模型(使用Ada-Boost分类器)。最后,将动脉期和静脉期模型的预测结果进行二元Logistic回归融合,构建出最终的“影像组学模型”。此外,还将影像组学模型与前述的临床模型(基于临床和常规影像特征)进一步融合,构建了“联合模型”。
第六步:模型验证与效能评估。 使用受试者工作特征(ROC)曲线及其曲线下面积(AUC)作为主要指标,评估临床模型、影像组学模型和联合模型在训练集和独立测试集中预测PD-L1表达(高 vs. 低)的效能。同时计算了模型的敏感度、特异度、阳性预测值、阴性预测值和准确性。并通过DeLong检验比较不同模型AUC的差异。
本研究取得了一系列明确且具有价值的结果。
在临床特征分析方面,训练集数据显示,PD-L1高表达患者相比低表达患者,年龄更轻,外周血白细胞计数、中性粒细胞计数、血小板计数和NLR更高,且病灶更常表现为类圆形(而非圆形或不规则形)并更容易出现空洞。这些发现为理解PD-L1表达与宿主免疫状态、肿瘤形态之间的关联提供了线索,并构成了临床模型的基础。
在模型预测效能方面,结果非常显著: 1. 临床模型:在训练集上表现出较好的预测能力,AUC为0.867,敏感度0.833,特异度0.859。然而,在独立测试集上其效能大幅下降,AUC仅为0.547,表明仅依靠临床和常规影像特征构建的模型泛化能力较弱,稳定性不足。 2. 影像组学模型:表现优异。在训练集上AUC高达0.976,敏感度0.917,特异度0.906;在独立测试集上依然保持了极高的效能,AUC为0.958,敏感度1.000,特异度0.875。这证明基于DLCT多参数图提取的深层影像组学特征,能够非常有效地捕捉到与PD-L1表达状态相关的肿瘤内在异质性信息,且模型具有强大的泛化能力。 3. 联合模型:整合了影像组学特征与有统计学意义的临床、血液及常规影像特征,达到了最佳的预测性能。在训练集上AUC为0.984,在测试集上AUC进一步提升至0.979,且敏感度和特异度均保持在极高水平(测试集:敏感度1.000,特异度0.937)。统计比较显示,联合模型和影像组学模型的AUC均显著高于临床模型(P < 0.05),但联合模型与影像组学模型之间的AUC差异无统计学意义(P = 0.455)。这表明影像组学特征提供了最主要的预测力,而临床特征的加入带来了小幅但非统计显著的提升。
这些结果逻辑连贯:首先,通过单因素分析筛选出与PD-L1表达相关的临床变量;其次,通过复杂的影像组学流程从多参数CT图像中挖掘出蕴含丰富生物信息的定量特征;最终,将两类信息融合建模。结果表明,基于DLCT的影像组学特征具有超越传统临床指标的强大预测能力,且所构建的模型在独立数据集中得到了有效验证,证实了其可靠性。
本研究的结论明确:基于双层探测器光谱CT多参数图(单能40 keV、碘密度、有效原子序数、电子密度图)构建的影像组学模型,能够有效、无创地预测非小细胞肺癌的PD-L1表达水平。结合了影像组学与临床-形态学特征的联合模型,能获得更高的预测效能。这为临床评估NSCLC患者的免疫状态、指导免疫治疗决策及预后评估提供了重要的影像学依据。
本研究的价值体现在多个层面。在科学价值上,它成功地将先进的光谱CT技术与影像组学方法相结合,探索了肿瘤功能影像参数与免疫微环境生物标志物(PD-L1)之间的深层关联,拓宽了影像组学在肿瘤免疫学中的应用边界。在应用价值上,该研究提出了一种潜在的、无创的PD-L1表达预测方法,有望减少对有创活检的依赖,辅助临床医生更全面、便捷地评估肿瘤免疫状态,推动个体化精准免疫治疗的实施。特别是对于无法获取足够组织样本或活检有风险的患者,该方法具有重要的补充价值。
本研究的亮点突出:首先,研究目标具有重要的临床前沿性,直击NSCLC免疫治疗中PD-L1检测的痛点。其次,方法学上具有创新性与系统性:① 采用了新型的双层探测器光谱CT,充分利用其一次扫描同步获取多参数功能图像的优势,提供了比常规CT更丰富的定量信息源。② 影像组学分析流程完整且严谨,涵盖了图像分割、特征提取、可重复性验证、特征降维与筛选、机器学习建模及独立测试集验证等多个关键环节,确保了结果的可靠性。③ 不仅构建了纯影像组学模型,还探索了与临床-形态学特征结合的联合模型,体现了多维度信息整合的思路。最后,研究结果令人鼓舞,所构建的影像组学模型在独立测试集上表现出接近0.96的极高AUC,证明了该方法的强大预测能力和良好的泛化潜力,为后续前瞻性研究和临床转化奠定了坚实基础。
此外,研究中还有一些有价值的细节。例如,研究特别关注了外周血免疫细胞计数与PD-L1表达的关系,发现高表达组具有更高的系统性炎症指标(如NLR),这提示全身免疫炎症状态可能与肿瘤局部免疫微环境存在关联。在技术细节上,研究使用了特定的单能级图像(40 keV)进行病灶分割,该能级图像通常具有更高的对比噪声比,有利于更准确地勾画肿瘤边界。这些细节都体现了研究的周密性和深度。