本研究由Chen Sun、Chenggang Jiang、Xi Wang、Shunchang Ma、Dainan Zhang和Wang Jia等作者共同完成,主要来自北京天坛医院神经外科和首都医科大学。该研究于2024年12月发表在《Academic Radiology》期刊上,题为“MR-based radiomics predicts CDK6 expression and prognostic value in high-grade glioma”。
本研究属于医学影像学和肿瘤学交叉领域,重点关注高级别胶质瘤(High-Grade Glioma, HGG)的预后评估和分子标志物预测。胶质瘤是最常见的原发性脑肿瘤,占所有恶性中枢神经系统肿瘤的约80%。高级别胶质瘤(WHO III-IV级)恶性程度高,预后差,现有的临床病理特征和影像学检查手段难以满足精准医学的需求。因此,探索新的预后标志物和个体化治疗方案具有重要意义。
细胞周期蛋白依赖性激酶6(Cyclin-Dependent Kinase 6, CDK6)在多种癌症中过度表达,与肿瘤细胞的增殖和凋亡抑制密切相关。CDK6已被证明是癌症治疗的潜在靶点,但其表达水平的检测通常需要新鲜组织或石蜡包埋样本的测序,成本高且受采样位置影响。近年来,基于人工智能的影像组学(Radiomics)技术逐渐应用于肿瘤诊断和预后评估,能够通过非侵入性手段获取大量影像参数,反映肿瘤特征。
本研究的目的是评估CDK6表达水平在高级别胶质瘤中的预后价值,并建立基于机器学习的影像组学模型,预测CDK6的表达水平。通过结合临床参数、基因组数据和影像组学特征,研究旨在为非侵入性预测CDK6表达提供新方法,并探索其与免疫微环境的关系。
本研究分为多个步骤,包括数据收集、预后分析、影像组学特征提取、模型构建和验证等。
数据来源与处理
研究从癌症基因组图谱(The Cancer Genome Atlas, TCGA)数据库中提取了310名高级别胶质瘤患者的临床参数和基因组数据,并从分子脑肿瘤数据存储库(Repository of Molecular Brain Neoplasia Data, Rembrandt)数据库中获取了27名患者的数据。影像数据来自癌症影像档案(The Cancer Imaging Archive, TCIA)数据库(n=82)和Rembrandt数据库(n=27)。所有数据均经过匿名化处理,符合伦理要求。
预后分析
使用单变量和多变量Cox回归分析以及Kaplan-Meier生存分析评估CDK6表达水平与患者预后的关系。通过Spearman相关分析评估CDK6与免疫细胞浸润的相关性。研究还进行了基因本体论(Gene Ontology, GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析,探索CDK6高表达组和低表达组之间的差异基因功能。
影像预处理与肿瘤分割
影像数据经过N4偏置场校正和重采样处理,肿瘤轮廓由经验丰富的神经外科医生在ITK-SNAP平台上手动勾画。为确保特征稳定性,研究计算了20名患者的组内相关系数(Intraclass Correlation Coefficient, ICC),筛选出ICC值≥0.75的特征。
影像组学特征提取与选择
使用PyRadiomics软件从每位患者中提取了107个影像组学特征,包括形状特征、一阶强度特征和二阶纹理特征。通过最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator, LASSO)算法筛选出最优特征,最终选择了三个关键特征用于模型构建。
模型构建与验证
使用逻辑回归(Logistic Regression, LR)和支持向量机(Support Vector Machine, SVM)算法构建影像组学模型,预测CDK6表达水平。模型在训练队列中进行了10折交叉验证,并通过ROC曲线、校准曲线和决策曲线分析(Decision Curve Analysis, DCA)评估其预测性能。最终选择LR模型作为最优模型,并在独立测试队列中验证其性能。
影像组学评分与列线图构建
基于LR模型生成影像组学评分(Radiomics Score, RS),并通过Kaplan-Meier生存分析评估RS与患者预后的关系。研究还构建了基于RS的列线图,预测患者1年、3年和5年的生存概率。
CDK6表达与预后
CDK6在高级别胶质瘤组织中显著过表达,且与较低的总生存期(Overall Survival, OS)相关。在TCGA队列中,CDK6高表达组的中位生存时间为18.13个月,低表达组为51.57个月。Kaplan-Meier曲线显示,CDK6高表达与较差的OS显著相关(p<0.001)。多变量Cox回归分析表明,CDK6高表达是高级别胶质瘤患者生存的独立预后因素(HR=1.507, p=0.021)。
免疫浸润与基因富集分析
CDK6表达与M0巨噬细胞、滤泡辅助T细胞(Tfh)等免疫细胞浸润呈显著正相关,与单核细胞、自然杀伤细胞(NK细胞)等呈负相关。GO和KEGG富集分析显示,CDK6高表达组和低表达组之间的差异基因显著富集于有丝分裂姐妹染色体分离和DNA复制等通路。
影像组学模型性能
LR模型在训练队列中的AUC为0.810,10折交叉验证后的AUC为0.784,测试队列中的AUC为0.750。校准曲线和DCA显示模型具有良好的预测性能和临床实用性。基于RS的列线图在预测1年、3年和5年生存概率时的AUC分别为0.769、0.815和0.780。
本研究首次评估了CDK6表达在高级别胶质瘤中的预后价值,并建立了基于CE-T1WI序列的影像组学模型,能够非侵入性预测CDK6表达水平。影像组学评分(RS)和列线图为高级别胶质瘤患者的预后评估提供了有效工具,具有重要的临床应用价值。
研究还探讨了CDK6表达与免疫微环境的关系,发现其与多种免疫细胞的浸润显著相关,为进一步研究CDK6在肿瘤免疫逃逸中的作用提供了线索。此外,研究还提出了未来可以结合更多MRI序列(如T2加权成像和扩散加权成像)以提高模型预测性能的建议。