乳腺癌治疗反应的多组学机器学习预测模型

分享自：
乳腺癌治疗反应的多组学机器学习预测模型

生物医学工程
医学
期刊:natureDOI:10.1038/s41586-021-04278-5
【点击此处】阅读全文、收藏及针对性提问
报告这篇文章属于类型a，并报道了一项原创研究。以下是基于文章内容撰写的学术报告。
研究的主要作者与机构，以及发表信息这项研究的主要作者包括 Stephen-John Sammut、Mireia Crispin-Ortuzar、Suet-Feung Chin、Elena Provenzano 等，分别隶属于诸多国际知名研究机构，如 Cancer Research UK Cambridge Institute、University of Cambridge、Peter MacCallum Cancer Centre 等。文章发表于顶级学术期刊《Nature》上，具体期号为 Vol 601，发布日期为 2022 年 1 月 27 日。
研究背景这项研究聚焦于乳腺癌的治疗应答预测领域，研究团队旨在通过整合多组学数据，运用机器学习模型预测接受新辅助治疗（neoadjuvant therapy，术前化疗或靶向治疗）乳腺癌患者的治疗反应。乳腺癌被认为是复杂的“生态系统”，其组成既包括恶性细胞，也包括肿瘤微环境（tumour microenvironment）的各种成分，如基质细胞、血管细胞及免疫细胞。此类肿瘤生态系统及其内部相互作用被认为显著影响患者对治疗的反应。然而，现有的临床预测方法（例如通过临床风险分层进行患者选择）仍依赖传统经验，未能充分吸纳这些复杂信息，预测精准度较低。因此，研究团队提出，必须综合考虑肿瘤生态系统的多维特征，开发更加准确的预测模型。
研究流程研究团队通过多个阶段的实验，全面地从临床特征、基因组信息、转录组信号以及数字病理数据等多个方面，探讨新辅助治疗反应的预测方法。
研究对象的招募与分组
 研究中共招募了 180 名早期或局部晚期乳腺癌患者，最终纳入分析的样本数量为 168 名。这些患者在接受手术前，均进行了乳腺肿瘤的核心活检，并接受了长达 18 周的术前治疗（化疗或联合抗 HER2 靶向治疗）。
 肿瘤亚型涵盖乳腺癌的主要分型：HER2 阳性、ER 阳性 HER2 阴性、ER 阴性 HER2 阴性。术后，所有患者的治疗应答通过“残留癌负荷（residual cancer burden，RCB）”分类系统进行评估。
样本采集与处理
 在治疗前的核心活检样本中，提取 DNA 和 RNA 进行以下组学分析：浅层全基因组测序（shallow whole-genome sequencing, SWGS）、全外显子组测序（whole-exome sequencing, WES）、RNA 测序等。此外，收集了病理切片图像用于数字病理分析。
实验方法
基因组学与转录组学分析
 WES 用于检测肿瘤驱动基因的突变谱，SWGS 检测拷贝数异常、肿瘤纯度；RNA-Seq 分析基因表达水平和免疫活性信号。
数字病理学分析
 病理切片被数字化，用机器学习方法分析肿瘤中的淋巴细胞密度和浸润状态。
机器学习模型的构建
 利用 DNA、RNA、病理数据构建并验证一系列集成式预测模型。模型包括多种算法（如逻辑回归、随机森林、支持向量机）组成的预测器管线，最终通过交叉验证优化超参数。
外部队列验证
 75 名外部病例（来自 ARTEMIS 试验和 PBCP 研究）数据用于验证模型的泛化能力。
主要研究结果临床因素与治疗反应关联
 单变量分析表明，肿瘤分级高、ER 阴性（ER−）和诊断时无淋巴结转移的患者更可能达到病理完全缓解（pathological complete response, pCR）。然而，多变量分析显示只有 ER− 是独立相关因素。
基因突变与治疗反应的关系
 研究共检测到 16,134 个体细胞水平的突变，其中 TP53 突变与 pCR 显著相关，而 PIK3CA 突变与治疗抵抗相关。
 肿瘤突变负荷（tumour mutation burden, TMB）较高的肿瘤更可能获得 pCR。遗传不稳定性（homologous recombination deficiency, HRD）及 APOBEC 突变特征与治疗反应呈正相关。
免疫信号与治疗反应
 高水平的免疫浸润和细胞毒性活性（如 CD8+ T 细胞的浸润与活性）与 pCR 显著相关；相反，HLA 区的杂合性丢失（loss of heterozygosity）和调节 T 细胞（Treg）比例升高与治疗抵抗相关。这表明免疫微环境在治疗反应中起关键作用。
整合模型的预测性能
 最佳模型整合临床、基因组、转录组、病理和治疗因素，外部验证数据集的 AUC 值达 0.87，远高于仅使用临床变量的预测模型（AUC = 0.70）。
研究的结论与意义研究表明，乳腺癌术前治疗的反应在很大程度上取决于基线肿瘤生态系统的多维特征，包括增殖、免疫活性、突变负荷等。整合多组学数据的机器学习模型相比传统方法具有更高的预测能力。研究为乳腺癌精准治疗提供了新途径，并提出了一种可迁移应用于其他癌种的预测框架。在临床实践中，利用该模型可以更有针对性地选择治疗策略，使“非应答者”获得更加个性化的治疗。
研究亮点与创新点多组学数据集成
 首次将 DNA、RNA 和数字病理数据有机融合，通过机器学习建模提高预测准确性。
模型验证严谨性
 使用独立外部验证数据集，证明模型鲁棒性。
揭示肿瘤免疫环境关键性
 首次从多角度量化和验证了免疫信号对乳腺癌化疗反应的关键影响。
总结此研究不仅揭示了乳腺癌治疗应答的复杂决定因素，还展示了整合多组学数据和机器学习技术在精准肿瘤学中的强大潜力。这一方法有望推广至其他癌种，为癌症治疗提供全新预测思路与工具。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问