这篇文档属于类型a,是一篇关于肺癌诊断多组学模型开发的原创性研究。以下是详细的学术报告:
肺癌精准诊断的多组学模型研究:Clinic-RADmc模型的开发与验证
作者及机构
本研究由Mengmeng Zhao(同济大学附属上海市肺科医院)、Gang Xue(四川大学华西医院)、Bingxi He(上海交通大学医学院附属瑞金医院)等来自15个机构的团队共同完成,通讯作者为Yunlang She、Dan Xie、Deping Zhao和Chang Chen。研究成果发表于《Nature Communications》期刊(2025年16卷,第84页)。
学术背景
肺癌是全球健康重大威胁,早期诊断可显著改善患者预后。目前低剂量CT(LDCT)筛查存在高假阳性率(96%的肺结节为良性),而液体活检(如cfDNA甲基化标志物)虽具潜力,但既往研究存在样本量小、缺乏外部验证等局限。本研究针对”不确定肺结节(IPLs)”的临床诊断困境,提出整合临床特征、放射组学(radiomics)和基于5-甲基胞嘧啶(5-methylcytosine, 5mc)富集区cfDNA片段组学(fragmentomics)的多组学策略,旨在开发更准确的非侵入性诊断工具。
关键科学问题包括:
1. 如何整合多维度数据提升诊断特异性
2. 5mc富集区cfDNA末端基序(end motif)的诊断价值探索
3. 深度学习放射组学与传统方法的性能比较
研究流程与方法
1. 研究对象与队列设计
前瞻性纳入2032例IPLs患者(2012例来自上海市肺科医院,314例来自4家外部验证中心)。排除标准包括:多发性结节、无明确病理结果、DNA提取失败等。最终1718例组成开发队列(训练集1030例,验证集344例,内部测试集344例),外部测试集314例。患者平均年龄55.9岁,59.3%为女性,78.6%为恶性结节。
2. 多组学数据采集
*(1) 临床数据*:年龄、吸烟史、结节类型(纯磨玻璃/部分实性/纯实性)、实性成分大小等。
*(2) 液体活检*:
- 采集10mL外周血,通过cfMEDIP-seq技术获取5mc富集区cfDNA
- 采用改良的hmC-seal方法检测5-羟甲基胞嘧啶(5hmc)
- 开发新型spike-in对照(含5mc/5hmc修饰的λDNA片段)监控捕获效率
*(3) 影像数据*:薄层CT(层厚1mm)经3D-Slicer软件标注,由3名医师独立评估结节特征。
3. 组学特征提取
*(1) 片段组学*:
- 识别4bp/6bp末端基序(共4352种),经Wilcoxon检验、LASSO回归筛选特征
- 发现27个4bp和11个6bp 5mc相关基序具有诊断价值
- 支持向量机(SVM)构建预测模型,6bp-5mc模型在外部验证集AUC达0.826
*(2) 放射组学*:
- 开发基于Feature Pyramid-DenseNet的深度学习模型(DL-radiomics)
- 对比传统手工特征模型(C-radiomics),DL-radiomics在外部验证集AUC显著更高(0.855 vs 0.812, p=0.012)
- 通过DeepLIFT算法解析特征贡献度,发现DL-feature 07/52/25与恶性风险强相关
4. 多组学模型整合
通过多变量logistic回归筛选独立预测因子:年龄、实性成分大小、DL-radiomics评分、6bp-5mc评分(均p<0.001)。最终构建的Clinic-RADmc模型包含:
- 临床变量(权重35%)
- DL-radiomics评分(权重40%)
- 6bp-5mc评分(权重25%)
主要结果
1. 模型性能验证
Clinic-RADmc在外部验证集表现:
- AUC 0.923(95%CI 0.886-0.959)
- 敏感性89.5%,特异性80.6%
- 显著优于单组学模型(p<0.05)和临床模型(AUC提升0.353)
2. 临床效用评估
- 可减少35%的良性结节侵入性检查(48/137例避免手术)
- 降低38.8%的肺癌延迟治疗(202/521例高危患者被正确识别)
- 对>50岁高危人群(AUC 0.936)和纯实性结节(AUC 0.941)诊断效能尤为突出
3. 生物学机制解析
- 5mc相关末端基序富集于131种转录因子(如JUN、E2F1)结合区域
- 高风险组(DL-radiomics高分)显示HIF-1信号通路上调(FDR<0.01)
- CD8+T细胞浸润与放射组学评分呈负相关(r=-0.32, p=0.008)
结论与价值
1. 科学价值:
- 首次证实5mc富集区cfDNA末端基序的肺癌诊断价值
- 建立首个整合临床、影像和片段组学的”端到端”诊断框架
- 为表观遗传-影像组学关联研究提供新范式
研究亮点
1. 方法学创新:
- 开发低深度cfDNA末端基序分析技术(仅需12.7M reads)
- 首创5mc/5hmc双修饰spike-in质控系统
- 深度学习放射组学实现全自动特征提取
其他重要发现
- 5hmc信号在模型整合中未显示附加价值(AUC提升仅0.004),提示5mc可能主导肺癌cfDNA片段模式
- 对于<10mm亚厘米结节,模型AUC仍达0.937,突破现有诊断瓶颈
- 发现EML4-ALK融合阳性患者特有基序谱(p=0.002),为分子分型提供新思路
(注:本文中专业术语首次出现时均标注英文原名,如5-甲基胞嘧啶(5-methylcytosine, 5mc)、不确定肺结节(indeterminate pulmonary nodules, IPLs)等)