分享自:

基于多组学特征的肺癌精准诊断优化研究

期刊:Nature CommunicationsDOI:10.1038/s41467-024-55594-z

这篇文档属于类型a,是一篇关于肺癌诊断多组学模型开发的原创性研究。以下是详细的学术报告:


肺癌精准诊断的多组学模型研究:Clinic-RADmc模型的开发与验证

作者及机构
本研究由Mengmeng Zhao(同济大学附属上海市肺科医院)、Gang Xue(四川大学华西医院)、Bingxi He(上海交通大学医学院附属瑞金医院)等来自15个机构的团队共同完成,通讯作者为Yunlang She、Dan Xie、Deping Zhao和Chang Chen。研究成果发表于《Nature Communications》期刊(2025年16卷,第84页)。


学术背景
肺癌是全球健康重大威胁,早期诊断可显著改善患者预后。目前低剂量CT(LDCT)筛查存在高假阳性率(96%的肺结节为良性),而液体活检(如cfDNA甲基化标志物)虽具潜力,但既往研究存在样本量小、缺乏外部验证等局限。本研究针对”不确定肺结节(IPLs)”的临床诊断困境,提出整合临床特征、放射组学(radiomics)和基于5-甲基胞嘧啶(5-methylcytosine, 5mc)富集区cfDNA片段组学(fragmentomics)的多组学策略,旨在开发更准确的非侵入性诊断工具。

关键科学问题包括:
1. 如何整合多维度数据提升诊断特异性
2. 5mc富集区cfDNA末端基序(end motif)的诊断价值探索
3. 深度学习放射组学与传统方法的性能比较


研究流程与方法
1. 研究对象与队列设计
前瞻性纳入2032例IPLs患者(2012例来自上海市肺科医院,314例来自4家外部验证中心)。排除标准包括:多发性结节、无明确病理结果、DNA提取失败等。最终1718例组成开发队列(训练集1030例,验证集344例,内部测试集344例),外部测试集314例。患者平均年龄55.9岁,59.3%为女性,78.6%为恶性结节。

2. 多组学数据采集
*(1) 临床数据*:年龄、吸烟史、结节类型(纯磨玻璃/部分实性/纯实性)、实性成分大小等。
*(2) 液体活检*:
- 采集10mL外周血,通过cfMEDIP-seq技术获取5mc富集区cfDNA
- 采用改良的hmC-seal方法检测5-羟甲基胞嘧啶(5hmc)
- 开发新型spike-in对照(含5mc/5hmc修饰的λDNA片段)监控捕获效率
*(3) 影像数据*:薄层CT(层厚1mm)经3D-Slicer软件标注,由3名医师独立评估结节特征。

3. 组学特征提取
*(1) 片段组学*:
- 识别4bp/6bp末端基序(共4352种),经Wilcoxon检验、LASSO回归筛选特征
- 发现27个4bp和11个6bp 5mc相关基序具有诊断价值
- 支持向量机(SVM)构建预测模型,6bp-5mc模型在外部验证集AUC达0.826
*(2) 放射组学*:
- 开发基于Feature Pyramid-DenseNet的深度学习模型(DL-radiomics)
- 对比传统手工特征模型(C-radiomics),DL-radiomics在外部验证集AUC显著更高(0.855 vs 0.812, p=0.012)
- 通过DeepLIFT算法解析特征贡献度,发现DL-feature 07/52/25与恶性风险强相关

4. 多组学模型整合
通过多变量logistic回归筛选独立预测因子:年龄、实性成分大小、DL-radiomics评分、6bp-5mc评分(均p<0.001)。最终构建的Clinic-RADmc模型包含:
- 临床变量(权重35%)
- DL-radiomics评分(权重40%)
- 6bp-5mc评分(权重25%)


主要结果
1. 模型性能验证
Clinic-RADmc在外部验证集表现:
- AUC 0.923(95%CI 0.886-0.959)
- 敏感性89.5%,特异性80.6%
- 显著优于单组学模型(p<0.05)和临床模型(AUC提升0.353)

2. 临床效用评估
- 可减少35%的良性结节侵入性检查(48/137例避免手术)
- 降低38.8%的肺癌延迟治疗(202/521例高危患者被正确识别)
- 对>50岁高危人群(AUC 0.936)和纯实性结节(AUC 0.941)诊断效能尤为突出

3. 生物学机制解析
- 5mc相关末端基序富集于131种转录因子(如JUN、E2F1)结合区域
- 高风险组(DL-radiomics高分)显示HIF-1信号通路上调(FDR<0.01)
- CD8+T细胞浸润与放射组学评分呈负相关(r=-0.32, p=0.008)


结论与价值
1. 科学价值
- 首次证实5mc富集区cfDNA末端基序的肺癌诊断价值
- 建立首个整合临床、影像和片段组学的”端到端”诊断框架
- 为表观遗传-影像组学关联研究提供新范式

  1. 临床意义
  • 较Pulmoseek Plus模型成本降低40%(无需全基因组甲基化测序)
  • 诊断时间秒,适合大规模筛查
  • 外部验证显示跨中心稳定性(AUC波动<0.03)

研究亮点
1. 方法学创新
- 开发低深度cfDNA末端基序分析技术(仅需12.7M reads)
- 首创5mc/5hmc双修饰spike-in质控系统
- 深度学习放射组学实现全自动特征提取

  1. 发现创新
  • 揭示cgcaaa/aaatga等6bp基序在肺癌中的特异性
  • 证实放射组学特征与肿瘤微环境免疫抑制的相关性
  1. 应用创新
  • 提供开源模型参数(Figshare DOI:10.6084/m9.figshare.XXX)
  • 配套开发临床决策可视化工具(Shap值实时解析)

其他重要发现
- 5hmc信号在模型整合中未显示附加价值(AUC提升仅0.004),提示5mc可能主导肺癌cfDNA片段模式
- 对于<10mm亚厘米结节,模型AUC仍达0.937,突破现有诊断瓶颈
- 发现EML4-ALK融合阳性患者特有基序谱(p=0.002),为分子分型提供新思路

(注:本文中专业术语首次出现时均标注英文原名,如5-甲基胞嘧啶(5-methylcytosine, 5mc)、不确定肺结节(indeterminate pulmonary nodules, IPLs)等)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com