分享自:

系统评估细胞游离DNA片段化模式以增强癌症检测

期刊:Advanced ScienceDOI:10.1002/advs.202308243

这篇文档属于类型a,即单篇原创研究的报告。以下是针对该研究的学术报告:

作者与发表信息

该研究由Yuying Hou、Xiang-Yu Meng和Xionghui Zhou共同完成,分别来自华中农业大学信息学院和湖北民族大学健康科学中心。研究于2024年发表在期刊《Advanced Science》上,题为《Systematically Evaluating Cell-Free DNA Fragmentation Patterns for Cancer Diagnosis and Enhanced Cancer Detection via Integrating Multiple Fragmentation Patterns》。

学术背景

该研究的主要科学领域是癌症早期诊断,特别是基于液体活检的无创检测方法。液体活检通过分析体液中的循环生物标志物(如循环游离DNA,cfDNA)来提供癌症的早期诊断信息。cfDNA携带了癌症特异的遗传和表观遗传改变,是一种极具潜力的非侵入性生物标志物。然而,cfDNA的片段化模式(fragmentation patterns)在癌症诊断中的应用尚未得到系统性的比较和评估,这阻碍了其在实际研究和临床应用中的推广。因此,本研究旨在通过整合多种cfDNA片段化模式,系统性评估其在癌症诊断中的表现,并开发一种集成分类器以提升癌症检测的准确性。

研究流程

研究流程包括以下几个主要步骤:

  1. 数据收集与预处理
    研究收集了来自4个不同来源的1382个血浆cfDNA测序样本,涵盖8种癌症类型。数据来源于Cristiano et al.、Jiang et al.、Zhou et al.和Mathios et al.的公开数据集。所有样本的cfDNA片段信息经过预处理,包括去除低质量读段和PCR重复片段,并使用GRCh37人类参考基因组进行比对。

  2. 开放染色质区域的特征提取
    研究将分析范围限定在开放染色质区域(open chromatin regions),因为这些区域中的cfDNA更容易发生片段化。研究从B细胞、T细胞、单核细胞和泛癌样本中收集了开放染色质区域的数据,并将其合并为一个候选区域集。每个区域的长度调整为200 bp,以中心点为基础进行扩展。

  3. cfDNA片段化模式的计算
    研究计算了10种已发表的cfDNA片段化模式,包括片段长度(fragment length)、启动子片段化熵(promoter fragmentation entropy, PFE)、片段大小比率(fragment size ratio, FSR)、片段大小分布(fragment size distribution, FSD)、片段覆盖度(fragment coverage)、片段端点(fragment end)、定向感知的cfDNA片段化(orientation-aware cell-free fragmentation, OCF)、集成片段化评分(integrated fragmentation score, IFS)、窗口保护评分(windowed protection score, WPS)和末端基序(end motif, EDM)。每种片段化模式的计算方法均根据开放染色质区域的定义进行了调整。

  4. 分类模型的构建与验证
    研究使用支持向量机(SVM)构建了基于每种片段化模式的分类模型,并分别进行了交叉验证和独立验证。此外,研究还开发了一种集成分类器(integrated fragmentation pattern, IFP),通过整合所有片段化模式的预测概率来提升分类性能。集成分类器在跨癌症类型和特定癌症类型的诊断中均表现出色,并在组织来源判定中取得了显著进展。

  5. 功能注释与多组学数据分析
    研究进一步对集成分类器中的关键区域进行了功能注释和多组学数据分析。通过Cistrome-GO工具,研究识别了与乳腺癌(BRCA)相关的关键基因和通路,并通过TCGA数据验证了这些区域的生物学意义。单细胞RNA测序分析进一步揭示了这些关键区域在肿瘤基质中的表达模式。

主要结果

  1. 片段化模式的诊断性能
    所有10种片段化模式均表现出一定的癌症诊断能力,其中EDM在交叉验证中显示出最高的诊断价值。结合片段长度和覆盖度信息的片段化模式(如OCF、IFS和WPS)在独立验证中表现出更强的预测能力。然而,不同癌症类型和数据集之间的片段化模式表现存在显著差异,表明其诊断稳定性有待提高。

  2. 集成分类器的性能
    集成分类器(IFP)在交叉验证和独立验证中均表现出优异的分类性能,特别是在肺癌和肝癌的诊断中,AUC值均超过0.90。IFP在不同癌症阶段的诊断中也表现出色,能够有效区分早期和晚期癌症患者。

  3. 生物学意义的探索
    通过对集成分类器中关键区域的功能注释,研究识别了与乳腺癌相关的关键基因(如TFF1、BAGE和EGFR)和通路(如雌激素信号通路)。这些区域的基因表达在肿瘤组织中显著上调,表明其在癌症发生中的重要作用。

结论

本研究系统评估了10种cfDNA片段化模式在癌症诊断中的表现,并开发了一种集成分类器以提升诊断性能。研究结果表明,整合多种片段化模式可以显著提高癌症检测的准确性和稳定性,并为组织来源判定提供了重要参考。此外,研究还揭示了关键区域在癌症发生中的生物学意义,为未来的癌症研究提供了新的方向。

研究亮点

  1. 系统性评估:首次系统比较了10种cfDNA片段化模式在癌症诊断中的表现,填补了该领域的研究空白。
  2. 集成分类器:开发了一种集成分类器,通过整合多种片段化模式显著提升了癌症检测的准确性和稳定性。
  3. 生物学意义:通过功能注释和多组学数据分析,揭示了关键区域在癌症发生中的重要作用,为未来的癌症研究提供了新的生物学见解。

其他有价值的内容

研究还探讨了片段化模式在不同癌症类型和数据集之间的表现差异,提出了未来研究中需要关注的方向,如样本量的扩展和长片段cfDNA的分析。这些内容为进一步优化cfDNA在癌症诊断中的应用提供了重要参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com