分享自:

基于迭代通路融合的多组学聚类方法在癌症研究中的应用

期刊:Briefings in BioinformaticsDOI:10.1093/bib/bbae541

这篇文档属于类型a,即报告了一项原创研究。以下是根据文档内容生成的学术报告:

作者及研究机构
本研究的主要作者包括Haoyang Zhang、Sha Liu、Bingxin Li和Xionghui Zhou。他们分别来自华中农业大学信息学院农业生物信息学湖北省重点实验室和农业农村部智能农业动物重点实验室。研究于2024年10月9日被接受,并发表在《Briefings in Bioinformatics》期刊上,文章编号为bbae541。

学术背景
癌症是一种高度异质性的复杂疾病,即使是同一种类型的肿瘤也可能表现出显著的分子差异,这影响了患者的临床表现、分子特征及药物反应。精准医学(precision medicine)是改善癌症患者预后的关键,而肿瘤分型(tumor subtyping)是精准医学的重要组成部分。传统的分型方法依赖于组织或细胞类型,缺乏精确性,因此基于分子特征的分型方法显得尤为重要。高通量测序技术的普及使得大规模多组学数据(multi-omics data)的获取变得更加便捷,为基于分子特征的精确分型提供了可能。然而,现有的多组学数据整合聚类方法在性能或生物学解释性方面存在不足,限制了其实际应用。本研究提出了一种基于迭代通路融合的多组学聚类方法(IPFMC),旨在通过整合通路信息来提升癌症分型的性能和生物学解释性。

研究流程
IPFMC方法包括两个主要阶段:第一阶段是基于通路信息的单组学数据整合,第二阶段是多组学数据的相似性网络融合(similarity network fusion, SNF)。
1. 第一阶段:单组学数据整合
- 数据分区:首先,IPFMC根据通路信息将每种组学数据划分为多个子集。
- 相似性计算:对于每个通路子集,计算样本之间的相似性矩阵。
- 迭代筛选:通过迭代过程筛选出重要的通路,整合这些通路的相似性矩阵,得到每种组学数据的样本表示。
- 策略选择:IPFMC提供了两种策略(Strategy 1和Strategy 2)用于信息融合。Strategy 1采用K-means离散化策略,Strategy 2采用平均表示策略。实验表明,Strategy 1在生存分析中表现更好,而Strategy 2与现有分型结果更一致。
2. 第二阶段:多组学数据融合
- 相似性网络融合:使用SNF方法整合不同组学数据的相似性矩阵,得到最终的样本相似性矩阵。
- 聚类分析:采用谱聚类(spectral clustering)方法将样本划分为不同的癌症亚型。

研究对象与数据处理
研究使用了来自癌症基因组图谱(The Cancer Genome Atlas, TCGA)的九种癌症数据集,包括mRNA表达数据、miRNA表达数据、DNA甲基化数据和拷贝数变异(copy number variation, CNV)数据。这些数据集经过预处理,并使用了来自MSigDB的通路基因集和miRTarBase的miRNA靶标信息。

主要结果
1. 聚类性能
- IPFMC在九种癌症数据集上的聚类性能优于10种代表性方法,包括早期整合方法(如LRACluster)、晚期整合方法(如PINS)和中期整合方法(如SNF、NEMO等)。
- 在生存分析中,IPFMC的聚类结果显示出显著的预后差异,表明其在癌症分型中的有效性。
2. 生物学解释性
- IPFMC能够识别与癌症相关的关键通路和基因。例如,在肺癌数据集中,IPFMC识别出了与肺癌发生密切相关的MET通路和KRAS基因。
- 不同组学数据(如mRNA、miRNA、DNA甲基化和CNV)在通路和基因的富集上表现出不同的生物学特征,表明IPFMC能够从多组学数据中提取全面的信息。
3. 策略比较
- Strategy 1在生存分析中表现更优,而Strategy 2与现有分型结果更一致。用户可以根据需求选择不同的策略。

结论
IPFMC是一种结构简单但生物学解释性强的多组学聚类方法。通过整合通路信息,IPFMC在癌症分型中表现出优异的聚类性能和生物学解释性。其两阶段融合策略不仅提高了聚类结果的准确性,还为癌症研究提供了有价值的生物学见解。IPFMC的代码和评估工具已开源,便于其他研究者使用。

研究亮点
1. 创新性方法:IPFMC首次将通路信息与多组学数据整合相结合,提出了一种基于迭代通路融合的聚类框架。
2. 高性能与解释性:IPFMC在聚类性能和生物学解释性方面均优于现有方法,为癌症分型提供了新的工具。
3. 策略灵活性:IPFMC提供了两种融合策略,用户可以根据需求选择适合的策略,增强了方法的实用性。

其他有价值的内容
研究还进行了消融实验,验证了IPFMC中两个主要贡献(通路信息的使用和迭代筛选过程)对聚类性能的提升作用。此外,研究还展示了IPFMC在识别癌症相关通路和基因方面的能力,为癌症研究提供了新的生物学见解。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com