分享自:

膀胱癌亚型相关表观基因组景观与三维基因组结构

期刊:Genome BiologyDOI:10.1186/s13059-021-02325-y

关于膀胱癌亚型特异性表观基因组景观及三维基因组结构的学术研究报告

本研究论文题为“Subtype-associated epigenomic landscape and 3D genome structure in bladder cancer”,由Tejaswi Iyyanki(宾夕法尼亚州立大学医学院、西北大学)、Baozhen Zhang(西北大学等)、Qixuan Wang(西北大学)、Ye Hou(西北大学)等作为共同第一作者,以及David J. DeGraff(宾夕法尼亚州立大学医学院)和冯跃(Feng Yue,西北大学)作为共同通讯作者领导的研究团队完成。该研究于2021年发表于学术期刊《Genome Biology》第22卷第105期。

一、 学术背景

本研究的科学领域聚焦于癌症生物学,特别是膀胱癌(Bladder cancer, BLCA)的分子分型及其表观遗传调控机制。膀胱癌是美国第二大常见泌尿系统恶性肿瘤,其中肌层浸润性膀胱癌(Muscle-invasive bladder cancer, MIBC)预后较差,治疗成本高昂。先前的研究已基于基因表达谱将MIBC区分为不同的分子亚型,主要为管腔型(Luminal)和基底/鳞状型(Basal/Squamous)。这些亚型具有截然不同的基因表达特征(例如,管腔型高表达FOXA1、GATA3、PPARG;基底型高表达KRT5、KRT6A等),并与患者的疾病进展、生存预后以及对治疗的反应性显著相关。一些关键的转录因子(Transcription Factors, TFs)如FOXA1、GATA3、TP63、STAT3等,已被证明在驱动亚型特异性基因调控和亚型转换中扮演核心角色。

尽管在转录层面已有认识,但驱动膀胱癌亚型特异性基因表达的深层表观遗传机制和三维染色质结构在很大程度上仍是未知的。例如,特定的转录因子如何通过塑造染色质的可及性(accessibility)、组蛋白修饰状态以及远程染色质相互作用来精确调控亚型特异性基因程序,尚未得到系统性阐明。因此,本研究旨在填补这一知识空白,其核心目标是:首次在膀胱癌细胞系和患者肿瘤样本中,全面绘制并比较管腔型与基底/鳞状型膀胱癌的全基因组转录组、增强子景观、关键转录因子结合谱以及三维染色质相互作用图谱,从而揭示亚型特异性的表观基因组特征和三维基因组结构,并探索其中潜在的新型调控因子。

二、 详细研究流程

本研究采用了多层次、高通量的基因组学技术,对膀胱癌细胞模型和原发肿瘤样本进行了系统性分析,流程设计极为全面。

首先,在研究对象上,研究团队选取了4株已鉴定的膀胱癌细胞系:RT4和SW780(管腔型),Scaber和HT1376(基底/鳞状型)。同时,为了验证细胞系发现的临床相关性,研究还纳入了4例肌层浸润性膀胱癌患者的原发肿瘤样本(T1, T3, T4, T5)。所有实验在细胞系中均设置了至少两个生物学重复。

其次,在实验流程与数据分析上,研究包含以下几个核心步骤,构成了一个完整的工作流:

  1. 分子亚型确认与多组学数据生成

    • RNA测序(RNA-seq):对所有细胞系和肿瘤样本进行转录组测序,以获取全基因组的基因表达数据。利用已发表的分子分型方法(ConsensusMIBC)对样本进行亚型确认,验证了细胞系的亚型分类,并对肿瘤样本进行了分型(T1为管腔型,T3为富基质型,T4和T5为基底/鳞状型)。
    • 组蛋白修饰ChIP-seq:对组蛋白H3第27位赖氨酸乙酰化(H3K27ac)进行染色质免疫沉淀测序。H3K27ac是活跃启动子和增强子的经典标记。通过此实验,在全基因组范围内定位了活跃的调控元件。
    • 染色质可及性测定(ATAC-seq):使用转座酶可及染色质测序技术,检测全基因组的开放染色质区域。开放染色质区域通常代表了转录因子可能结合的顺式调控元件。
    • 转录因子ChIP-seq:在管腔型细胞系RT4中,进行了GATA3的ChIP-seq实验,并利用了团队此前已发表的RT4细胞中FOXA1的ChIP-seq数据。这用于精确定位这两个关键管腔型转录因子的基因组结合位点。
    • 三维基因组构象捕获(Hi-C):这是本研究的一个关键创新点。研究团队对全部4株细胞系以及另外5例膀胱癌患者肿瘤样本(包含上述4例中的部分样本)进行了高分辨率(>8亿 reads/样本)的Hi-C测序。Hi-C技术能够揭示全基因组范围内染色质之间的空间相互作用,从而绘制三维基因组图谱。
  2. 数据分析与整合

    • 差异表达与表观标记分析:基于RNA-seq数据,鉴定管腔型与基底型细胞系之间差异表达的基因。将H3K27ac信号与基因启动子、远端区域关联,预测活跃的增强子,并通过相关性分析将增强子与潜在靶基因进行关联。
    • 调控元件 motif 分析:对ATAC-seq定义的开放染色质区域(特别是远端增强子区域)进行转录因子结合 motif 富集分析,以推断哪些转录因子家族可能在不同亚型中活跃。
    • 三维染色质环(Loop)鉴定:利用团队自身开发的一款基于机器学习的染色质环检测软件——Peakachu,对Hi-C数据进行处理,在10kb的分辨率下预测染色质环。该软件的应用是本方法学上的一个亮点。然后,根据环在亚型间的特异性,将其分类为管腔型特异、基底型特异或共享的染色质环。
    • 结构变异(Structural Variations, SVs)与拷贝数变异(Copy Number Variations, CNVs)分析:利用Hi-C数据本身,通过HINT和Hi-CBreakFinder等软件,识别细胞系和肿瘤中的大型结构变异(如易位、倒位、缺失)和拷贝数变化。并着重分析这些变异是否导致了新的染色质拓扑关联结构域或“增强子劫持”事件。
    • 新型调控因子鉴定与功能验证:通过对开放染色质区域的motif分析,发现了一个在管腔型相关区域显著富集的转录因子——神经元PAS结构域蛋白2(Neuronal PAS Domain Protein 2, NPAS2)。随后,利用公共数据库(ENCODE)数据、癌症基因组图谱(TCGA)临床数据关联分析(生存分析),以及体外功能实验进行验证。功能实验包括在基底型Scaber细胞中过表达NPAS2,然后通过Transwell迁移实验检测细胞迁移能力变化,并通过实时定量PCR(RT-qPCR)检测基底型和管腔型标记基因的表达改变。此外,还验证了FOXA1和GATA3过表达对NPAS2的调控作用。

三、 主要研究结果

研究结果层层递进,从表观景观描绘到三维结构解析,再到新型因子的功能挖掘。

  1. 亚型特异性表观基因组景观

    • RNA-seq和H3K27ac ChIP-seq数据的聚类分析均能清晰地将管腔型(RT4, SW780)和基底型(Scaber, HT1376)细胞系分开,表明全局的表观遗传状态与分子亚型身份高度一致。
    • 差异基因表达分析鉴定出524个管腔型特异性上调基因和427个基底型特异性上调基因。这些基因的启动子区域H3K27ac信号强度与其表达水平高度相关,且表现出亚型特异性模式。
    • 通过H3K27ac信号预测了约6万个远端增强子,并通过关联分析将其与基因表达相关联。这些增强子及其靶基因的表达也呈现清晰的亚型特异性聚类。更重要的是,在4例患者肿瘤样本中获得的H3K27ac图谱与对应亚型的细胞系显示出高度相似性,证明了细胞系模型的可靠性。
  2. 亚型特异性开放染色质与转录因子调控网络

    • ATAC-seq在每个细胞系中平均鉴定出约3.2万个开放染色质区域。开放染色质图谱的全局相关性也支持亚型分类。
    • Motif富集分析揭示,管腔型特异性开放染色质区域富集了FOX(叉头框)、GATA、激素受体等已知管腔相关转录因子的结合 motif。而基底型特异性区域则富集了TEAD、KLF、MEF2C、OTX2等 motif,其中一些与干细胞性或鳞状分化相关。值得注意的是,AP-1复合物(如FOS/JUN家族)的motif在所有亚型的开放增强子中均高度富集,提示其可能作为辅助因子广泛参与。
    • 在管腔型细胞RT4中,FOXA1和GATA3的ChIP-seq数据显示,它们共同结合在大量管腔基因(如FOXA1自身、PPARG、FGFR3等)的远端增强子区域。这些共结合位点关联的基因功能富集于上皮发育、细胞命运决定等生物学过程。Motif分析进一步确认,在FOXA1/GATA3共结合的增强子区域,除了FOX和GATA motif外,AP-1 motif也显著富集,暗示三者可能存在协同作用。
    • 将细胞系的ATAC-seq数据与TCGA膀胱癌肿瘤的染色质可及性数据比较,发现其开放染色质模式能与患者肿瘤聚类,再证临床相关性。
  3. 亚型潜在差异的三维基因组组织

    • 利用Hi-C数据和Peakachu算法,在细胞系中平均预测出约5.6万个染色质环。通过比较,鉴定出2299个潜在的管腔型特异性环和2144个基底型特异性环。约30-40%在细胞系中鉴定的亚型特异性环,在患者肿瘤样本中也得到检测,表明这些三维结构特征具有临床意义。
    • 分析显示,约40%的染色质环连接了增强子与启动子(E-P环)。例如,管腔基因FOXA1和基底基因KRT5的基因座在各自对应的亚型细胞中显示出更多的E-P环。此外,在管腔型细胞RT4中,FOXA1和GATA3的结合位点显著富集于这些染色质环的锚点区域,提示这些先锋转录因子可能参与塑造或稳定三维基因组结构以驱动基因表达。
  4. 结构变异对三维基因组的影响

    • 通过分析Hi-C数据,在细胞系和肿瘤中识别出大量结构变异和拷贝数变异。研究团队重构了断裂点附近的局部Hi-C相互作用图谱,展示了一些由结构变异导致的“新拓扑关联域”和“增强子劫持”的潜在案例。这为理解基因组结构重排如何通过改变三维空间调控网络来驱动癌症提供了线索。
  5. 新型调控因子NPAS2的鉴定与功能

    • Motif分析发现,编码 circadian 相关转录因子的NPAS2基因,其结合 motif在管腔型及共享的开放染色质区域显著富集,但在基底型区域不富集。
    • TCGA数据分析显示,NPAS2的高表达与膀胱癌患者较好的总生存期显著相关。
    • 功能实验证实:在基底型Scaber细胞中过表达NPAS2,能显著抑制细胞的迁移能力;同时下调多个基底型标记基因(KRT5, KRT6A, TFAP2C)的表达。相反,过表达FOXA1或GATA3能上调NPAS2的表达。这些结果共同提示,NPAS2是一个新的、与良好预后相关的管腔型膀胱癌调控因子,它可能受到FOXA1/GATA3的上游调控,并参与抑制基底样特征和细胞迁移。

四、 结论与研究价值

本研究系统性地绘制了膀胱癌管腔型和基底/鳞状型的多组学图谱,并得出以下核心结论: 1. 膀胱癌的分子亚型不仅体现在基因表达谱上,还对应着独特的表观基因组景观(包括特异的H3K27ac修饰模式和开放染色质状态)和潜在差异的三维基因组结构。 2. 亚型特异性转录因子(如FOXA1、GATA3)通过结合在远端增强子区域,并与AP-1等辅助因子协作,驱动了亚型特异性基因的表达程序。它们可能通过促进增强子-启动子环的形成来实施调控。 3. 三维染色质环网络具有亚型特异性,并且部分在患者肿瘤中得到验证,这为理解亚型身份的建立和维持提供了三维空间层面的新视角。 4. 本研究首次在膀胱癌中报道了全基因组范围的染色质相互作用图谱(Hi-C),并揭示了结构变异如何可能导致三维调控网络的重构。 5. 发现并初步验证了NPAS2作为一个新型的、与预后相关的管腔型膀胱癌转录因子,它将生物钟相关因子与膀胱癌亚型联系起来,拓展了该领域的认知。

五、 研究亮点

  1. 全面性与系统性:研究整合了RNA-seq、ChIP-seq(H3K27ac, FOXA1, GATA3)、ATAC-seq和Hi-C这五种核心基因组学技术,在膀胱癌细胞系和原发肿瘤两个层面进行了平行分析,构建了迄今为止关于膀胱癌亚型最全面的表观基因组和三维基因组资源。
  2. 开创性:这是首次在膀胱癌中报道全基因组Hi-C图谱的研究,填补了该领域三维基因组结构信息的空白。
  3. 临床转化潜力:研究不仅停留在描述关联,还通过TCGA数据关联和体外功能实验,鉴定并初步验证了新型调控因子NPAS2的生物学功能和临床意义,为后续的靶点探索和生物标志物开发提供了新线索。
  4. 方法学应用:成功应用了自研的机器学习工具Peakachu进行高精度染色质环检测,并利用Hi-C数据自身进行结构变异分析,展示了多组学数据深度挖掘的价值。
  5. 机制深入:研究将转录因子结合、染色质开放性、组蛋白修饰、三维空间构象以及最终的基因表达和表型(细胞迁移)串联起来,为理解膀胱癌亚型特异的基因调控提供了一个从一维序列到三维空间的整合性框架。

六、 其他有价值的内容

研究在讨论部分也指出了当前工作的局限性,例如受限于测序成本,患者样本量仍较小;缺乏对所有主要转录因子和组蛋白修饰的联合分析(类似ENCODE规模的项目)。这些为未来更大规模的研究指明了方向。同时,作者提出了基于NPAS2等发现的潜在治疗策略:对于基底型肿瘤,或许可以通过激活NPAS2等管腔化程序来减缓进展;而对于管腔型肿瘤,则可能通过抑制其关键调控网络来改善治疗。这些设想有待于更深入的机制研究和临床前模型验证。本研究为膀胱癌的分子分型提供了超越转录组的深层机制见解,并为后续的基础与转化研究奠定了坚实的数据和理论基础。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com