分享自:

被截留的内含子:一种新型且广泛存在的转录后剪接内含子

期刊:Genes & DevelopmentDOI:10.1101/gad.247361.114

本研究报告题为“detained introns are a novel, widespread class of post-transcriptionally spliced introns”,由Paul L. Boutz, Arjun Bhutkar, 和 Phillip A. Sharp(通讯作者)共同完成,作者单位均隶属于麻省理工学院 David H. Koch 癌症综合研究所。该研究成果发表于2015年,刊载于期刊Genes & Development

学术背景

本研究属于分子生物学与遗传学领域,聚焦于前体信使RNA(pre-mRNA)剪接这一核心基因表达调控过程。传统观点认为,哺乳动物细胞中大多数内含子的剪接发生在转录过程中(共转录剪接)。然而,已有零星研究表明,部分内含子可能在转录完成后才被剪接(转录后剪接),但其普遍性、调控机制和生物学意义尚不清楚。本研究团队在对小鼠胚胎干细胞(mESCs)进行深度测序时,意外发现多聚腺苷酸化RNA中,许多特定的内部内含子丰度显著高于同一转录本内的其他内含子。这些内含子具有半衰期长、滞留于细胞核内、且不受无义介导的mRNA降解途径(Nonsense-Mediated Decay, NMD)影响等特征。研究者将其命名为“滞留内含子(Detained Introns, DIs)”。本研究旨在:1)在全基因组范围内系统性地识别和鉴定DIs;2)阐明DIs的基本特性与进化保守性;3)探索DIs是否受到细胞信号通路的调控,特别是与应激响应激酶CLK相关的调控;4)揭示DIs在基因表达调控中的潜在功能。

详细工作流程

本研究包含一系列紧密衔接的、结合了生物信息学分析、分子生物学实验和功能验证的实验流程。

第一步:DIs的发现与全基因组鉴定 * 研究对象与样本:主要利用公开的和小鼠胚胎干细胞(mESCs)生成的多聚腺苷酸化RNA测序(RNA-seq)数据。同时,整合了人类胚胎干细胞(hESCs)、HeLa、HepG2、HUVEC等多种人类细胞系以及成年小鼠肝脏的RNA-seq公共数据(来自ENCODE项目)进行跨物种和跨组织比较。 * 数据处理与分析方法:开发了一种新颖的生物信息学分析流程。核心是使用R包DESeq进行差异表达分析,但分析对象是单个内含子。对于每个表达的基因,计算每个内部内含子的实际观测读段数,并与基于基因表达水平和其他内含子丰度估算的“期望”读段数进行比较。通过设置严格的统计阈值(错误发现率FDR < 1%),识别出那些丰度显著高于期望值的内含子,即初步定义的DIs。这种方法有效排除了测序本身的随机“噪音”,实现了对DIs的定量识别。 * 实验验证:为验证RNA-seq分析结果,对多个候选DIs及其邻近的非滞留内含子进行了实时定量逆转录聚合酶链式反应(qRT-PCR),使用跨越外显子-内含子连接处的引物进行定量。结果证实,生物信息学预测的高丰度内含子确实在RNA水平上显著富集。

第二步:DIs的基本特性分析 * 剪接类型分析:使用TopHatCufflinks等工具,根据RNA-seq数据中的剪接连接点,将内含子分类为组成型、5‘/3’端可变剪接位点、盒式外显子等类型。分析DIs在不同剪接事件类型中的分布。 * 序列与结构特性分析:比较DIs与非DIs在序列进化保守性(使用PhastCons分数)、剪接位点强度(使用MaxEnt算法)、内含子长度在基因中的相对位置等方面的差异。 * 功能富集分析:对含有DIs的基因进行基因本体(GO) 分析,以确定DIs是否富集于特定生物学功能的基因中。 * 亚细胞定位分析:利用ENCODE项目中人类细胞系核质分离的RNA-seq数据,并通过细胞生化分级分离实验结合qRT-PCR,分析含有DIs的转录本在细胞核与细胞质中的分布。同时,通过抑制转录(使用Flavopiridol)并追踪内含子消失的动力学,估算DIs的半衰期。 * NMD途径验证:利用已发表的Upf1(NMD关键因子)敲低的mESCs RNA-seq数据,分析DIs丰度是否变化。同时,使用siRNA敲低Upf1并结合qRT-PCR,检测已知或预测含有NMD开关外显子的基因中,DI转录本是否被稳定。

第三步:CLK激酶对DIs的调控机制研究 * 药物处理与表型分析:用特异性小分子抑制剂CB19处理mESCs,抑制CLK激酶活性。设置不同时间点(2小时和4小时)收获细胞,提取RNA进行RNA-seq和qRT-PCR分析。 * 剪接变化的全基因组分析:比较CB19处理组与对照组(DMSO)的RNA-seq数据,系统地鉴定受CLK抑制影响而发生剪接变化的DIs。分析这些变化是导致内含子滞留增加还是剪接效率提高。 * 转录后调控验证:在先用Flavopiridol阻断转录30分钟后,再给予CB19或DMSO处理,随后检测特定DIs的丰度变化,以确定CB19的效应是否发生在转录后阶段。 * 磷酸化调控机制探索:通过蛋白质免疫印迹(Western Blot),使用特异性抗体(如1H4抗磷酸化SR蛋白抗体和SRSF4特异性抗体),检测CB19处理后细胞中SR蛋白(特别是SRSF4)磷酸化状态的变化。 * RNA结合蛋白作用分析:重新分析已发表的SRSF3和SRSF4的iCLIP(单个核苷酸分辨率交联免疫沉淀)数据集,寻找这些SR蛋白在CB19响应性DIs及其侧翼区域的结合位点,以探索其直接调控作用。并通过shRNA敲低SRSF4,验证其对特定基因(如CLK1、HNRNPH1、SRSF5)DI剪接的影响。

第四步:DNA损伤应激下的DIs调控 * 应激模型建立:使用阿霉素(Doxorubicin) 处理mESCs,诱导DNA损伤和p53通路激活。 * 靶向分析:通过qRT-PCR,重点检测已知与DNA损伤响应相关的基因(如MDM4、BCLAF1等)中DIs的丰度变化,以及相应的NMD亚型与编码亚型的比例变化。 * 信号整合分析:比较CB19处理与阿霉素处理引起的p53蛋白水平变化下游转录组变化的相关性,探讨不同应激信号对重叠DI调控网络的影响。

第五步:DIs在分化组织中的存在 * 组织样本分析:利用ENCODE项目提供的成年小鼠肝脏RNA-seq数据,应用相同的生物信息学流程鉴定DIs,并与mESCs中的DIs集合进行比较,分析其保守性和组织特异性。

主要结果

  1. DIs的普遍性与保守性:在mESCs中鉴定出3150个DIs(占表达基因内部内含子的4.2%),在多种人类细胞系和小鼠肝脏中同样鉴定出数千个DIs。其中,大量DIs在人与小鼠之间具有显著的进化保守性,表明DIs是一类受到功能选择的调控元件,而非随机产生的剪接效率低下产物。
  2. DIs的独特特性
    • 剪接类型:DIs不仅出现在可变剪接区域(尤其富集于侧翼可变外显子),超过60%的DIs实际上是组成型内含子,表明其调控独立于经典的剪接选择。
    • 结构特征:组成型DIs相比非DIs具有更高的序列保守性和略弱的剪接位点强度,长度分布和基因中的位置也略有偏好(偏向3‘端)。
    • 动态与定位:DIs的半衰期(平均约29分钟)显著长于其邻近内含子(平均约11分钟)。含有DIs的转录本高度富集于细胞核内,与成熟的编码转录本以及典型的NMD底物在亚细胞定位上明显不同。
    • 非NMD底物:在Upf1敲低的条件下,DIs的丰度并未显著增加,证明它们不被NMD途径降解。这与其核内滞留的特性一致,避免了在细胞质中被翻译并触发NMD。
  3. CLK激酶特异性调控DIs
    • CB19处理2小时后,约10%的DIs(325个)发生显著变化,其中近一半(137个)剪接增加(DI减少),另一半(188个)滞留增强(DI增加),大部分DIs不受影响。这表明CLK抑制对剪接的影响是高度特异性的,而非全局抑制。
    • 转录阻断实验证实,CB19对CLK1和NASP基因中DIs的促剪接效应是转录后发生的。
    • 功能偏好:受CLK调控的DIs显著富集于编码RNA加工和剪接因子(尤其是含有RS结构域的蛋白)的基因中。例如,CLK1/4自身的DIs被快速剪接,产生更多编码mRNA;而SRSF3/5等SR蛋白基因的DIs剪接增加,导致包含“毒害外显子”的NMD亚型增多,从而下调其蛋白表达。这揭示了一个快速的剪接因子自调控与交叉调控网络
    • 机制线索:CB19处理导致SRSF4蛋白发生剧烈的去磷酸化迁移。iCLIP数据显示,约36%的CB19响应性DIs区域存在SRSF3/SRSF4的结合,在RNA加工相关基因中这一比例高达78%。敲低SRSF4可重现CB19对部分基因(CLK1、HNRNPH1、SRSF5)剪接模式的影响,表明SRSF4是CLK激酶调控DIs剪接的关键下游效应因子之一。
  4. DNA损伤响应中的DIs调控
    • 阿霉素诱导DNA损伤后,p53蛋白水平上调,同时特定基因的DI剪接发生改变。例如,MDM4(p53负调控因子)的DI滞留增加,编码亚型向NMD亚型转换,导致功能性MDM4 mRNA减少。相反,BCLAF1的DI滞留减少,编码亚型增加。
    • CB19处理4小时后,超过400个基因表达发生变化,其中近三分之一是已知的p53转录靶标,且变化方向与阿霉素处理高度一致。这表明CLK抑制通过调控DIs(如MDM4)间接激活了p53通路,引发广泛的转录重编程。
  5. DIs的组织特异性与功能关联
    • 在成年小鼠肝脏中同样鉴定出大量DIs。与mESCs共享一部分DIs(高度显著重叠),但也存在大量组织特异性DIs。
    • GO分析显示,mESC特异性DIs相关基因富集于DNA损伤响应、细胞周期等过程;肝脏特异性DIs相关基因则富集于补体/凝血、脂质/药物代谢等肝脏特化功能。这表明DIs可能参与细胞类型特异性或环境适应性的基因表达微调

结论与意义

本研究首次在全基因组范围内系统性地定义并表征了一类新型的调控性内含子——滞留内含子。DIs广泛存在于多细胞生物中,是pre-mRNA转录后加工过程中的一种普遍存在的中间状态。研究揭示了以下核心科学价值: 1. 提出了基因表达调控的新范式:DIs构成了一个核内滞留的、近乎成熟的pre-mRNA池。通过调控特定DIs的剪接速率(加速或减速),细胞能够快速、特异地改变特定基因亚型的产出,而不必从头改变转录。这为理解基因表达的“快速反应”调控提供了新视角。 2. 阐明了CLK激酶的关键调控作用:CLK激酶通过调节SR蛋白(如SRSF4)的磷酸化状态,特异性地控制着一大批DIs的剪接命运,从而在应激响应(如热激、渗透压、DNA损伤)和细胞稳态维持中扮演枢纽角色。 3. 连接了剪接调控与重要信号通路:研究发现DIs是连接剪接机器p53介导的DNA损伤响应通路的关键节点。通过调控MDM4等关键调控因子的DI剪接,细胞内外应激信号能够迅速影响p53的活性及其下游的转录程序。 4. 具有潜在的应用价值:DIs及其调控机制为理解疾病(如癌症,其中p53通路和剪接异常常见)提供了新线索。CLK激酶及其调控的DIs网络可能成为疾病治疗的新靶标。

研究亮点

  1. 概念创新:首次提出“滞留内含子”这一系统性的概念,将其从个别现象提升为一类广泛存在且具有重要调控功能的剪接中间体。
  2. 方法创新:开发了基于RNA-seq的、定量识别单个异常高丰度内含子的生物信息学新流程,为全基因组筛查类似事件提供了可靠工具。
  3. 发现的重要性:不仅鉴定了DIs,更重要的是揭示了其受激酶信号通路动态调控的机制,以及其在整合应激信号(CLK抑制、DNA损伤)与核心转录程序(p53通路)中的关键桥梁作用。
  4. 系统性验证:研究结合了严谨的生物信息学分析、深入的分子/生化实验(亚细胞定位、半衰期测定、磷酸化分析、蛋白-RNA互作)和功能验证(抑制剂、基因敲低),构建了完整的证据链,结论坚实可靠。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com