本研究报告题为“detained introns are a novel, widespread class of post-transcriptionally spliced introns”,由Paul L. Boutz, Arjun Bhutkar, 和 Phillip A. Sharp(通讯作者)共同完成,作者单位均隶属于麻省理工学院 David H. Koch 癌症综合研究所。该研究成果发表于2015年,刊载于期刊Genes & Development。
本研究属于分子生物学与遗传学领域,聚焦于前体信使RNA(pre-mRNA)剪接这一核心基因表达调控过程。传统观点认为,哺乳动物细胞中大多数内含子的剪接发生在转录过程中(共转录剪接)。然而,已有零星研究表明,部分内含子可能在转录完成后才被剪接(转录后剪接),但其普遍性、调控机制和生物学意义尚不清楚。本研究团队在对小鼠胚胎干细胞(mESCs)进行深度测序时,意外发现多聚腺苷酸化RNA中,许多特定的内部内含子丰度显著高于同一转录本内的其他内含子。这些内含子具有半衰期长、滞留于细胞核内、且不受无义介导的mRNA降解途径(Nonsense-Mediated Decay, NMD)影响等特征。研究者将其命名为“滞留内含子(Detained Introns, DIs)”。本研究旨在:1)在全基因组范围内系统性地识别和鉴定DIs;2)阐明DIs的基本特性与进化保守性;3)探索DIs是否受到细胞信号通路的调控,特别是与应激响应激酶CLK相关的调控;4)揭示DIs在基因表达调控中的潜在功能。
本研究包含一系列紧密衔接的、结合了生物信息学分析、分子生物学实验和功能验证的实验流程。
第一步:DIs的发现与全基因组鉴定 * 研究对象与样本:主要利用公开的和小鼠胚胎干细胞(mESCs)生成的多聚腺苷酸化RNA测序(RNA-seq)数据。同时,整合了人类胚胎干细胞(hESCs)、HeLa、HepG2、HUVEC等多种人类细胞系以及成年小鼠肝脏的RNA-seq公共数据(来自ENCODE项目)进行跨物种和跨组织比较。 * 数据处理与分析方法:开发了一种新颖的生物信息学分析流程。核心是使用R包DESeq进行差异表达分析,但分析对象是单个内含子。对于每个表达的基因,计算每个内部内含子的实际观测读段数,并与基于基因表达水平和其他内含子丰度估算的“期望”读段数进行比较。通过设置严格的统计阈值(错误发现率FDR < 1%),识别出那些丰度显著高于期望值的内含子,即初步定义的DIs。这种方法有效排除了测序本身的随机“噪音”,实现了对DIs的定量识别。 * 实验验证:为验证RNA-seq分析结果,对多个候选DIs及其邻近的非滞留内含子进行了实时定量逆转录聚合酶链式反应(qRT-PCR),使用跨越外显子-内含子连接处的引物进行定量。结果证实,生物信息学预测的高丰度内含子确实在RNA水平上显著富集。
第二步:DIs的基本特性分析 * 剪接类型分析:使用TopHat和Cufflinks等工具,根据RNA-seq数据中的剪接连接点,将内含子分类为组成型、5‘/3’端可变剪接位点、盒式外显子等类型。分析DIs在不同剪接事件类型中的分布。 * 序列与结构特性分析:比较DIs与非DIs在序列进化保守性(使用PhastCons分数)、剪接位点强度(使用MaxEnt算法)、内含子长度、在基因中的相对位置等方面的差异。 * 功能富集分析:对含有DIs的基因进行基因本体(GO) 分析,以确定DIs是否富集于特定生物学功能的基因中。 * 亚细胞定位分析:利用ENCODE项目中人类细胞系核质分离的RNA-seq数据,并通过细胞生化分级分离实验结合qRT-PCR,分析含有DIs的转录本在细胞核与细胞质中的分布。同时,通过抑制转录(使用Flavopiridol)并追踪内含子消失的动力学,估算DIs的半衰期。 * NMD途径验证:利用已发表的Upf1(NMD关键因子)敲低的mESCs RNA-seq数据,分析DIs丰度是否变化。同时,使用siRNA敲低Upf1并结合qRT-PCR,检测已知或预测含有NMD开关外显子的基因中,DI转录本是否被稳定。
第三步:CLK激酶对DIs的调控机制研究 * 药物处理与表型分析:用特异性小分子抑制剂CB19处理mESCs,抑制CLK激酶活性。设置不同时间点(2小时和4小时)收获细胞,提取RNA进行RNA-seq和qRT-PCR分析。 * 剪接变化的全基因组分析:比较CB19处理组与对照组(DMSO)的RNA-seq数据,系统地鉴定受CLK抑制影响而发生剪接变化的DIs。分析这些变化是导致内含子滞留增加还是剪接效率提高。 * 转录后调控验证:在先用Flavopiridol阻断转录30分钟后,再给予CB19或DMSO处理,随后检测特定DIs的丰度变化,以确定CB19的效应是否发生在转录后阶段。 * 磷酸化调控机制探索:通过蛋白质免疫印迹(Western Blot),使用特异性抗体(如1H4抗磷酸化SR蛋白抗体和SRSF4特异性抗体),检测CB19处理后细胞中SR蛋白(特别是SRSF4)磷酸化状态的变化。 * RNA结合蛋白作用分析:重新分析已发表的SRSF3和SRSF4的iCLIP(单个核苷酸分辨率交联免疫沉淀)数据集,寻找这些SR蛋白在CB19响应性DIs及其侧翼区域的结合位点,以探索其直接调控作用。并通过shRNA敲低SRSF4,验证其对特定基因(如CLK1、HNRNPH1、SRSF5)DI剪接的影响。
第四步:DNA损伤应激下的DIs调控 * 应激模型建立:使用阿霉素(Doxorubicin) 处理mESCs,诱导DNA损伤和p53通路激活。 * 靶向分析:通过qRT-PCR,重点检测已知与DNA损伤响应相关的基因(如MDM4、BCLAF1等)中DIs的丰度变化,以及相应的NMD亚型与编码亚型的比例变化。 * 信号整合分析:比较CB19处理与阿霉素处理引起的p53蛋白水平变化及下游转录组变化的相关性,探讨不同应激信号对重叠DI调控网络的影响。
第五步:DIs在分化组织中的存在 * 组织样本分析:利用ENCODE项目提供的成年小鼠肝脏RNA-seq数据,应用相同的生物信息学流程鉴定DIs,并与mESCs中的DIs集合进行比较,分析其保守性和组织特异性。
本研究首次在全基因组范围内系统性地定义并表征了一类新型的调控性内含子——滞留内含子。DIs广泛存在于多细胞生物中,是pre-mRNA转录后加工过程中的一种普遍存在的中间状态。研究揭示了以下核心科学价值: 1. 提出了基因表达调控的新范式:DIs构成了一个核内滞留的、近乎成熟的pre-mRNA池。通过调控特定DIs的剪接速率(加速或减速),细胞能够快速、特异地改变特定基因亚型的产出,而不必从头改变转录。这为理解基因表达的“快速反应”调控提供了新视角。 2. 阐明了CLK激酶的关键调控作用:CLK激酶通过调节SR蛋白(如SRSF4)的磷酸化状态,特异性地控制着一大批DIs的剪接命运,从而在应激响应(如热激、渗透压、DNA损伤)和细胞稳态维持中扮演枢纽角色。 3. 连接了剪接调控与重要信号通路:研究发现DIs是连接剪接机器与p53介导的DNA损伤响应通路的关键节点。通过调控MDM4等关键调控因子的DI剪接,细胞内外应激信号能够迅速影响p53的活性及其下游的转录程序。 4. 具有潜在的应用价值:DIs及其调控机制为理解疾病(如癌症,其中p53通路和剪接异常常见)提供了新线索。CLK激酶及其调控的DIs网络可能成为疾病治疗的新靶标。