关于U1 snRNP调控非编码RNA染色质滞留机制的学术研究报告
本研究于2020年4月2日发表于国际顶级学术期刊《自然》(Nature)第580卷。论文的通讯作者是来自清华大学的沈晓骅(Xiaohua Shen)和尹亚飞(Yafei Yin),主要合作单位包括清华大学生命科学学院、清华-北大生命科学联合中心、清华大学结构生物学高精尖创新中心、中国科学技术大学生命科学学院,以及美国罗格斯新泽西医学院。
一、 研究背景与目标
本研究属于分子生物学与表观遗传学交叉领域,聚焦于长链非编码RNA(long noncoding RNA, lncRNA)的亚细胞定位调控机制。lncRNA是一类长度超过200个核苷酸、通常不编码蛋白质的RNA分子。大量研究表明,许多lncRNA在细胞核内,特别是与染色质紧密结合,并在染色质结构调控、转录、RNA加工等过程中发挥关键作用。然而,作为一个庞大的功能类别,lncRNA普遍富集于染色质的分子机制尚不明确。此前研究仅发现少数lncRNA(如Xist)通过特定重复序列实现核定位,但这无法解释lncRNA作为一个整体对染色质的普遍亲和性。
因此,本研究旨在系统性地探索并揭示驱动lncRNA在染色质上滞留和定位的通用性顺式作用元件(cis-elements)及反式作用因子(trans-factors),以期阐明lncRNA实现其染色质相关功能的根本分子基础。
二、 详细研究流程与方法
本研究设计严谨,环环相扣,主要包含以下几个关键步骤:
1. 开发高通量筛选方法——RNA亚细胞定位元件测序(REL-seq)及其突变体耦合版本(MUTREL-seq) 为了在全基因组范围内无偏地鉴定负责RNA定位到染色质的序列元件,研究团队首先开发了一种名为“RNA亚细胞定位元件测序”(RNA elements for subcellular localization by sequencing, REL-seq)的高通量筛选技术。 * 研究对象与样本构建: 研究选取了9个具有代表性的染色质结合型lncRNA和细胞质定位型mRNA转录本(来自小鼠和人类细胞)作为“诱饵”。将这些RNA的cDNA随机片段化,产生覆盖全长的短片段文库。 * 报告系统构建: 将这些随机片段分别克隆到三种不同的报告基因载体中:一种是在绿色荧光蛋白(GFP)编码序列两侧插入小鼠Actin基因内含子的“AI”载体(5‘AI和3’AI),另一种是单独的GFP报告载体。这些载体通过piggyBac转座子系统稳定整合到小鼠胚胎干细胞(mESC)或人HEK 293T细胞的基因组中。 * 筛选与测序: 对稳定表达报告基因的细胞进行亚细胞分级分离,分别提取细胞质和染色质结合部分的RNA。通过针对报告基因设计的引物进行逆转录和PCR扩增,然后进行高通量测序。 * 数据分析: 通过比较染色质组分与细胞质组分中每个RNA片段的丰度,鉴定出在染色质上显著富集的片段,称为“染色质富集RNA片段”(EnCHRs)。在筛选出的众多EnCHRs中,研究团队选择了一个来自Nxf1基因(其mRNA保留了内含子)的162个核苷酸的EnCHR(Nxf1-EnCHR)进行深入机制研究。 * 随机突变筛选(MUTREL-seq): 为了精确定位该EnCHR中负责染色质结合的关键核苷酸,研究者对Nxf1-EnCHR进行了饱和随机突变,构建了覆盖所有可能单点突变的文库,然后再次进行REL-seq筛选。通过比较突变体与野生型在染色质/细胞质分布上的变化,他们鉴定出了一个对染色质滞留至关重要的7个核苷酸区域。
2. 关键顺式元件的鉴定与验证 * 结果分析: MUTREL-seq结果显示,Nxf1-EnCHR中第39-45位核苷酸的突变会严重损害其染色质结合能力。生物信息学分析揭示,该区域及其上游两个核苷酸共同构成了一个与U1小核核糖核蛋白(U1 small nuclear ribonucleoprotein, U1 snRNP)中的U1 snRNA 5‘端序列完美互补配对(9个碱基对)的识别位点。 * 实验验证: 研究者构建了携带野生型或突变型U1识别位点的GFP报告基因。实验证实,只有当U1识别位点完整时,报告RNA才能有效地定位到染色质。这种效应不依赖于RNA的稳定性或polyA尾,因为将polyA信号替换为能形成三螺旋结构以稳定RNA的MALAT1 3‘端序列后,结果依然一致。此外,将U1识别位点插入一个含有内含子的报告基因中,并突变其3’剪接位点,会进一步增强报告RNA的染色质滞留,且该增强作用依赖于完整的5‘ U1位点。这些结果共同证明,U1 snRNP能够促进携带5’ U1识别位点但缺乏3‘剪接位点的RNA与染色质结合。
3. 基因组范围的关联分析与U1 snRNP功能的全局性探究 * 生物信息学分析: 研究者系统分析了小鼠和人类细胞中lncRNA和mRNA的序列特征。发现与mRNA相比,lncRNA的外显子区含有显著更高密度的预测强U1识别位点,而其基因体内3‘剪接位点的密度则显著较低。此外,染色质富集程度越高的RNA(从细胞质mRNA到染色质mRNA再到lncRNA),其U1识别位点的密度和U1 snRNA结合信号也逐步升高。 * 功能性干扰实验: * U1 snRNA抑制: 使用反义吗啉寡核苷酸(AMO)短期(2小时)抑制小鼠胚胎干细胞中的U1 snRNA功能。通过链特异性RNA测序分析染色质、核质和细胞质三个组分的RNA,发现在1282个可检测的lncRNA中,有337个(26.3%)在染色质上的结合显著减少,同时在核质或细胞质中的信号增加。 * U1 snRNP关键蛋白组分SNRNP70的快速降解: 为了更精确、可诱导地研究U1 snRNP的功能,研究团队构建了带有AID(auxin-inducible degron)降解标签的SNRNP70小鼠胚胎干细胞系(SNRNP70-AID)。加入生长素(auxin)4小时内,SNRNP70蛋白水平下降90%。同样地,全转录组测序(总RNA-seq)显示,346个lncRNA(27%)的染色质结合显著减少。这些受影响的lncRNA与AMO抑制实验的结果高度重叠,且它们本身具有更强的U1 snRNA结合活性和更高的表达水平。 * 区分转录与定位效应: 为了排除U1 snRNP影响lncRNA染色质结合是通过改变其转录或加工的可能性,研究者进行了一系列精细实验: 1. polyA RNA测序(polyA-seq): 在降解SNRNP70后,对polyA化的成熟RNA进行分析,发现仍有23.6%的lncRNA在染色质上减少,且变化趋势与总RNA-seq高度相关。 2. 新生RNA代谢标记测序(SLAM-seq): 使用4-硫代尿苷(4sU)脉冲标记新生转录本,发现在492个可检测的新生polyA lncRNA中,有115个(23.4%)在染色质上的定位减少。新生转录本与总转录本的变化高度相关。 3. 瞬态转录组测序(TT-seq)和RNA聚合酶II染色质免疫共沉淀测序(Pol II ChIP-seq): 急性降解SNRNP70并未改变全基因组的总体转录速率,也未改变Pol II在启动子近端暂停和延伸状态的分布。 4. 抑制RNA外切体: 敲低RNA外切体关键组分EXOSC3,并不能挽救SNRNP70降解导致的lncRNA染色质结合减少。 * 这些综合数据强有力地证明,U1 snRNP直接参与了将新生和成熟的lncRNA“拴系”在染色质上的过程,而非通过间接影响转录、RNA加工或降解动力学来实现。
4. U1 snRNP作用机制的深入探索 * U1 snRNP与转录机器的相互作用: 通过质谱分析和免疫共沉淀实验,发现SNRNP70与转录延伸因子(如SPT5, SPT6)以及处于活跃转录状态(Ser2和Ser5磷酸化)的RNA聚合酶II(Pol II)大亚基(POLR2A)存在相互作用。这种相互作用在核酸酶(如苯扎氯铵)处理下依然存在,提示其不依赖于RNA或DNA,可能是蛋白质-蛋白质直接相互作用。 * 转录依赖性的验证: 使用转录抑制剂Flavopiridol或Triptolide处理细胞,会降低染色质上SNRNP70、SNRPC蛋白和U1 snRNA的水平,同时也减少了所检测lncRNA的染色质结合。这表明活跃的Pol II转录机器对于U1 snRNP及其靶向lncRNA在染色质上的富集至关重要。 * 剪接体其他组分的作用: 研究发现,抑制U2 snRNP(使用药物E7107)也会减弱lncRNA的染色质结合,但效果弱于抑制U1。而抑制催化性剪接体组装后期步骤(使用药物Isoginkgetin或敲低PRPF8、SNRNP200)则没有影响。这表明是剪接体组装前期的识别步骤(主要是U1,其次是U2),而非剪接反应本身,主导了lncRNA的染色质滞留。这一机制也适用于不稳定的启动子上游反义RNA(uaRNA)和增强子RNA(eRNA)。
5. 机制在具体lncRNA功能中的体现——以MALAT1为例 研究者选择了一个典型的不被剪接且无polyA尾的lncRNA——MALAT1作为模型,深入探讨U1机制的生物学意义。 * U1 snRNP对MALAT1定位的影响: 尽管MALAT1不被剪接,但其RNA上存在广泛的U1 snRNA结合位点。抑制U1 snRNP功能会显著降低MALAT1在染色质上的水平,但不严重影响其总表达量。 * 全基因组结合位点分析(ChIRP-seq): 通过染色质RNA纯化测序技术发现,快速降解SNRNP70会急剧减少MALAT1在全基因组范围内活性基因位点上的结合。 * RNA荧光原位杂交(FISH): 在SNRNP70降解后,MALAT1 RNA原本在核内呈斑点状(与核斑共定位)的分布模式被破坏,变得弥散,而核斑标记蛋白SC35的定位不受影响。使用转录抑制剂Triptolide处理也消除了MALAT1在其自身基因座及其他基因组位点的结合。 * 这些结果表明,U1 snRNP以转录依赖的方式,调控着MALAT1在染色质上的定位和功能发挥。
三、 主要研究结果
四、 研究结论与意义
本研究得出了一个核心结论:U1 snRNP通过识别lncRNA上富集的5‘剪接位点(U1 motif),并以转录依赖的方式,广泛地将lncRNA拴系和动员到染色质上。 这为lncRNA作为一个整体为何以及如何富集于染色质提供了一个普适性的分子机制模型。
其科学价值与应用前景在于: 1. 揭示了U1 snRNP的新功能: 传统上认为U1 snRNP的核心功能是参与前体mRNA的5‘剪接位点识别和剪接体组装。本研究首次发现并证实了U1 snRNP在剪接之外的全新角色——作为lncRNA的染色质定位因子,拓展了我们对这一核心核糖核蛋白复合物功能的认知。 2. 阐明了lncRNA亚细胞定位的通用法则: 提出了一个简洁而有力的“U1模型”,解释了为何lncRNA普遍倾向于滞留在细胞核染色质上。该模型将lncRNA的序列特征(富含U1位点、缺乏3‘剪接位点)、其与核心剪接机器组分的相互作用,以及活跃的转录过程有机地联系起来。 3. 连接了转录与lncRNA功能: 研究揭示了U1 snRNP作为桥梁,将活跃的转录机器(Pol II)与染色质结合的lncRNA连接起来。这暗示lncRNA可能作为“RNA胶水”,将U1 snRNP和Pol II机器维持在基因调控位点,形成一个调控因子的储备库,从而反馈调节转录和染色质状态。 4. 提供了新的研究视角与工具: 研究所开发的REL-seq/MUTREL-seq方法为系统鉴定RNA亚细胞定位元件提供了强大工具。所发现的机制为理解lncRNA、uaRNA、eRNA等非编码RNA在基因表达调控网络中的作用提供了新的理论框架。
五、 研究亮点