分享自:

基于邻近蛋白质组学揭示人类核凝聚物的全景图

期刊:nature cell biologyDOI:10.1038/s41556-025-01809-4

关于《近端蛋白质组学揭示人类核凝聚物的全景图》研究的学术报告

本报告旨在向国内研究人员介绍一项于2025年12月发表在《自然-细胞生物学》(*Nature Cell Biology*)上的重要研究。该研究由中山大学生命科学学院、中山大学附属第八医院、中山大学孙逸仙纪念医院、清华大学、北京蛋白质组研究中心等多个机构的Ruofei Li, Yingying Li, Su Wu, Zhifen Zhou, Feng Liu, Zhou Songyang 等学者共同完成。

一、 研究背景与目的

本研究的核心科学领域是细胞核内无膜细胞器,也称为核凝聚物(Nuclear Condensates, NCs)或核体的生物学。细胞核是细胞的遗传信息控制中心,其内部并非均质,而是存在着多种由蛋白质和核酸通过液-液相分离(Liquid-Liquid Phase Separation, LLPS)形成的、无膜包被的动态结构,即核凝聚物。这些结构包括核仁(Nucleolus)、卡哈尔体(Cajal body, CB)、核斑(Nuclear Speckle, NS)、旁斑(Paraspeckle, PS)、核宝石(Nuclear Gem, Gem)、早幼粒细胞白血病核体(PML-NB)等。它们像功能特化的“车间”,在基因转录、RNA加工、核糖体合成、DNA损伤修复等关键核内活动中扮演着空间组织和功能分隔的角色。核凝聚物的结构与功能异常与神经退行性疾病、癌症等多种疾病密切相关。

尽管对单个核凝聚物的研究已取得进展,但整个核内凝聚物的组成图谱、它们之间的功能协同组织方式、以及在不同生理或应激条件下的动态变化,仍缺乏系统性的认识。传统研究方法(如免疫共沉淀)可能难以捕捉这些动态、脆弱结构的完整相互作用网络。因此,本研究旨在利用一种先进的近端标记技术,系统性绘制人类细胞核内主要凝聚物的“邻里”蛋白质组图谱,揭示它们之间的功能联系与组织原则,并探索其在疾病和应激响应中的动态变化。

具体研究目标包括: 1. 系统性绘制18种已知人类核凝聚物的近端蛋白质相互作用组。 2. 开发算法解析核凝聚物之间复杂的内在关联。 3. 基于蛋白质组数据,发现新的核凝聚物类型。 4. 揭示特定核凝聚物对(如核宝石与卡哈尔体、核宝石与组蛋白基因座体)协同工作的具体分子机制。 5. 构建一个全局参考图谱(NOVA map),用于理解应激条件下核凝聚物的动态以及疾病相关突变如何影响其相互作用组。

二、 研究详细工作流程

本研究采用了多步骤、系统性的蛋白质组学与细胞生物学相结合的策略,主要流程如下:

步骤一:研究系统建立与数据采集 1. 研究模型与标记系统:研究选用HeLa细胞作为模型。研究人员采用了其团队此前开发的PhastID(一种基于生物素邻近标记的系统)技术。该技术的优势在于能在活细胞、分钟级时间尺度上捕获蛋白质相互作用的动态,特别适合研究像核凝聚物这样动态的结构。 2. 诱饵蛋白选择与细胞系构建:研究选取了18种已知核凝聚物的41个标志性蛋白作为“诱饵”(Bait)。通过低滴度慢病毒感染,在HeLa细胞中稳定表达了带有PhastID标签和Flag/HA标签的这些诱饵蛋白,并验证了它们能正确定位并形成预期的凝聚物形态。 3. 邻近标记与质谱分析:对41个稳定细胞系分别进行生物素处理,进行邻近标记。随后提取细胞核组分,通过链霉亲和素下拉富集被生物素标记的邻近蛋白质,并进行液相色谱-串联质谱(LC-MS/MS)分析。同时,以仅表达核定位信号(NLS)的PhastID作为阴性对照。 4. 数据筛选标准:从质谱数据中,将至少被两个独特肽段鉴定到、且与阴性对照相比富集倍数≥3的蛋白质定义为该诱饵/凝聚物的显著富集邻近相互作用蛋白。

步骤二:数据整合与核凝聚物特征分析 1. 数据集构建:最终获得了涵盖18种核凝聚物的2390个高置信度邻近相互作用蛋白,构成了10126个相互作用对的数据集。数据质量通过已知组分富集度、与已发表数据集比对、基因本体(GO)功能富集分析等多方面进行了验证。 2. 核心组分定义与特征分析:为每个核凝聚物定义了其核心组分(在富集倍数和检出率上排名前10%的蛋白质)。对这些核心组分进行了深入分析,包括: * 功能聚类:通过蛋白质复合物和GO富集分析,发现核凝聚物可大致分为DNA/转录相关组和RNA加工相关组,而PML-NB和CB似乎在这两组间起桥梁作用,提示核凝聚物遵循中心法则进行功能层级组织。 * 序列特征分析:分析了各凝聚物核心组分的蛋白质结构域和内在无序区(IDR)基序特征。发现DNA相关NCs富含C2H2、ING、PHD等结构域,而RNA相关NCs富含KH、RRM等结构域。核孔复合体和核纤层则富含疏水性的FG基序。 3. 开发关联性评分算法:为了量化核凝聚物之间的空间和功能关联,研究团队开发了一种名为“关联性评分”(Relevance-Associated Score, RA Score)的算法。该算法基于标准化后的皮尔逊相关系数,假设邻近的核凝聚物或诱饵蛋白具有更相似的近端蛋白质组。RA评分成功识别了已知的核凝聚物相互作用(如CB与Gem),并预测了新的潜在关联。

步骤三:机制探索与功能验证 基于RA评分和蛋白质组数据,研究聚焦于两个关键的核凝聚物协同作用案例进行深入机制验证: 1. 核宝石与卡哈尔体在端粒酶成熟中的协同作用: * 现象观察:验证了CB和Gem在细胞核内频繁共定位。 * 关键分子发现:蛋白质组数据显示,CB组分WRAP53与所有Gem标志物高度相关,且Gem的邻近蛋白质组中包含大量端粒/端粒酶相关蛋白。 * 功能验证实验: * 使用药物EPZ015666抑制COIL的甲基化修饰,成功破坏了CB与Gem的共定位。 * 在此条件下,检测到端粒酶活性显著下降,同时端粒酶RNA组分(hTR)的前体(含poly-A尾)积累增加,表明hTR的3‘端加工成熟受阻。 * 免疫沉淀实验证实,EPZ015666处理削弱了COIL和SMN1(Gem支架蛋白)与hTR前体的结合。 * 发现并验证了核糖核蛋白GAR1作为CB-Gem相互作用的调节因子:敲低GAR1增强CB-Gem互作并上调端粒酶活性;过表达GAR1则抑制互作并降低活性。 * 敲低Gem的支架蛋白SMN1破坏Gem结构,同样导致端粒酶活性下降和hTR前体积累。 * 结论:CB与Gem通过物理上的共定位,协同促进hTR的成熟,从而调控功能性端粒酶复合体的组装。GAR1在此过程中扮演“帽蛋白”(Cap protein)角色,负调控两者的相互作用。

  1. 核宝石与组蛋白基因座体在组蛋白mRNA加工中的协同作用
    • 现象观察:发现了Gem与HLB之间存在显著的共定位。
    • 功能联系:两者共享U7 snRNP(负责复制依赖性组蛋白pre-mRNA 3‘端加工的关键复合物)组分,如LSM11。
    • 功能验证实验
      • EPZ015666处理破坏CB-Gem互作的同时,也减少了Gem与HLB的共定位,并导致LSM11在HLB中的定位减少。
      • 上述处理导致含有poly-A尾的组蛋白pre-mRNA前体积累,而成熟组蛋白mRNA总量下降,表明pre-mRNA加工受损。
      • 敲低CB的支架蛋白COIL并不影响Gem-HLB的互作及组蛋白mRNA加工,排除了CB的中介作用。
      • 敲低Gem支架蛋白SMN1,导致LSM11在HLB中的定位显著减少,组蛋白pre-mRNA加工受损,但HLB的形成和LSM11的核输入不受影响。
      • 敲低Gem组分Gemin3(一种DEAD-box ATP酶)导致Gem变大,并促进了LSM11在大型Gem中的积累以及Gem-HLB的融合,同时增强了组蛋白mRNA的3‘端加工。
    • 结论:Gem通过一种“组分传递”模式,将U7 snRNP组分(如LSM11)递送至HLB,从而促进复制依赖性组蛋白pre-mRNA的加工成熟。

步骤四:新核凝聚物的发现与表征 1. 预测:通过分析RA评分分布模式,发现剪接体相关蛋白BUD13的分布模式与所有已知的18种核凝聚物均不相似(皮尔逊相关系数<0.5),提示其可能形成独立的凝聚物。 2. 验证: * 免疫荧光证实BUD13形成独立于已知核凝聚物的核内焦点。 * 该结构在多种癌细胞和正常细胞中普遍存在。 * 荧光漂白恢复实验表明GFP-BUD13凝聚物具有高度动态性,具备液-液相分离特征。 * 鉴定了SNIP1和RBMX2作为BUD13核体的新组分。 * GO分析显示其邻近蛋白质组高度富集RNA剪接、rRNA加工等功能。 * 观察到BUD13核体常与Gem和CB形成“三相”结构。 * 研究发现,转录抑制剂放线菌素D(ActD)和紫外线照射能诱导BUD13核体显著增大,提示其可能参与转录抑制或核苷酸切除修复应激响应。

步骤五:构建NOVA图谱并应用于疾病突变与应激响应分析 1. NOVA图谱构建:研究将本研究的54个PhastID数据集与已发表的311个邻近标记数据集相结合,通过均匀流形近似与投影(UMAP)算法,生成了一个二维的“核无膜细胞器变异与关联图谱”(NOVA map)。该图谱能直观展示蛋白质在核内的“定位社区”,相同核凝聚物的组分倾向于聚集在一起。 2. 应用于疾病突变分析:以胰腺神经内分泌肿瘤中频繁突变的PML-NB组分DAXX基因为例。研究对四种DAXX突变体进行了PhastID分析,并将结果投射到NOVA图谱上。 * A297P和L130R突变体:图谱显示其定位与野生型DAXX相似但发生偏移,蛋白质组显示其与SUMO化修饰及转录抑制因子的相互作用增强。RNA-seq证实A297P突变体导致多个癌相关通路基因转录上调。 * E465X突变体:图谱成功预测其向核仁区域聚集,实验验证其确实主要定位于核仁。其邻近蛋白质组富集核仁及核糖体生物发生相关蛋白。过表达该突变体导致核仁数量和面积增加,多聚核糖体水平升高,提示其可能通过促进核糖体生成和蛋白质翻译参与肿瘤发生。 * R306X突变体:图谱显示其远离所有核社区,蛋白质组相互作用大量丢失,且蛋白本身不稳定,提示其为功能缺失型突变。 3. 应用于应激响应分析:研究了15分钟热激对核凝聚物全局的影响。 * 热激转录因子1:热激后,HSF1的邻近相互作用组发生显著变化,54个相互作用蛋白上调,主要涉及转录调控和应激响应。NOVA图谱显示,HSF1在正常条件下位于“过渡区”(富含分子伴侣和基因沉默调节因子),热激后向PML-NB和异染色质区域移动。 * 全局核凝聚物响应:大多数核凝聚物在短时热激下相互作用组变化较小(<10%),显示结构稳定性。变化主要集中在NSB、CB、TEC、PNC和PS等凝聚物,涉及转录调控、RNA加工和应激响应相关蛋白。 * 特定相互作用的动态变化:NOVA图谱预测并实验证实,热激后CB与Gem的关联性评分显著增加,两者共定位增强,同时hTR前体水平下降,表明热激瞬时增强了CB-Gem的协同组织以促进端粒酶RNA成熟,但端粒酶活性未立即变化,体现了细胞的适应能力。

三、 主要研究结果

  1. 成功绘制了迄今最全面的人类核凝聚物近端蛋白质组图谱:获得了18种核凝聚物的2390个高置信度邻近相互作用蛋白,系统揭示了各凝聚物的核心组分、功能特征(按中心法则组织)和序列偏好。
  2. 开发了RA评分算法:该算法能有效量化核凝聚物间的空间与功能关联,成功预测了已知和未知的相互作用。
  3. 揭示了两种核凝聚物协同组织的新模式
    • 协同作用模式:CB与Gem通过物理结合,共同作为功能单元调控端粒酶RNA的成熟。
    • 组分传递模式:Gem作为“供应站”,将U7 snRNP关键组分LSM11传递至HLB,以促进组蛋白pre-mRNA的加工。
  4. 发现并表征了一个新的核凝聚物——BUD13核体:该结构具有动态的液-液相分离性质,富含RNA加工相关蛋白,可能与Gem/CB存在功能联系,并对转录抑制和DNA损伤应激产生响应。
  5. 创建了NOVA全局参考图谱:该图谱整合了多源数据,能够:
    • 预测蛋白质的核内定位。
    • 揭示疾病相关突变如何改变蛋白质的相互作用网络及核内定位,从而阐释其致病机制(如DAXX不同突变通过不同机制影响肿瘤相关通路)。
    • 动态展示细胞在应激条件下核凝聚物相互作用组的快速重编程(如热激诱导HSF1重新定位并增强CB-Gem互作)。

四、 研究结论与意义

本研究通过系统性的近端蛋白质组学分析,首次提供了人类细胞核内主要凝聚物的高分辨率相互作用全景图。它不仅更新了我们对核内区室化组织的认识,更重要的是揭示了核凝聚物并非孤立运作,而是通过精密的“协同”与“传递”等模式形成功能网络,共同保障基因表达流程的效率和保真度。

科学价值: 1. 资源价值:产生的数据集和NOVA图谱是未来研究核凝聚物生物学、核内组织以及相关疾病的宝贵资源。 2. 方法论创新:展示了PhastID技术与RA评分算法、NOVA图谱相结合,在系统解析动态、无膜细胞器组成、互作及动态变化方面的强大能力。 3. 机制新发现:深入阐明了CB-Gem在端粒酶成熟、以及Gem-HLB在组蛋白mRNA加工中的具体协同机制,并引入了“帽蛋白”等概念来理解相互作用的调控。 4. 新结构发现:鉴定并初步表征了BUD13核体,拓宽了已知核内无膜细胞器的种类。 5. 疾病与应激关联:为理解疾病相关突变(如DAXX突变)如何通过扰乱特定核凝聚物的相互作用网络来驱动病理过程提供了新范式,并揭示了核凝聚物网络在应对热激等应激时的快速适应性重组。

应用潜力:该研究提出的“突变-相互作用网络改变-功能紊乱-表型”分析框架,有助于实现基于特定分子改变的精准医疗策略。对核凝聚物协同机制的深入理解,也为针对这些结构异常相关疾病(如癌症、神经退行性疾病)的药物研发提供了新的潜在靶点和思路。

五、 研究亮点

  1. 系统性:首次大规模、并行地对18种人类核凝聚物进行邻近标记蛋白质组学分析,提供了前所未有的全局视图。
  2. 创新性方法:自主研发的RA评分算法和构建的NOVA图谱,是解析和可视化核内蛋白质定位与关联的强大新工具。
  3. 机制深度:不仅停留在图谱绘制,更深入揭示了两种不同模式的核凝聚物功能协同机制,并进行了严谨的遗传和药理学验证。
  4. 新发现:成功预测并实验证实了一个全新的核凝聚物——BUD13核体。
  5. 动态与病理关联:将静态图谱扩展到动态应激响应和疾病突变分析,展示了该研究体系在解决生理和病理问题上的强大应用能力。

六、 其他有价值内容

研究还对数据质量进行了多方验证,包括与机器学习预测的凝聚物注释数据库(如ProtGPS、Protein Condensate Atlas)进行比较,发现本研究的实验数据与这些预测有相当的一致性,但也指出了基于静态相互作用网络的预测在捕捉瞬态多凝聚物枢纽方面的局限性,凸显了邻近标记技术在研究动态组装体方面的优势。这为未来构建更精确的凝聚物图谱提供了重要参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com