分享自:

近端蛋白质组学揭示人类核凝聚物的全景图

期刊:nature cell biologyDOI:10.1038/s41556-025-01809-4

近邻蛋白质组学揭示人类细胞核凝聚体景观:一张关于亚核区室功能与协同的新地图

这篇发表于2025年12月《自然·细胞生物学》的研究论文,报道了来自中山大学等多个机构的研究团队,利用先进的邻近标记技术,系统性地绘制了人类细胞核内18种核凝聚体的蛋白质相互作用图谱,并揭示了它们之间复杂的功能协同关系。研究首次发现了未表征的Bud13核凝聚体,并深入解析了核宝石与卡哈尔体协同调控端粒酶成熟、以及与组蛋白基因座体协同处理组蛋白前体mRNA的新机制。此外,该研究构建了一个名为“NOVA”的全球参考地图,可用于预测疾病相关突变或应激条件下核凝聚体动态变化,为我们理解细胞核内基因调控的时空组织提供了前所未有的资源。

一、 主要作者、机构与发表信息 本研究由中山大学生命科学学院基因功能与调控教育部重点实验室、生物防治国家重点实验室刘峰教授和宋广宇教授作为共同通讯作者领导。李若飞、李莹莹、吴苏为共同第一作者。合作单位包括中山大学附属第八医院、中山大学孙逸仙纪念医院、清华大学、国家蛋白质科学中心(北京)等。研究成果以“Proximal proteomics reveals a landscape of human nuclear condensates”为题,于2025年11月28日在线发表于国际顶级期刊 《Nature Cell Biology》(第27卷,第2198-2213页)。

二、 研究背景 在哺乳动物细胞核中,存在着多种无膜包被的亚细胞结构,称为核凝聚体(Nuclear Condensates, NCs)或核体。它们通过液-液相分离(Liquid-Liquid Phase Separation, LLPS)形成,是执行染色质结构与调控、DNA复制与修复、转录、RNA加工、核糖体生物合成等关键活动的功能中心。核凝聚体的结构异常或功能障碍与神经退行性疾病、癌症等多种疾病密切相关。

迄今为止,人类细胞中至少已报道了18种不同类型的核凝聚体,如核仁、卡哈尔体(Cajal Body, CB)、核斑(Nuclear Speckle, NS)、旁斑(Paraspeckle, PS)、核宝石(Nuclear Gem, Gem)和早幼粒细胞白血病核体(PML-NB)等。尽管对单个核凝聚体的功能已有一定研究,但这些核凝聚体如何在时空上协同组织、如何共同调控基因表达流程,以及是否存在新的、未表征的核凝聚体,仍是悬而未决的重要科学问题。因此,系统地绘制核凝聚体的蛋白质组成图谱,解析它们之间的相互作用网络,对于理解细胞核的精密组织方式和相关疾病的发病机制具有重大意义。

三、 详细研究流程 本研究采用了多步骤的系统生物学方法,核心是利用PHASTID这一快速生物素邻近标记技术,结合蛋白质组学、生物信息学和功能验证。

1. 研究设计与标记系统构建 * 研究对象与样本量: 研究选取了人类宫颈癌细胞系(HeLa细胞),针对18种已知的核凝聚体,共选择了41个具有代表性的标记蛋白作为“诱饵”(bait)。每个诱饵构建了稳定表达细胞系。 * 核心技术与方法: 研究采用PHASTID系统。这是一种由本研究团队先前开发的、可在分钟尺度上揭示蛋白质相互作用组动态的邻近标记系统。其核心是将一个经过工程化改造的、具有高催化效率的生物素连接酶(TurboID变体)与诱饵蛋白融合。当在细胞培养基中添加生物素时,该酶能在极短时间内(本研究为16小时,但系统支持短至数分钟)将生物素共价标记到诱饵蛋白邻近(约10-20纳米范围内)的蛋白质上。 * 实验流程: a. 稳定细胞系构建与验证: 通过低滴度慢病毒感染,在HeLa细胞中稳定表达41个融合了PHASTID和Flag/HA标签的核凝聚体标记蛋白。通过免疫荧光共聚焦显微镜验证,所有41个诱饵蛋白均表现出预期的亚细胞定位和凝聚体形态,确保了后续实验的特异性。 b. 邻近标记与样品制备: 在稳定细胞系中加入生物素进行标记。同时,以表达仅带核定位信号(NLS)的PHASTID的细胞作为阴性对照,以最大程度减少非特异性标记背景。标记完成后,提取细胞核组分。 c. 亲和纯化与质谱分析: 利用链霉亲和素磁珠富集被生物素标记的蛋白质,随后进行液相色谱-串联质谱分析。每个诱饵实验均设置了三次生物学重复,以确保数据的可靠性。

2. 蛋白质组数据分析与核凝聚体特征解析 * 数据处理标准: 从质谱数据中鉴定出的蛋白质,需满足至少含有两条独特肽段,且与阴性对照相比富集倍数≥3倍,才被认为是显著富集的邻近相互作用蛋白。 * 结果总览: 最终共鉴定出2,390个蛋白质,代表了10,126个邻近相互作用。数据分析表明,数据质量符合预期:与已知数据库相比,鉴定出的已知相互作用蛋白比例与先前同类研究相当;基因本体(GO)富集分析显示,每个核凝聚体捕获的蛋白质功能与其预期定位/功能高度一致。 * 核心成分提取: 为定义每个核凝聚体的核心成分,研究采用了严格标准:选择在特定核凝聚体中富集倍数排名前10%、且被该凝聚体大多数诱饵蛋白检测到的蛋白质。 * 新算法开发与应用: 为了量化不同核凝聚体之间的空间关联,本研究开发了一种基于皮尔逊相关系数的“相关性相关”评分算法。该算法假设空间相邻的核凝聚体或诱饵蛋白,其邻近蛋白质组具有更高的相似性。通过计算RA分数,可以系统地识别和量化已知及潜在的核凝聚体间相互作用。

3. 功能验证与机制探究 基于蛋白质组学和RA分数分析获得的线索,研究团队对关键的发现进行了深入的细胞和分子生物学验证。 * Gem-CB协同调控端粒酶成熟: * 验证实验: 免疫荧光确认Gem与CB在细胞核内高度共定位。RA分数分析显示CB组件WRAP53与所有5个Gem标记蛋白高度关联。 * 功能扰动: 使用药物EPZ015666抑制Coilin的对称性二甲基精氨酸修饰,从而破坏SMN1与Coilin的相互作用,导致Gem与CB物理分离。 * 表型检测: 在CB-Gem分离后,检测到端粒酶活性显著下降,同时端粒酶RNA组分hTR的前体(含poly-A尾巴)发生积累。RNA免疫共沉淀实验进一步证实,分离后Coilin和SMN1对hTR前体的结合能力下降。 * 调控因子发现: 发现核糖核蛋白GAR1可作为“帽蛋白”(cap protein)调控CB-Gem相互作用。过表达GAR1会抑制CB-Gem接触并降低端粒酶活性,而敲低GAR1则产生相反效果。 * Gem-HLB协同调控组蛋白前体mRNA加工: * 验证实验: 免疫荧光证实Gem与HLB存在共定位。蛋白质组数据显示两者共享U7 snRNP加工相关蛋白。 * 功能扰动: 同样使用EPZ015666处理破坏Gem-HLB相互作用。 * 表型检测: 发现Gem-HLB相互作用减弱后,U7 snRNP组件LSM11在HLB中的共定位减少,复制依赖性组蛋白(RDH)基因的前体mRNA(含poly-A尾巴)水平升高,而成熟组蛋白mRNA总量下降,表明前体mRNA的3‘端加工受损。 * 机制阐释: 敲低Gem的支架蛋白SMN1会导致LSM11在HLB中的定位显著减少,但不影响HLB的形成或LSM11的核输入,支持了“Gem通过传递U7 snRNP组件(如LSM11)至HLB来促进组蛋白mRNA加工”的“组件传递”模型。 * 新型Bud13核凝聚体的发现与表征: * 预测: RA分数分布图显示Bud13与所有已知的18种核凝聚体关联性都很弱,提示它可能代表一个独立的核结构。 * 验证: 免疫荧光证实Bud13形成独立于已知核凝聚体的、动态的核内凝聚点。荧光漂白恢复实验表明其具有快速流动性,符合液-液相分离特性。 * 鉴定: 鉴定出SNIP1和RBMX2为Bud13凝聚体的共定位成分。 * 功能初探: Bud13邻近蛋白质组富集RNA剪接和DNA损伤修复相关功能。研究发现,在转录抑制剂放线菌素D或紫外照射处理后,Bud13凝聚体会迅速增大和浓缩,提示其可能参与细胞对特定应激(尤其是激活核苷酸切除修复途径的应激)的响应。

4. NOVA地图的构建与应用 * 地图构建: 研究团队整合了本研究产生的54个PHASTID数据集以及311个已发表的邻近标记数据集,利用均匀流形逼近与投影(UMAP) 降维算法,将蛋白质的RA分数分布嵌入到一个二维图谱中,命名为 NOVA地图。该地图直观地展示了不同核凝聚体成分在核空间功能上的相对位置和聚类关系。 * 应用案例一:预测疾病突变影响。 以胰腺神经内分泌肿瘤中频繁突变的PML-NB组件DAXX基因为例,对四个肿瘤相关的DAXX突变体进行了PHASTID分析。NOVA地图成功预测了不同突变体在核内的定位变化。例如,E465X突变体被预测并证实会累积在核仁中,导致核仁数量和面积增加、核糖体生物合成和蛋白质翻译增强。而A297P突变体则显示出与转录抑制因子相互作用的增强,RNA测序分析揭示其导致了一系列肿瘤相关通路的异常激活。这揭示了同一基因的不同突变可能通过截然不同的分子机制影响细胞功能,为个性化治疗提供了线索。 * 应用案例二:揭示应激响应动态。 通过对热休克因子1在热激条件下的PHASTID分析,NOVA地图动态捕捉到了HSF1从基础状态下的“过渡区”向热激状态下PML-NB/异染色质区域的转移。对全部18种核凝聚体在15分钟热激后的分析表明,大多数核凝聚体结构稳定,但CB与Gem的相互作用在热激后增强,RA分数距离显著缩短,功能上表现为hTR前体水平下降。这展示了NOVA地图在解析快速生物过程中的核凝聚体动态与功能调控方面的强大能力。

四、 主要研究结果 本研究获得了系统性的成果,主要可分为以下几个层面: 1. 全面的人类核凝聚体邻近蛋白质组图谱: 成功绘制了18种人类核凝聚体在HeLa细胞中的高可信度蛋白质相互作用图谱,定义了它们的核心成分,并揭示了其在蛋白质结构域和本质无序区(IDR)基序上的特征。例如,DNA相关的核凝聚体富集C2H2、ING、PHD等结构域,而RNA相关的核凝聚体则富集KH、RRM等结构域。 2. 核凝聚体功能沿中心法则组织: GO和蛋白质复合物富集分析发现,核凝聚体在功能上呈现出高度组织化的架构,大致遵循“DNA加工与转录”到“RNA成熟与降解”再到“核糖体生物合成”的中心法则流程。这表明核凝聚体是协调基因调控级联反应的关键枢纽。 3. 揭示了两种核凝聚体协同作用模式: * 协同模式:Gem-CB协同调控端粒酶成熟为例。两者通过物理接触形成功能单元,共同调控hTR的3‘端加工和成熟。破坏其共组织(通过药物或调控蛋白GAR1)会直接损害端粒酶活性。 * 组件传递模式:Gem-HLB协同调控组蛋白前体mRNA加工为例。Gem可能作为“中转站”或“供应者”,将U7 snRNP等加工组件(如LSM11)传递或招募至HLB,从而促进组蛋白前体mRNA的3’端剪切。Gem的功能更侧重于组件的传递,而非与HLB形成稳定的复合物执行加工。 4. 发现并表征了新型Bud13核凝聚体: 通过RA分数分析预测并实验证实了Bud13是一个此前未被认识的、独立的、具有相分离特性的核凝聚体。其功能可能与RNA剪接和/或核苷酸切除修复(NER)应激响应有关,拓展了我们对核内无膜细胞器种类的认知。 5. 创建了多功能参考工具——NOVA地图: 整合了大量数据集构建的NOVA地图,不仅可视化了核内各功能区室的“地理”景观,更成为一个强大的预测和分析工具。它能够:预测蛋白质的核内定位;揭示疾病相关突变如何改变蛋白质的相互作用网络和亚核定位,进而推断其致病机制;动态捕捉细胞在应激(如热激)条件下核凝聚体相互作用组的快速变化。这为研究核内事件提供了全新的时空动态视角。

五、 结论与意义 本研究通过系统性的邻近蛋白质组学分析,首次在全局层面揭示了人类细胞核内不同凝聚体之间的功能连接与协同组织规律,并绘制了相应的全景图谱。其科学价值在于: * 提供了宝贵的资源库: 所生成的高质量蛋白质相互作用数据、核心成分列表和NOVA地图,为后续研究各类核凝聚体的组成、功能和调控提供了坚实的基础数据和查询工具。 * 深化了对亚核功能组织化的理解: 明确了核凝聚体并非孤立运作,而是通过“协同”和“组件传递”等多种模式形成功能网络,有序地驱动基因信息流。这革新了我们对细胞核这一高度复杂且动态的细胞器的传统认识。 * 开辟了疾病机制研究的新范式: 通过NOVA地图分析疾病突变,展示了如何从蛋白质相互作用网络和亚细胞定位变化的维度,深入理解突变体导致疾病的异质性机制。这有助于发现新的生物标志物和开发更具针对性的个性化治疗策略。 * 推动了方法学发展: 将PHASTID快速邻近标记技术与创新的RA分数算法、NOVA地图分析框架相结合,为研究其他难以捉摸的、动态的细胞结构及其在生理病理过程中的变化提供了可借鉴的强大方法学工具箱。

六、 研究亮点 1. 系统性与全面性: 首次对如此多种类(18种)的人类核凝聚体进行了并行、系统的邻近蛋白质组学分析,构建了迄今为止最全面的核凝聚体成分与相互作用图谱。 2. 新发现: 不仅验证了已知相互作用,更重要的是发现了Bud13这一全新的核凝聚体,并深入阐明了Gem-CB和Gem-HLB两种全新的功能协同机制,对端粒酶生物学和组蛋白基因表达领域有重要贡献。 3. 方法创新: 成功开发并应用了基于RA分数的核凝聚体关联性量化算法,并创新性地构建了整合多数据集的NOVA参考地图,将静态的蛋白质组数据转化为动态的、可预测的“细胞核功能地形图”。 4. 强大的应用潜力: 研究超越了基础描述,展示了如何利用所构建的资源(图谱、算法、数据库)来解决实际生物学问题,如解析疾病突变的多机制致病原理刻画应激条件下的快速核内动态响应,体现了极高的转化和应用价值。

七、 其他有价值的内容 本研究还对数据质量进行了严格评估,包括与机器学习预测的凝聚体图谱进行交叉验证,结果显示大部分共享的核凝聚体成分一致性超过30%,证实了本数据集的高可靠性。同时,研究也讨论了不同方法(如基于静态互作网络的图谱与基于动态邻近标记的图谱)在解析核凝聚体这类动态结构时的差异与互补性,为未来该领域的研究提供了重要的方法论参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com