分享自:

健康与癌症中的组织间多细胞协调及其重构

期刊:NatureDOI:10.1038/s41586-025-09053-4

根据上文内容,这篇文档属于类型a,是一份关于原创性研究的报告。以下是根据要求撰写的学术报告:

单细胞全景解码跨组织多细胞生态系统及其在癌症中的重编程

本研究由北京大学前沿交叉学科研究院、生命科学学院和生物医学前沿创新中心(BIOPIC)的石强(Qiang Shi)、陈祎涵(Yihan Chen)、李阳、秦世尚、杨钰、高阳(Shenzhen Bay Laboratory)、朱林楠、王东方以及张泽民(Zemin Zhang)共同完成。该研究于2025年4月22日在线发表在 Nature 期刊上。

研究的学术背景

人体由大约37万亿个功能各异的细胞精密协作构成,这些细胞有序地组织成特定的组织、器官和系统,维持机体的稳态。理解多种细胞类型如何在组织微环境中协调运作以实现整体生理功能,是生物学的一个基础性挑战。尤其在肿瘤等疾病背景下,复杂的细胞间相互作用网络尚未被完全阐明。近年来,单细胞转录组测序技术的飞速发展以及人类细胞图谱(Human Cell Atlas)等国际计划的推进,使得我们能够以前所未有的分辨率描绘人体各组织的细胞组成,发现了大量新的细胞类型。然而,现有的研究多集中于描述细胞的多样性,对于细胞如何跨组织形成更高阶的功能模块(即多细胞生态系统)并进行协同工作的认识仍很有限。过去的研究尝试通过已知的配体-受体对来推断细胞间通讯,或利用空间转录组学技术描述细胞的空间排布,但这些方法或难以系统揭示复杂的组织水平信号网络,或受限于基因检测通量和分辨率。

因此,本研究旨在回答一个核心科学问题:在多细胞生物体中,是否存在跨组织保守的、协调运作的多细胞功能模块?这些模块如何组织,在稳态维持和疾病(特别是癌症)进程中又发生了怎样的变化?研究团队的目标是系统地识别和表征人体健康组织中的跨组织协调细胞模块,解析其时空动态和表型关联,并探究这些模块在癌症进展中的“重编程”,从而揭示多细胞生态系统在健康和疾病中的基本组织原则。

详细研究流程

本研究是一项大规模的生物信息学与计算生物学分析,主要包含以下几个步骤:

  1. 构建全面的人体跨组织单细胞图谱:

    • 研究对象与样本量: 研究团队从26个队列的33个已发表数据集中,严格筛选并整合了来自35种健康人体组织的706个样本。所有样本均为使用10x Genomics平台生成的单细胞(非单核)RNA测序数据。经过严格的质量控制(去除低质量细胞、双细胞等),最终获得了包含2,293,951个高质量细胞的庞大数据集。
    • 数据处理与方法: 首先对基因表达矩阵进行标准化、对数转换,并筛选高变基因。为整合来自不同研究、存在批次效应的数据,研究团队使用scIB平台系统评估了多种数据整合工具,最终选定表现最佳的BBKNN算法进行批次校正。通过UMAP降维可视化,确认了不同细胞类型、性别、组织和数据集的有效整合。随后,进行分层聚类和细胞注释:首先利用经典标记基因定义了8个主要的细胞大类(如B细胞、T细胞、髓系细胞、基质细胞、内皮细胞等),然后对每个大类进行更精细的亚群划分,最终定义了76个非上皮细胞亚群和26个上皮细胞类型。研究人员还开发了一个在线数据库平台(http://cm.cancer-pku.cn)以共享此图谱。
  2. 开发并应用Covarnet框架识别跨组织细胞模块:

    • 研究目标: 从细胞共现(co-occurrence)模式中系统性识别跨组织的多细胞协调模块(Cellular Modules, CMs)。
    • 方法创新: 研究团队自主研发了名为 Covarnet 的计算框架。该框架的核心思想是将多细胞协调转化为“共现细胞网络”的识别问题。其工作流程分为两个并行模块:
      • 模块一(识别共现节点): 对细胞亚群频率矩阵(76个亚群 × 510个样本)进行非负矩阵分解(Non-negative Matrix Factorization, NMF)。NMF可以从样本的细胞组成中分解出若干“因子”,每个因子赋予不同细胞亚群以权重,权重最高的亚群被视为潜在的共现节点,共同构成一个CM。
      • 模块二(识别潜在连接边): 计算所有细胞亚群两两之间的皮尔逊相关性,并引入特异性评分(specificity score) 来筛选具有高度特异性相关关系的亚群对,这些“特异性相关对”被视为CM网络中潜在的连接边。
      • 网络构建与评估: 将每个NMF因子中的top节点通过“特异性相关对”连接起来,形成候选的CM网络。随后进行拓扑和统计评估(如计算连通性分数并进行置换检验),以确保网络结构的显著性。最终,从图谱中鉴定出了12个CMs
  3. 表征细胞模块的组织偏好、空间结构与细胞通讯:

    • 组织偏好分析: 计算每个CM在不同组织中的活性,发现CMs具有明确的系统偏好性。例如,CM04、CM05、CM06、CM09富集于免疫器官(骨髓、胸腺、淋巴结、脾脏)和外周血;CM07和CM12富集于生殖系统;CM08富集于皮肤、口腔黏膜等屏障组织。
    • 空间映射验证: 为验证CMs在真实组织中的空间共定位,研究利用Visium空间转录组数据,通过 cell2location 算法将单细胞定义的细胞亚群映射到空间位置。例如,在回肠组织中,CM05(包含幼稚B细胞、T细胞等)空间上富集于派尔集合淋巴结区域,而CM02/CM03(包含产生IgA的浆细胞、组织驻留记忆T细胞等)则主要位于肠黏膜固有层。进一步使用更高分辨率的Xenium原位测序技术,清晰揭示了CM02和CM03在肠黏膜不同区域的精细分布差异。
    • 细胞通讯分析: 为探究CMs内部的协调机制,研究利用 CellPhoneDB 工具分析了CM内部细胞亚群之间的配体-受体互作。发现淋巴细胞富集的CMs在空间上更紧密,其内部细胞互作在CM活性高的样本中显著增强。此外,通过整合 Immune Dictionary(免疫细胞因子反应词典)数据,推断出不同CMs中的细胞亚群对特定细胞因子(如IL-7、IL-18、LTA等)的响应模式,并在空间数据中验证了这些细胞因子的表达与相应CM的空间定位一致。这证明了CMs不仅是细胞的简单共现,更是功能协调的单元。
  4. 探索细胞模块与生理/病理表型的动态关联:

    • 脾脏中的协调衰老动态: 分析发现,在脾脏中,CM05的活性随年龄增长而升高,CM06的活性则下降。构成这两个CM的细胞亚群(如幼稚B细胞、记忆B细胞、NR4A1高表达的CD4+ T细胞等)也呈现出一致的年龄相关变化趋势。通过SCENIC单细胞调控网络分析,发现这些共变的细胞亚群共享一套上调的转录调控因子(regulon),如AP-1复合物成员(JUN, FOS等),揭示了驱动多细胞协调衰老的共同分子机制。
    • 乳房中的纤维细胞参与的更年期轨迹: 专注于乳房富集的CM12,发现其活性在绝经后女性中显著降低。CM12中包含的多个细胞亚群(特别是三个特化的成纤维细胞亚群S06、S09、S10)的基因表达程序随着绝经状态发生协调性变化。空间分析显示这些成纤维细胞亚群在乳腺的不同区域(如小叶、导管周围)有特定分布。利用这些亚群的频率变化,研究构建了一条从绝经前到绝经后的“更年期轨迹”,揭示了特化成纤维细胞在生殖器官衰老过程中的时空动态。
  5. 系统分析癌症中多细胞生态系统的重编程:

    • 构建泛癌单细胞图谱: 收集了来自29种癌症类型的1,062个临床样本的单细胞数据,构建了泛癌单细胞图谱,并鉴定了91个细胞亚群,其中包括15个此前报道的癌症相关细胞亚群。
    • 分析肿瘤进展中的CM动态: 聚焦于8种具有匹配的健康组织、癌旁组织和肿瘤组织样本的癌症类型。分析发现,在肿瘤进展过程中,发生了两种类型的多细胞生态系统重编程:
      • 健康组织特异性CMs的丢失: 大多数癌症类型中,对应健康组织的特异性CM活性在肿瘤样本中显著下降,表明组织原有的稳态结构被破坏。
      • 趋同的癌症相关CMs的出现: 应用Covarnet在癌症数据中识别出4个癌症相关CMs(Cancer-associated CMs, CCMs)。其中,CCM02主要由癌症相关细胞亚群(如耗竭T细胞、SPP1+巨噬细胞、炎性癌症相关成纤维细胞等)组成,其活性在从健康组织到癌旁组织再到肿瘤组织的进程中逐步升高,代表了跨癌种共享的、趋同的肿瘤微环境生态系统。
    • 功能与临床意义挖掘: 对CCM02的分析发现,其内部细胞亚群对干扰素、IL-15等细胞因子有响应。同时,通过DIALOGUE算法识别出一个与CCM02活性升高相关的多细胞程序(Multicellular Program, MCP),该程序以S100A8/A9等基因为特征。利用TCGA数据库验证了该程序在肿瘤组织中高表达。更重要的是,在51例肺癌癌前病变样本中,该程序的高表达能够区分未来会进展为浸润性癌的病变与自发消退的病变,提示其作为早期诊断标志物的潜力。

主要研究结果

本研究的主要结果环环相扣,逻辑严密: 1. 成功构建了目前最全面的人体跨组织单细胞转录组图谱,系统揭示了76个非上皮细胞亚群在不同组织中的分布偏好性,为后续分析奠定了基础。 2. 创新性开发了Covarnet计算框架,并成功鉴定出12个跨组织存在的细胞模块(CMs)。这些CMs具有明确的细胞组成、组织系统偏好和空间共定位特征(如免疫器官CM、黏膜免疫CM、血管单元CM、通用基质CM等),证明多细胞协调模块是人体组织架构的普遍特征。 3. 空间转录组和原位测序数据为CMs的存在和空间组织提供了直接证据。例如,在肠道中清晰展示了分别对应于“诱导区”(CM05,位于派尔结)和“效应区”(CM02/CM03,位于固有层)的黏膜免疫模块,完美印证了免疫学理论。 4. 细胞通讯和细胞因子响应分析表明,CMs不仅是结构单元,更是功能协调单元。CM内部的细胞间通讯在CM活性高的微环境中增强,且不同CM的细胞表现出特化的细胞因子响应谱,这解释了局部微环境如何塑造整体细胞表型。 5. 将CMs与表型数据关联,发现了具有重要生物学意义的多细胞动态变化。在脾脏中,揭示了由共同转录程序驱动的、跨细胞类型的协调性衰老动态。在乳腺中,发现了由特化成纤维细胞主导的、与更年期进程相关的多细胞轨迹。这些发现将微观的细胞变化与宏观的生理进程联系起来。 6. 在癌症研究中取得关键突破。系统性地揭示了肿瘤进展伴随着多细胞生态系统的双重“重编程”:一方面,组织特异的健康CM结构被瓦解;另一方面,跨癌种趋同的、促肿瘤的CCM02生态系统逐步建立。这不仅加深了对肿瘤微环境复杂性的理解,而且由此发现的CCM02相关MCP在癌前病变中显示出预测预后的潜力,具有转化医学价值。

研究的结论与意义

本研究得出结论:人体内存在一系列跨组织保守的、协调运作的多细胞模块(CMs),这些模块构成了组织稳态的基本功能单元。研究揭示了这些模块的空间组织原则、内部通讯模式以及与衰老、生殖衰老等生理过程的动态关联。更重要的是,在癌症中,这些稳态模块被破坏,同时演化出趋同的、促肿瘤的多细胞生态系统。

该研究的科学价值在于:它首次系统性、大规模地描绘了人体多细胞生态系统的全景图,将细胞生物学的研究视角从单一细胞类型提升到了“细胞模块”和“生态系统”的水平,为理解组织水平的功能协调提供了全新的概念框架和分析工具。所构建的Covarnet方法弥补了现有空间组学技术在通量和分辨率上的不足,为整合多模态数据、解析复杂生物系统提供了有力手段。

其应用价值体现在:一方面,为研究衰老、组织再生、免疫应答等生理过程提供了新的切入点;另一方面,对癌症中多细胞生态系统重编程的深刻洞察,为寻找新的肿瘤诊断标志物和免疫治疗靶点开辟了道路。例如,针对趋同的CCM02生态系统设计干预策略,可能对多种癌症类型有效。

研究亮点

  1. 视角新颖,问题重大: 直接聚焦于“多细胞如何跨组织协调”这一生物学核心问题,研究立意高远。
  2. 数据规模空前,资源宝贵: 整合构建了超百万细胞级别的跨组织和泛癌单细胞图谱,是极具价值的公共资源。
  3. 方法创新性强: 自主研发的Covarnet框架巧妙地将NMF与特异性相关网络分析结合,为从单细胞数据中挖掘高阶生物结构提供了通用、强大的新工具。
  4. 多模态整合验证充分: 不仅依赖单细胞数据,还广泛整合了空间转录组(Visium)、超高分辨率原位测序(Xenium)、bulk RNA-seq(GTEx)、扰动数据库(Immune Dictionary)等多维度数据,使发现坚实可靠。
  5. 生物学发现深刻且具转化潜力: 从基础的组织架构规律(CMs),到生理动态(衰老、更年期),再到病理重编程(癌症),形成了一套完整的研究体系。尤其在癌症研究中提出的“健康CM丢失-趋同CCM出现”的双重重编程模型,以及发现的早期诊断相关MCP,具有重要的理论和临床意义。

其他有价值的内容

研究团队充分认识到当前工作的局限性,并在讨论中指出:当前的Covarnet框架尚未明确纳入上皮细胞、细胞外基质和微生物组等关键成分;未来需要将细胞间协调网络与细胞内调控电路整合,以获得更全面的理解;扩大队列规模和表型范围将进一步推动该领域发展。这些思考为后续研究指明了方向。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com