分享自:

单细胞水平的细胞间通讯比较分析

期刊:Nature BiotechnologyDOI:10.1038/s41587-023-01782-z

单细胞分辨率细胞间通讯比较分析框架scriabin的研究报告

一、研究团队与发表信息
本研究由斯坦福大学医学院的Aaron J. Wilk、麻省理工学院的Alex K. Shalek、斯坦福大学的Susan Holmes和Catherine A. Blish共同主导,发表于Nature Biotechnology 2024年3月刊(42卷3期)。通讯作者为Aaron J. Wilk(awilk@stanford.edu)。研究团队来自美国多个顶尖机构,涉及免疫学、单细胞基因组学、统计学等交叉学科领域。

二、学术背景与研究目标
细胞间通讯(Cell-Cell Communication, CCC)是多细胞生物维持稳态和响应内外环境变化的核心机制。随着单细胞RNA测序(scRNA-seq)技术的发展,解析复杂组织中的CCC成为可能。然而,现有方法大多基于细胞类型或簇(cluster)水平的聚合分析,丢失了单细胞水平的异质性信息,可能导致关键通讯路径被掩盖。

本研究旨在开发一种灵活、可扩展的单细胞分辨率CCC分析框架——scriabin(single-cell-resolved interaction analysis through binning),其目标包括:
1. 避免细胞聚合或降采样,保留单细胞水平的通讯信息;
2. 通过多组学数据验证框架的准确性;
3. 揭示传统方法可能忽视的通讯网络,例如在肿瘤微环境或发育过程中的稀有细胞互作。

三、研究方法与流程
scriabin包含三个核心分析流程,针对不同数据规模和科学问题灵活应用:

  1. 细胞-细胞互作矩阵(Cell-Cell Interaction Matrix, CCIM)工作流

    • 对象与样本:适用于小规模数据集(如千人级细胞),分析所有细胞对的通讯潜力。
    • 关键步骤
      • 构建CCIM矩阵M,计算每对细胞的配体-受体(ligand-receptor)表达几何均值,保留通讯方向性(sender/receiver)。
      • 基于OmniPath数据库(包含15种蛋白互作资源)定义配体-受体对,并通过NicheNet模型预测配体对受体细胞基因表达的影响,加权CCIM以突出生物学重要的互作。
    • 创新算法
      • 使用多对应分析(Multiple Correspondence Analysis, MCA)将细胞与可变基因嵌入共享低维空间,定义每细胞的基因特征。
      • 通过ALRA数据去噪技术处理scRNA-seq稀疏性,提高信噪比(图2e显示去噪后数据更接近真实CCIM)。
  2. 汇总互作图谱(Summarized Interaction Graph)工作流

    • 对象与样本:适用于大规模比较分析(如跨条件或时间点数据集)。
    • 关键步骤
      • 构建矩阵S,汇总所有配体-受体对的表达总分,通过线性回归校正测序深度影响。
      • 分箱(binning)算法:通过数据集整合(如Seurat的锚定方法)分配细胞到高分辨率“箱”(bin),确保跨样本可比性(图1)。
      • 识别通讯差异显著的细胞对,针对性构建CCIM以减少计算量。
  3. 互作程序发现(Interaction Program Discovery)工作流

    • 对象与样本:任意规模数据集,聚焦共表达配体-受体模块。
    • 关键步骤
      • 改编WGCNA(加权基因共表达网络分析)流程,发现共表达配体-受体模块(称为“互作程序”)。
      • 通过拓扑重叠矩阵(TOM)和模块连通性检验,识别显著共表达模式(图5)。

四、主要研究结果
1. 单细胞分辨率揭示肿瘤微环境中的异质性通讯
- 在鳞状细胞癌(SCC)数据中,scriabin发现耗竭性T细胞(exhausted T cells)与CD1c+树突细胞的通讯特征(如CTLA4/TIGIT上调,CCL4/CCL5下调),而传统聚类方法因耗竭细胞分布分散无法检测(图2b-c)。

  1. 技术验证与性能优势

    • 空间转录组验证:在11个空间数据集(如10x Visium)中,scriabin预测的高互作细胞对的空间距离显著短于随机对照(图3b)。
    • 遗传扰动实验:在CRISPRa perturb-seq筛选中,scriabin能准确预测T细胞的引导RNA(gRNA)靶标(AUC=0.93,图3c)。
    • 转染实验:NK细胞过表达CD40L与B细胞过表达CD40的共培养中,scriabin特异性捕获CD40L-CD40互作,而其他方法产生假阳性(图3e-f)。
  2. 传统方法遗漏的已知通讯路径

    • 在麻风病肉芽肿(lepra granuloma)数据中,scriabin明确识别IFNγ(干扰素γ)为髓系细胞的关键配体,而聚合方法因样本间异质性误报IL1b/CCL21(图4c-e)。
  3. 发育生物学应用

    • 在人类胎儿肠道发育图谱(76,592细胞)中,发现IP1互作程序(含RSPO3/EPHB3)特异富集于肠道干细胞(ISC),验证了小鼠中GREM1+成纤维细胞维持ISC生态位(niche)的机制在人类中的保守性(图5d-f)。

五、研究结论与价值
scriabin首次实现了单细胞分辨率的CCC系统性比较分析,其科学和应用价值包括:
- 科学意义
1. 揭示细胞通讯的精细异质性(如耗竭T细胞的特有信号)。
2. 整合多模态数据(空间转录组、遗传筛选)提升预测可信度。
3. 支持纵向分析,追踪时间依赖的通讯电路(如SARS-CoV-2感染中未感染细胞的早期炎症信号启动,图6)。
- 应用潜力
1. 为肿瘤免疫、发育生物学等领域的机制研究提供新工具。
2. 开源R包(https://github.com/blishlab/scriabin)兼容主流单细胞分析流程(如Seurat)。

六、研究亮点
1. 方法创新性
- 首个避免聚合/降采样的单细胞CCC框架,解决数据膨胀(data inflation)问题。
- 分箱算法和互作程序发现流程兼顾分辨率与计算效率。
2. 生物学发现
- 鉴定稀有细胞互作(如ISC生态位中的成纤维细胞-内皮细胞对话)。
- 揭示空间邻近性可通过转录组数据间接推断。

七、其他重要内容
- 局限性:未考虑多亚基受体复合物或抑制性信号(依赖NicheNet的限制)。
- 未来方向:拟支持多组学数据(如蛋白表达)和动态信号网络建模。

scriabin为CCC研究提供了兼顾分辨率与规模的新范式,其开源性和模块化设计将推动精准细胞互作研究的广泛开展。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com