这篇文档属于类型b,是一篇关于CellChat工具的协议(protocol)论文,主要介绍如何使用该工具进行单细胞及空间转录组数据的细胞间通信网络分析。
本文的主要作者是Suoqin Jin(武汉大学数学与统计学院和湖北省计算科学重点实验室)以及Maksim V. Plikus和Qing Nie(加州大学尔湾分校NSF-Simons多尺度细胞命运研究中心)。该预印本于2023年11月5日发布于bioRxiv,DOIs为10.1101⁄2023.11.05.565674。
CellChat是一个用于从单细胞RNA测序(scRNA-seq)和空间转录组数据中推断和分析细胞间通信网络的计算工具。该工具基于已知的配体-受体(ligand-receptor, L-R)相互作用数据库,通过简化质量作用模型量化细胞群间的通信概率,并结合空间位置信息优化推断。
CellChat的开发是为了解决单细胞转录组数据中丢失的空间信息问题。传统的单细胞测序技术虽然能解析细胞异质性,但无法保留细胞的空间位置信息,而大多数细胞间通信事件依赖于短距离的空间邻近性。因此,CellChat结合空间转录组数据,能够更准确地推断细胞间通信网络。
文中详细介绍了CellChat V2相对于初版的改进,主要包括:
1. 空间通信分析:若细胞位置信息可用,CellChat V2可推断空间邻近的细胞间通信,仅考虑在分子最大扩散范围内的相互作用(默认250μm)。这显著减少了假阳性信号。
2. 扩展的L-R数据库(CellChatDB):包含了超过1000种蛋白质和非蛋白质相互作用(如代谢、突触信号),整合了CellPhoneDB和NeuronChatDB等数据库的资源。
3. 新的比较功能:支持多数据集/条件的对比分析,如识别不同生物状态(如疾病与健康)下的通信差异。
4. 交互式可视化工具:新增了多种图形输出(如空间图、气泡图、层次图),并支持用户交互探索。
文档详细描述了如何使用CellChat V2,覆盖以下步骤:
1. 数据预处理:输入基因表达矩阵和细胞标签,支持从Seurat、SingleCellExperiment等对象中导入数据。
2. 通信网络推断: - L-R相互作用评分:基于配体和受体的平均表达量及共因子计算通信概率。 - 空间邻近性过滤:仅保留在分子扩散范围内的细胞对。 3. 网络分析与可视化:
- 识别关键信号源(senders)和靶点(receivers)。 - 通过模式识别(pattern recognition)预测细胞的协同反应模式。
- 使用网络中心性分析(如出度、入度)量化细胞群在通信网络中的重要性。
4. 多数据集比较:
- 差异通信分析(如总相互作用数、信号强度变化)。 - 通过流形学习(manifold learning)识别功能或结构相似的信号通路。
CellChat已在多种生物学系统中得到应用,例如:
- 皮肤发育:预测了EDN3信号在黑色素细胞迁移中的作用。
- COVID-19研究:发现炎症通路(如choroid-to-cortex网络)的增强现象。
- 肿瘤微环境:揭示癌症相关成纤维细胞(CAFs)如何招募免疫细胞。
CellChat在以下方面优于其他工具(如CellPhoneDB、IcellNet):
- 数据库覆盖更广:包含3300种L-R相互作用,且标注更丰富。
- 系统分析能力:整合了网络分析、模式识别和流形学习。
- 空间兼容性:通过扩散距离而非KNN图优化空间通信推断,减少漏检。
本文不仅是一份技术协议,还系统性展示了CellChat V2在复杂生物学问题中的强大应用潜力,为细胞通信研究提供了标准化分析框架。