这篇文档属于类型a,是一篇原创性研究的学术论文。以下是详细的学术报告:
本研究由Rui Hou、Elena Denisenko、Huan Ting Ong、Jordan A. Ramilowski和Alistair R. R. Forrest(通讯作者)共同完成。研究团队来自多个机构,包括澳大利亚西澳大学哈里·帕金斯医学研究所、日本横滨市立大学高级医学研究中心以及RIKEN综合医学科学中心。论文于2020年发表在Nature Communications期刊,标题为《Predicting cell-to-cell communication networks using NATMI》,DOI: 10.1038/s41467-020-18873-z。
研究领域:本研究属于单细胞转录组学与细胞间通讯网络的交叉领域。随着高通量单细胞测序技术的发展,研究者能够低成本地获取复杂组织中数千个细胞的基因表达谱。然而,如何解析不同细胞类型间的相互作用仍是挑战。
研究动机:2015年,研究团队首次基于144种人类原代细胞的表达数据,预测了细胞间通讯网络(Ramilowski et al., *Nature Communications*)。但单细胞数据的涌现需要更高效的工具。因此,团队开发了NATMI(Network Analysis Toolkit for Multicellular Interactions),旨在从单细胞或批量表达数据中预测并可视化细胞间通讯网络。
核心目标:
1. 构建包含2293对手动校正的配体-受体(ligand-receptor)互作数据库ConnectomeDB2020;
2. 开发自动化分析工具NATMI,支持以下功能:
- 识别通讯最频繁或最特异的细胞类型对;
- 预测高活跃度的配体-受体对;
- 发现潜在的高通讯细胞群落;
- 比较不同条件下的细胞间通讯差异。
研究团队整合了2015年发布的1894对配体-受体互作(含文献支持),新增来自CellPhoneDB v2.0、RNA-Magnet等数据库的539对互作,并通过文献验证最终得到2293对高置信度互作(补充数据1)。所有配体被分类为分泌型(secreted)、膜结合型(plasma membrane)或兼具两种特性,以区分接触依赖与非依赖的信号传递。
输入数据:用户需提供单细胞或批量表达的基因表达矩阵及细胞类型标签文件。
核心算法:
1. 边缘权重计算:
- 平均表达权重(mean-expression weight):发送细胞类型中配体的平均表达 × 接收细胞类型中受体的平均表达;
- 特异性权重(specificity weight):配体/受体在特定细胞类型中的表达占比(局部特异性)。
2. 网络简化:将复杂的超边网络(hyperedge network)转化为加权有向多边网络,并通过细胞连接性摘要网络(cell-connectivity-summary network)合并多条边为单一权重边。
验证数据集:
- 已发表的小鼠心脏单细胞数据集(Skelly et al., 2018),包含12种细胞类型;
- Tabula Muris小鼠全器官单细胞图谱(44,949个细胞,117种细胞类型)。
分析流程:
1. 预测通讯网络:通过NATMI提取配体-受体对的表达水平,计算边缘权重并可视化(热图、网络图、环状图);
2. 差异网络分析:比较3月龄与18月龄小鼠乳腺组织的通讯网络,发现衰老相关的信号变化;
3. 自分泌信号验证:检验配体与受体在同一细胞中的共表达现象。
在衰老乳腺组织中:
- 基底细胞信号减弱:如JAG1-NOTCH通路下调,与乳腺干细胞活性降低一致;
- 免疫细胞信号增强:B/T细胞的自分泌及互作增加,提示衰老微环境重塑。
这篇报告系统性地梳理了NATMI的开发背景、方法学创新与生物学发现,为单细胞通讯网络研究提供了重要工具和理论框架。