《scProAtlas:人类组织多重单细胞空间蛋白质组成像图谱》学术报告
作者及机构
该研究由Tiangang Wang(西安电子科技大学生命科学技术学院)、Xuanmin Chen(同前)、Yujuan Han(四川大学华西医院)等共同完成,通讯作者为Kexin Huang和Xiaobo Zhou(美国德克萨斯大学健康科学中心)。研究成果发表于《Nucleic Acids Research》2025年第53卷数据库专刊。
学术背景
在空间组学(Spatial Omics)领域,空间转录组技术虽能检测大量基因,但空间分辨率有限;而空间蛋白质组(Spatial Proteomics)虽检测蛋白数量较少,却能提供单细胞级的空间分布信息。现有数据库如AQUILA和SODB缺乏对细胞空间聚集功能及区域互作的系统性注释。为此,研究团队构建了scProAtlas——首个整合多技术、多组织的空间蛋白质组功能注释知识库,旨在解析组织内细胞类型空间组成、功能结构分布及区域间通讯关系。
研究流程与方法
1. 数据收集与预处理
- 通过PubMed和Google Scholar系统检索“空间蛋白质组”相关文献,筛选出8种成像技术(CODEX、IMC、MIBI-TOF等)的公共数据集,涵盖15种人类组织的17,468,394个细胞。
- 对原始数据标准化:图像数据采用DeepCell Mesmer模型进行全细胞分割,提取空间坐标和表达矩阵;表达矩阵使用Python库scanpy过滤(细胞表达个蛋白或蛋白在<200个细胞中表达被剔除)并进行对数归一化。
空间蛋白质组与scRNA-seq整合
空间功能模块构建
主要结果
1. 多模态数据整合
- 成功将15个scRNA-seq数据集与空间蛋白质组匹配,例如在结肠样本中预测TSPAN8基因的空间分布,验证其在上皮细胞中的屏障功能(Moran’s I>0.1,p<0.05)。
功能邻域注释
空间互作机制
结论与价值
scProAtlas首次系统整合了跨技术、跨组织的空间蛋白质组数据,提供从单细胞到功能区域的多尺度注释框架。其科学价值体现在:
1. 方法学创新:开发了基于MaxFuse的多模态整合流程和邻域网络算法,解决了空间组学数据异质性难题。
2. 生物学发现:揭示了MZB1、TSPAN8等基因的空间表达规律及其与组织功能的关联,为免疫和肿瘤微环境研究提供新线索。
3. 应用潜力:数据库支持在线查询(https://relab.xidian.edu.cn/scproatlas),可辅助疾病标志物筛选和药物靶点预测。
研究亮点
1. 数据规模:迄今最大的空间蛋白质组资源库,覆盖8种技术、945个感兴趣区域(ROI)。
2. 分析维度:首创“细胞-邻域-基因-通路”四层注释体系,弥补了现有工具的功能缺漏。
3. 跨学科工具:整合深度学习(Mesmer)、空间统计(Moran’s I)和网络分析(CellPhoneDB),为空间生物学建立标准化流程。
其他价值
团队计划进一步扩展数据库至全器官系统,并开发交互式单细胞级可视化工具。数据与代码已开源(Zenodo: 10.5281/zenodo.13921833),支持后续算法开发和模型训练(如NicheFormer等空间组学大模型)。