分享自:

通过动态图整合空间多切片多组学数据解析临床相关细胞微环境的STClinic模型

期刊:Nature CommunicationsDOI:10.1038/s41467-025-60575-x

《Nature Communications》发表动态图模型STCLinic:通过空间多组学整合解析临床相关细胞生态位

第一作者及单位
Chunman Zuo(1,2,3,4单位:中山大学生命科学学院;东华大学人工智能研究院;复旦大学上海内镜协同创新中心;吉林大学符号计算与知识工程教育部重点实验室)联合通讯作者Luonan Chen(8-12单位:上海交通大学数学科学学院/人工智能学院;中国科学院上海生化与细胞所系统生物学重点实验室等)团队于2025年5月28日在《Nature Communications》发表了题为《stclinic dissects clinically relevant niches by integrating spatial multi-slice multi-omics data in dynamic graphs》的研究论文。


学术背景

研究领域:空间多组学(Spatial Multi-Slice Multi-Omics, SMSMO)技术在肿瘤微环境(Tumor Microenvironment, TME)研究中的应用。
科学问题:现有空间转录组(Spatially Resolved Transcriptomics, SRT)和空间多组学数据整合面临三大挑战:(1)跨样本异质性导致批次效应;(2)有限样本量难以关联临床表型;(3)缺乏动态解析细胞生态位(niche)与临床预后的计算方法。
研究目标:开发动态图模型STCLinic,整合多切片空间多组学和临床数据,识别与癌症进展、转移和预后相关的关键细胞生态位。


技术流程与创新方法

1. 动态图模型构建
- 输入数据:12例人脑前额叶皮层(DLPFC)、43例三阴性乳腺癌(TNBC)、24例结直肠癌肝转移(CRC-LM)等共96个组织切片的SMSMO数据(样本量:3460-100,642个spots/切片)。
- 核心算法
- 动态邻域聚合:通过高斯混合模型(GMM)先验约束潜在特征,迭代移除不同GMM成分间的假性邻域连接,优化跨切片批次校正。
- 注意力统计度量:对每个切片定义6维几何统计量(UMAP均值/方差/极值、生态位比例),量化生态位在群体中的分布模式。
- 零样本学习:预训练编码器可无需微调直接映射新样本至参考集特征空间,实现标签迁移(准确率70% vs. Seurat的16%)。

2. 多组学整合策略
- 同切片整合:利用MultiVI对齐RNA-seq和ATAC-seq数据,通过动态图聚合空间邻近且特征相似的spots。
- 跨切片整合:基于Seurat生成共享特征空间,处理不同分辨率数据(如Stereo-seq 0.2μm vs. 空间ATAC-seq 20μm)。

3. 临床关联分析
- 生存预测:Cox模型将生态位向量与患者生存时间关联(TNBC队列C-index=0.855,HR=9.354)。
- 恶性度评估:鉴定高危生态位(如富含TAMs的Cluster 10)和低危生态位(富含B细胞的Cluster 6),并通过TCGA数据验证基因签名预后价值(p=0.036)。


主要发现

1. 跨样本生态位解析
- 在DLPFC数据中,STCLinic的调整兰德指数(ARI=0.75)优于STAGCN、PASTE等工具,准确区分皮层1-6层(图2)。
- 在乳腺癌中,发现肿瘤边缘特异性生态位Cluster 17(高表达氧化磷酸化基因,黑色箭头标注),提示侵袭前沿代谢重编程(图3)。

2. 临床相关生态位鉴定
- TNBC预后标志:Cluster 10(上皮-间质转化相关基因如TROP2、TM4SF1)与短生存期显著相关(p=4.75e-12),而Cluster 6(IGG+记忆B细胞)预示良好预后(图4)。
- CRC肝转移驱动生态位:Cluster 1(SPP1+ MTRNR2L12+髓系细胞与CAFs)在转移灶中富集,其10基因签名可预测CRC IV期(AUC=0.74,p=0.049)(图5)。

3. 技术性能验证
- 在Hippocampus Slide-seq数据中,STCLinic虽未达到最高ASW分数,但基因表达分布一致性最优(补充图6)。
- 运行效率:整合24个切片(68,000 spots)仅需19分钟,显著快于STAligner。


结论与价值

科学意义
1. 方法学创新:首次实现动态图模型驱动的空间多组学-临床数据整合,解决了异质样本对齐和生态位-表型关联的难题。
2. 临床应用:鉴定的TAMs富集生态位、SPP1+髓系生态位等可作为免疫治疗新靶点;B细胞生态位为预后评估提供新指标。

亮点
- 跨模态整合:支持RNA、ATAC、蛋白质等多组学数据融合,兼容Seurat、MultiVI等工具输出。
- 零样本迁移:冻结编码器实现新样本快速标注,推动临床转化研究。
- 生态位动态解析:通过几何统计量量化生态位空间分布,突破静态分析局限。

局限与展望:需进一步开发3D组织内连续生态位关系推断算法,并整合组织学图像提升分类精度(补充图33)。


数据与代码开源
- 数据:Figshare (10.6084/m9.figshare.27376827)
- 代码:Zenodo (10.5281/zenodo.15246396) 及GitHub (github.com/cmzuo11/stclinic)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com