解码单细胞扰动响应的异质性

背景介绍

在细胞生物学中,理解细胞对扰动的不同响应至关重要。扰动(perturbation)是指通过基因编辑、化学物质、环境变化或机械力等方式改变细胞状态,从而研究其功能。然而,现有的方法在量化单细胞水平的异质性响应时存在局限性,尤其是在部分基因扰动(partial gene perturbation)和剂量效应(dosage effect)的分析上表现不佳。为了解决这一问题,研究者开发了一种新的计算方法——扰动响应评分(Perturbation-Response Score, PS),旨在更准确地量化单细胞扰动响应的异质性,并揭示细胞内在和外在因素对扰动结果的影响。

论文来源

本论文由Bicna SongDingyu Liu等多名研究者共同完成,作者来自多个知名机构,包括Children’s National HospitalSloan Kettering InstituteJohns Hopkins University等。论文于2025年3月发表在Nature Cell Biology期刊上,标题为《Decoding Heterogeneous Single-Cell Perturbation Responses》。

研究流程与结果

1. PS框架的构建

PS框架的核心是通过三步法量化单细胞扰动响应:
- 步骤1:目标基因识别
通过比较扰动细胞与未扰动细胞的转录组数据,识别差异表达基因(Differentially Expressed Genes, DEGs)。这些基因作为扰动的“特征基因”,用于后续分析。
- 步骤2:平均扰动效应估计
使用scMAGeCK模型计算特征基因的平均扰动效应,生成β评分(β score),类似于对数倍数变化(log fold change)。
- 步骤3:约束优化估计PS
通过约束优化算法,计算每个细胞的扰动响应评分(PS),范围从0(无扰动效应)到1(最大扰动效应)。

2. 基准测试与验证

研究者在多个数据集上验证了PS的性能:
- 合成数据集:通过scDesign3模拟不同扰动效率(25%-100%)下的单细胞转录组数据,PS在部分扰动量化上显著优于现有方法Mixscape
- CRISPRi扰动数据集:在K562细胞CROP-seq数据中,PS能够准确估计CRISPRi(CRISPR干扰)的效率,而Mixscape表现较差。
- 基因组尺度扰动数据集:在Jurkat T细胞的扰动实验中,PS成功识别了已知的T细胞激活调控因子,并在ROC曲线分析中表现出更高的准确性。

3. 剂量效应分析

PS能够在不进行扰动剂量滴定(titration)的情况下,分析基因扰动的剂量效应。例如,在PD-L1调控基因的扰动实验中,PS揭示了正调控基因(如STAT1)和负调控基因(如CUL3)的剂量响应模式。此外,PS还识别了“缓冲基因”(buffered genes)和“敏感基因”(sensitive genes),前者需要高效扰动才能引发强转录响应,而后者在中等扰动下即可产生显著效应。

4. 应用案例

  • HIV潜伏表达:在Jurkat细胞的扰动实验中,PS揭示了BRD4CCNT1在HIV潜伏表达中的细胞状态依赖性功能。
  • 胰腺分化:在人类胚胎干细胞(hESCs)的胰腺分化实验中,PS发现了CCDC6在调控肝脏和胰腺细胞命运决定中的新功能。

研究结论与意义

PS框架为单细胞扰动数据的分析提供了强大的工具,能够量化部分扰动、揭示剂量效应,并识别影响扰动响应的生物因素。该方法的创新性在于:
1. 量化部分扰动:能够准确分析不完全基因敲除或RNA干扰等部分扰动效应。
2. 剂量效应分析:无需实验滴定,即可从单细胞数据中推断剂量响应关系。
3. 细胞状态依赖性:揭示了扰动响应的细胞状态特异性,为功能基因组学研究提供了新视角。

研究亮点

  1. 高精度量化:PS在多个基准测试中表现出色,尤其在部分扰动和剂量效应分析上优于现有方法。
  2. 广泛适用性:适用于多种单细胞扰动数据,包括CRISPR筛选、药物处理等。
  3. 生物学发现:揭示了CCDC6在胰腺分化中的新功能,为发育生物学研究提供了重要线索。

其他有价值的信息

PS框架的开源代码已公开,研究者可通过GitHub获取并应用于自己的数据分析。此外,论文还提供了详细的实验方法和数据分析流程,为后续研究提供了参考。

这项研究不仅开发了一种强大的计算工具,还为理解细胞对扰动的异质性响应提供了新的视角,具有重要的科学和应用价值。