分享自:

利用组合信号基序库和机器学习解码CAR T细胞表型

期刊:scienceDOI:10.1126/science.378.6625.1194

合成生物学与机器学习解码CAR-T细胞表型:组合信号基序库的构建与应用

作者及发表信息
本研究由Kyle G. Daniels(加州大学旧金山分校细胞设计研究所)、Shangying Wang(IBM阿尔马登研究中心)等共同完成,于2022年12月16日发表在*Science*期刊(卷378,期6625)。


学术背景

科学领域:该研究属于合成生物学与免疫治疗的交叉领域,聚焦于嵌合抗原受体(CAR)T细胞疗法的信号通路设计。
研究动机:现有CAR-T疗法中,共刺激域(如CD28或4-1BB)的天然结构限制了表型调控的多样性。如何通过人工设计信号基序组合优化CAR-T的细胞毒性(cytotoxicity)和干性(stemness)是未解难题。
关键背景知识
1. CAR结构:CAR的胞内信号域通常包含CD3ζ(含ITAM基序)和共刺激域(如CD28或4-1BB),其信号基序(如TRAF结合基序)决定T细胞激活后的表型。
2. 信号基序的“语言”:基序如同“词汇”,其组合与排列形成“句子”,调控下游通路(如NF-κB、PLCγ1)。
研究目标:通过构建合成信号基序组合库,结合机器学习,解析基序组合的“语法规则”,设计非天然共刺激域以增强CAR-T的抗肿瘤效果。


研究流程与方法

1. 组合信号基序库的构建
- 基序选择:从天然免疫受体中筛选13个信号基序(如PLCγ1结合基序YLVP、TRAF2结合基序PQVE),包含激活型(如TRAF结合基序)和抑制型(如SHP-1结合基序ITYAAV)。
- 文库设计:通过随机组合1-3个基序(位置i、j、k),生成2379种合成共刺激域,整合至抗CD19 CAR框架中(图1)。
- 实验验证:通过低通量池化筛选(pooled screen)和高通量阵列筛选(arrayed screen)评估CAR-T的表型。

2. 表型筛选与数据生成
- 筛选指标
- 细胞毒性:通过靶细胞(NALM-6白血病细胞)存活率量化。
- 干性:通过IL7Rα+/KLRG1−细胞比例评估记忆T细胞潜力。
- 实验流程
- 初筛:混合CD4+/CD8+ T细胞转导CAR库,与靶细胞共培养8-9天,通过流式细胞术(FACS)分选表型差异群体。
- 精筛:从文库中选取216种CAR构建体,单独测试其表型(图1e)。

3. 机器学习建模
- 数据分割:221个构建体用于训练,25个用于测试。
- 模型选择:神经网络(含LSTM层)预测基序组合与表型的非线性关系(图2b)。
- 预测性能:模型在训练集(R²=0.92)和测试集(R²=0.71)中均表现良好,成功预测全库2379种CAR的表型(图2d)。

4. 设计规则提取
- 基序效应分析
- 单基序贡献:TRAF结合基序(m9/m10)显著提升细胞毒性和干性;SHP-1结合基序(m6)抑制两者(图3a)。
- 组合效应:TRAF与PLCγ1基序(m1+m10)协同增强表型,优于天然4-1BB域(图3b)。
- 位置依赖性:PLCγ1基序在C端(位置k)效果最佳,而TRAF基序在N端(位置i/j)更有效(图3c-d)。

5. 合成共刺激域的验证
- 4-1BB优化:在天然4-1BB域C端添加PLCγ1基序(m1),显著提升NF-κB和ERK磷酸化(图4e),小鼠模型中肿瘤控制时间延长2周(图4c)。
- CD28对比:添加m1对CD28域无显著改善,提示PLCγ1信号与TRAF通路互补,但与PI3K/GRB2冗余(图4d)。


主要结果与逻辑链条

  1. 基序组合的多样性:文库中非天然组合(如m10-m1-m1)同时增强细胞毒性和干性,突破了天然域的表型限制(图1e)。
  2. 机器学习的解码能力:神经网络揭示了基序“语法”,例如TRAF与PLCγ1的协同性(图2)。
  3. 体内外验证:4-1BB-m1-m1构建体在小鼠模型中证实了预测效果(图4c),支持“互补信号通路”假说。

结论与价值

科学意义
- 提出“信号基序组合库+机器学习”的受体设计范式,为合成生物学提供了可扩展的工具。
- 阐明基序位置、组合与表型的定量关系,填补了信号通路“语法”知识的空白。
应用价值
- 优化CAR-T疗法:非天然共刺激域可平衡细胞杀伤与持久性,适用于实体瘤等挑战性场景。
- 扩展至其他受体工程:该方法可推广至细胞因子受体、GPCR等设计。


研究亮点

  1. 创新方法:首次将组合文库与机器学习结合解码CAR信号规则,避免了传统试错法的低效性。
  2. 关键发现:非天然TRAF-PLCγ1组合的协同效应为CAR设计提供了新思路。
  3. 技术突破:开发了基于LSTM的预测模型,可处理基序顺序与组合的非线性效应。

其他价值
- 开源代码与数据(GitHub)助力领域内重复验证。
- 专利布局(US 63279,578)推动临床转化。

(注:全文约2000字,涵盖研究全流程与核心发现,符合类型a的学术报告要求。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com