深度学习在抗体设计中的应用:从序列结构设计到亲和力成熟
作者及机构
本文由来自意大利比萨大学计算机科学系的Sara Joubbi、Alessio Micheli、Paolo Milazzo,以及托斯卡纳生命科学基金会(Fondazione Toscana Life Sciences)Data Science for Health (DASCH)实验室的Giuseppe Maccari、Giorgio Ciano、Dario Cardamone和Duccio Medini共同完成。文章于2024年6月12日被*Briefings in Bioinformatics*接收,并于同年发表在该期刊的第25卷第4期,文章编号bbae307。
主题与背景
本文是一篇系统性综述,聚焦于深度学习(Deep Learning, DL)技术在抗体设计领域的应用。抗体作为免疫系统的关键蛋白质,因其高特异性被广泛用于生物治疗(如单克隆抗体药物)。然而,传统抗体开发方法(如噬菌体展示)成本高、耗时长,且受限于实验技术的通量。近年来,深度学习在计算机视觉和自然语言处理等领域的成功,推动了其在生物学中的应用,尤其是在抗体设计中的革命性进展。本文综述了深度学习如何优化抗体的序列设计、结构预测、抗原结合位点(paratope-epitope)预测、分子对接(docking)及亲和力成熟(affinity maturation)等关键环节。
主要观点与论据
抗体设计的深度学习框架
抗体设计流程可分为序列/结构生成、折叠预测、抗原-抗体相互作用建模和亲和力优化四个阶段。深度学习模型主要分为三类:
抗体结构预测的突破
传统方法(如分子动力学模拟)计算成本高,而深度学习模型显著提升了预测效率:
抗原-抗体相互作用预测的挑战
抗原结合界面预测是抗体设计的核心难点:
联合对接与设计的创新
传统分步流程(先设计后对接)效率低,新兴方法如Dymean通过多通道等变注意力网络(MEAN)实现端到端设计,H3环设计成功率(DockQ)达44%,优于分步方法(37%)。扩散模型(如Peng et al.的流程)进一步整合生成与优化步骤,提升结合亲和力。
亲和力成熟的深度学习优化
体外成熟(如随机突变)成本高,而深度学习模型可预测突变效应:
数据库资源
文章列举了关键抗体数据库(如OAS含20亿序列、SAbDab含1万结构)和纳米抗体库(如NanoLaS),为训练深度学习模型提供数据支持。
意义与价值
本文系统梳理了深度学习在抗体设计中的全流程应用,揭示了以下价值:
1. 科学价值:阐明了DL如何克服传统方法的局限性(如CDR-H3预测难题),并提出联合设计-对接的范式转变。
2. 应用价值:加速治疗性抗体开发,降低成本(如DiffAb无需实验结构即可设计抗体)。
3. 未来方向:需解决数据稀缺性、构象灵活性建模等问题,并开发更可靠的体外验证指标。
亮点
- 方法创新:首次对比三类DL模型(序列/结构/联合)在抗体设计中的优劣。
- 技术整合:涵盖从生成模型(VAE、扩散)到几何深度学习(GNN、Transformer)的前沿技术。
- 领域聚焦:专述抗体(含纳米抗体)设计的特殊性,如CDR-H3的高变性和亲和力成熟的复杂性。
本文为计算生物学与免疫治疗的交叉研究提供了重要参考,尤其为AI驱动的药物设计指明了实践路径。