分享自:

人工智能驱动的抗体设计与优化计算方法综述

期刊:mAbsDOI:10.1080/19420862.2025.2528902

这篇文档属于类型b(综述论文),以下为针对中文读者的学术报告:


人工智能驱动的抗体设计与优化计算方法综述
作者与机构
Luiz Felipe Vecchietti*(马克斯·普朗克安全与隐私研究所)、Bryan Nathanael Wijaya*(韩国科学技术院计算学院)等联合团队,发表于期刊《mAbs》2025年第17卷第1期。


主题与背景

本文综述了人工智能(AI)在抗体(antibody)设计与优化中的前沿应用,聚焦于抗原条件化设计(antigen-conditioned design)。抗体作为免疫系统的核心分子,其靶向结合能力在疾病治疗与诊断中具有重大价值。传统抗体开发依赖杂交瘤筛选或噬菌体展示等技术,但存在耗时长、成本高、成功率低等瓶颈。近年来,AI在蛋白质结构预测(如AlphaFold)、序列生成和结合剂设计等领域取得突破,为抗体开发提供了新范式。


核心观点与论据

1. 抗体结构预测的AI方法进展

抗体结构预测是设计的基础,需从一维序列推断三维结构。AlphaFold2(AF2)和RosettaFold(RF)等通用蛋白质预测工具已应用于抗体,但因抗体的互补决定区(CDRs, complementarity-determining regions)具有高度可变性,需针对性优化。例如:
- 抗体专用模型:如DeepH3、ABlooper、IgFold等通过抗体数据库(如SAbDab)训练,显著提升CDR环区预测精度。
- 复合物预测挑战:抗原-抗体复合物结构数据稀缺,AF3和RF2-Antibody通过数据增强(如合成复合物)部分解决此问题,但仍有提升空间。

支持证据:Polonsky等(2023)评估AF2在抗体-抗原复合物预测中的局限性,凸显专用模型的必要性。


2. 抗体表征学习的多模态方法

表征学习将抗体序列或结构映射为低维向量,用于下游任务(如亲和力优化)。关键进展包括:
- 序列模型:基于Transformer的抗体语言模型(ALMs,如IgLM、AntiBERTa)可生成人类化抗体序列,IGLM通过物种和链类型标记实现条件化生成。
- 结构模型:如GearNet结合几何特征,提升结合亲和力预测能力。
- 多模态融合:CSSP通过对比学习统一序列与结构表征,改善结合界面预测。

实验验证:Hie等(2024)利用ESM-2语言模型指导抗体突变,经两轮实验验证结合亲和力提升。


3. 抗原条件化抗体设计的创新方法

抗原条件化设计是核心挑战,需结合抗原信息生成特异性抗体。方法分为三类:
- 序列设计:如ProteinMPNN和IgDesign在已知复合物结构下优化CDR序列,实验验证成功率最高达92.5%(仅框架区突变)。
- 结构生成:DiffAB等扩散模型逐步去噪生成抗体结构,结合Rosetta侧链包装完成全原子设计。
- 协同设计:MEAN(基于图神经网络)和RFDiffusion-Antibody(扩散模型)联合生成序列与结构,后者通过实验证实可设计靶向SARS-CoV-2的纳米抗体。

案例:Bennett等(2025)使用RFDiffusion-Antibody生成单链抗体(scFv),经高通量筛选获得原子级精度的结合剂。


4. 当前局限与未来方向

  • 数据瓶颈:实验抗体复合物数据不足(SAbDab仅约9600个结构),需合成数据增强。
  • 评估标准:现有指标(如RMSD、∆∆G)与实验成功率相关性有限,需建立统一基准。
  • 多目标优化:需整合亲和力、可开发性(developability)等指标,结合“实验-计算”闭环(lab-in-the-loop)加速迭代。

意义与价值

  1. 科学价值:系统梳理AI抗体设计的技术框架,揭示序列-结构-功能的关系,推动计算生物学与免疫学交叉。
  2. 应用潜力:缩短抗体药物研发周期,降低成本,尤其适用于新兴病原体(如COVID-19)的快速响应。
  3. 方法论创新:扩散模型、图神经网络等AI技术首次实现从抗原到抗体的端到端设计,为蛋白质工程提供普适范式。

亮点总结

  • 技术全面性:涵盖预测、表征、设计全流程,对比通用蛋白与抗体专用方法差异。
  • 实验验证:多篇研究(如ProSelM、Shanker等)通过湿实验证实AI设计抗体的可行性。
  • 前瞻性讨论:提出数据共享平台和自动化实验验证的协作生态,推动领域标准化。

此综述为AI驱动的抗体设计领域提供了技术路线图,并指出临床转化需解决的瓶颈问题,具有重要指导意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com