这篇文档属于类型b(综述论文),以下为针对中文读者的学术报告:
人工智能驱动的抗体设计与优化计算方法综述
作者与机构
Luiz Felipe Vecchietti*(马克斯·普朗克安全与隐私研究所)、Bryan Nathanael Wijaya*(韩国科学技术院计算学院)等联合团队,发表于期刊《mAbs》2025年第17卷第1期。
本文综述了人工智能(AI)在抗体(antibody)设计与优化中的前沿应用,聚焦于抗原条件化设计(antigen-conditioned design)。抗体作为免疫系统的核心分子,其靶向结合能力在疾病治疗与诊断中具有重大价值。传统抗体开发依赖杂交瘤筛选或噬菌体展示等技术,但存在耗时长、成本高、成功率低等瓶颈。近年来,AI在蛋白质结构预测(如AlphaFold)、序列生成和结合剂设计等领域取得突破,为抗体开发提供了新范式。
抗体结构预测是设计的基础,需从一维序列推断三维结构。AlphaFold2(AF2)和RosettaFold(RF)等通用蛋白质预测工具已应用于抗体,但因抗体的互补决定区(CDRs, complementarity-determining regions)具有高度可变性,需针对性优化。例如:
- 抗体专用模型:如DeepH3、ABlooper、IgFold等通过抗体数据库(如SAbDab)训练,显著提升CDR环区预测精度。
- 复合物预测挑战:抗原-抗体复合物结构数据稀缺,AF3和RF2-Antibody通过数据增强(如合成复合物)部分解决此问题,但仍有提升空间。
支持证据:Polonsky等(2023)评估AF2在抗体-抗原复合物预测中的局限性,凸显专用模型的必要性。
表征学习将抗体序列或结构映射为低维向量,用于下游任务(如亲和力优化)。关键进展包括:
- 序列模型:基于Transformer的抗体语言模型(ALMs,如IgLM、AntiBERTa)可生成人类化抗体序列,IGLM通过物种和链类型标记实现条件化生成。
- 结构模型:如GearNet结合几何特征,提升结合亲和力预测能力。
- 多模态融合:CSSP通过对比学习统一序列与结构表征,改善结合界面预测。
实验验证:Hie等(2024)利用ESM-2语言模型指导抗体突变,经两轮实验验证结合亲和力提升。
抗原条件化设计是核心挑战,需结合抗原信息生成特异性抗体。方法分为三类:
- 序列设计:如ProteinMPNN和IgDesign在已知复合物结构下优化CDR序列,实验验证成功率最高达92.5%(仅框架区突变)。
- 结构生成:DiffAB等扩散模型逐步去噪生成抗体结构,结合Rosetta侧链包装完成全原子设计。
- 协同设计:MEAN(基于图神经网络)和RFDiffusion-Antibody(扩散模型)联合生成序列与结构,后者通过实验证实可设计靶向SARS-CoV-2的纳米抗体。
案例:Bennett等(2025)使用RFDiffusion-Antibody生成单链抗体(scFv),经高通量筛选获得原子级精度的结合剂。
此综述为AI驱动的抗体设计领域提供了技术路线图,并指出临床转化需解决的瓶颈问题,具有重要指导意义。