这篇文档是一篇发表于 J. Chem. Inf. Model. 期刊(2025年,第65卷,第9383-9397页)的视角文章(Perspective),作者包括来自荷兰莱顿大学莱顿药物研究学术中心(Remco L. van den Broek, Gerard J. P. van Westen)和美国Psivant Therapeutics公司(Shivam Patel, Woody Sherman)以及兼任两处职务的Willem Jespers。文章主题聚焦于人工智能(AI)生成模型(Generative AI, GenAI)在药物发现领域的应用、挑战与未来展望,核心论点是:成功的生成式药物设计(Generative AI for Drug Discovery, GADD)的终极目标不应仅是产生“新”或“有趣”的分子,而应是产生“美丽”的分子——即那些与项目治疗目标高度一致,并在合成可行性、药代动力学/毒性(ADMET)特性、靶点特异性等方面超越传统方法价值的高质量候选药物。
本文并非报道单一原创性研究的论文,而是一篇综合性的视角文章,旨在梳理现状、剖析问题并提出发展路径。其主要观点如下:
核心论点:定义“美丽”分子与GADD的成功要素 文章开宗明义地指出,尽管GenAI在其他行业进展迅速,但在前瞻性药物发现中尚未展示出明确且一致的价值。作者认为,问题的关键在于目标设定。药物发现中的“分子之美”是情境依赖的,它融合了合成可行性、理想的ADMET(吸收、分布、代谢、排泄和毒性)属性、对特定靶点的有效结合以调节目标生物学机制,并且这些特性需要根据项目数据的涌现和优先级的转变而动态调整。因此,生成“美丽”分子需要超越简单的多参数优化(Multiparameter Optimization, MPO),必须整合经验丰富的药物猎手(Drug Hunters)的人类反馈。文章围绕实现这一目标所必需的五个关键支柱展开论述:1) 化学合成可行性(考虑时间/成本限制);2) 有利的ADMET性质;3) 理想的靶点特异性结合;4) 构建适当的MPO函数以驱动GenAI朝向项目目标;5) 来自经验丰富的药物猎手的人类反馈。
第一支柱:合成与采购——从虚拟到现实的桥梁 文章指出,生成化学上有效且可合成的分子是GADD的基本要求,但远非充分条件。当前分子表示方法(如SMILES, SELFIES, 图表示,三维表示)各有优劣,但都需严格验证以确保化学可行性。然而,化学有效性并不保证合成可行性或商业可得性。文章详细比较了多种采购策略:1) 供应商匹配:在商业化合物库中寻找相似分子,优点是快速,但受限于库的有限规模,无法覆盖广阔的化学空间。2) 组合库:使用预定义的合成策略和构建块系统性地生成大量分子,适合自动化闭环合成平台(如设计-制造-测试-分析,DMTA循环),但可访问的化学空间受限于所用化学反应。3) 逆合成分析:理想情况下可直接指导合成,但当前的计算机辅助合成预测(Computer-Aided Synthesis Prediction, CASP)工具仍处于发展阶段,无法完全预测具体的反应物和条件,高度依赖化学家的人工干预。4) 探索其他化学空间:如天然产物、非天然氨基酸和大环化合物,可提供独特的药理活性,但合成挑战更大。文章强调,主动学习(Active Learning) 框架至关重要。通过将预测建模与实验验证在闭环系统中结合,优先合成和测试那些能带来最大信息增益的分子,产生的数据可反馈用于改进生成和预测模型,从而高效地探索兼具合成可行性和治疗潜力的化学空间区域。
第二支柱:生成模型中的ADMET性质 ADMET性质的早期优化对于降低药物研发后期失败率至关重要。文章指出,将ADMET预测模型整合到GenAI框架中,可以在分子设计阶段就规避不良的药代动力学和安全性风险。然而,这面临巨大挑战:1) 数据瓶颈:公开数据集通常存在噪声大、不一致、化学多样性有限、实验室间检测方法变异等问题,限制了模型的可靠性和泛化能力。2) 模型类型与局限:方法包括基于机器学习的模型(如随机森林、图神经网络GNNs)和基于物理的模型(如分子对接、分子动力学模拟、量子力学计算)。机器学习模型速度快,但严重依赖训练数据质量,在探索训练分布之外的 novel 化学支架时容易失效。基于物理的模型能提供机制性见解,但计算成本高昂,难以集成到需要高速评估大量分子的GenAI内部循环中。3) 奖励黑客(Reward Hacking)风险:在数据匮乏或模型校准不佳的情况下,生成算法可能利用ADMET预测器的弱点,产生在模型看来“最优”但在真实实验中会失败的分子。未来的方向在于开发自适应、情境感知的框架,整合人类反馈的强化学习(Reinforcement Learning with Human Feedback, RLHF)、不确定性量化和可解释AI(Explainable AI, XAI),并结合高质量、多样化的数据集和实时实验反馈循环。
第三支柱:预测靶点特异性性质 准确预测结合亲和力和选择性是理性药物设计的核心。文章对比了多种方法:1) 基于配体的方法:如定量构效关系(QSAR)、蛋白质化学计量学(Proteochemometric, PCM)模型,计算成本低,但受限于训练数据的化学和生物学空间覆盖度。2) 基于结构的方法:分子对接速度快,可用于高通量筛选,但其评分函数是对结合自由能的粗略近似,准确性对输入结构质量和蛋白质柔性敏感。共折叠(Co-folding)技术(如AlphaFold 3, BOLTZ, CHAI)将配体和蛋白作为联合系统建模,能捕捉相互的结构适应,推理速度快,适合集成到生成循环中,但目前定量准确性尚待提高。自由能微扰(Free Energy Perturbation, FEP)计算和分子动力学模拟能提供更准确的结合自由能估计,被视为金标准,但计算极其昂贵(每个分子需数十GPU小时),无法用于GenAI内部的高通量优化。文章还指出,除了结合亲和力,结合动力学(如停留时间)、共价结合、变构调节、功能效应(激动/拮抗)等复杂性质对治疗效能至关重要,但预测这些性质更具挑战性。当前大多数GenAI工作流依赖于快速但近似的替代指标(如对接分数),在 novel 化学空间或柔性靶点上的准确性有限。
第四支柱:多参数优化(MPO)——平衡“美”的维度 MPO是将多个竞争性目标(如效力、选择性、ADMET、合成可行性)整合到单一信号中以指导生成过程的关键机制。文章阐述了:1) MPO函数类型:包括加权求和、合意性函数(将各属性映射到0-1标度)、帕累托优化(寻找非支配解)等。2) 核心挑战——模型预测可靠性:MPO复合分数的可靠性取决于其最不可靠的组成部分。必须通过不确定性处理、适用域(Applicability Domain, AD)检查(如基于距离的启发式方法、保形预测)来评估和编码可靠性,对域外预测进行降权或门控。3) 奖励黑客与局部最优:生成模型可能利用目标函数的漏洞。例如,仅以对接分数为奖励,模型可能生成带有长柔性脂肪链的分子以最大化接触点,从而提高对接分数但损害配体效率、渗透性和合成可行性,这就是“奖励黑客”。另一个问题是过早收敛到狭窄的化学型(局部极小值)。缓解策略包括:在多样化实验数据上迭代重新训练模型、用正交方法(如MD/FEP)交叉验证、引入不确定性感知的探索、调整目标或新颖性激励。4) 阶段化策略:MPO的侧重点和模型保真度应随药物发现阶段而调整。早期关注可行性、多样性和粗粒度过滤;中期整合更精细的ADMET模型;后期平衡效力、选择性、临床PK需求,并可能引入物理方法进行验证。5) 人类在环(Human-in-the-Loop)与RLHF:人类专家的判断不可或缺,他们能发现自动化评分遗漏的责任(如反应性代谢物、合成瓶颈、知识产权风险)。通过RLHF,专家可以提供成对偏好反馈,用于拟合奖励模型,从而校准生成策略,确保优化过程与治疗可行性和项目现实保持一致。文章还通过一个案例研究说明,仅使用对接分数作为奖励会导致生成带有“线状尾巴”的分子,而通过引入针对柔性、大小、合成可行性等的约束项,可以纠正这种失败模式。
第五支柱:GADD在药物发现各阶段的应用 文章概述了GADD在药物发现不同阶段的价值与挑战:1) 苗头化合物识别阶段:重点在于化学有效性、靶点特异性相互作用和多样性。奖励函数需优先考虑化学有效性、多样性和可开发性,同时避免对可能导致虚假分子特征的高对接分数过拟合。高速虚拟筛选结合粗粒度ADMET过滤器是关键。2) 苗头至先导化合物优化阶段:重点转向优化先导化合物特性,在保持高靶点结合力的同时改善药代动力学特征。GADD应利用阶段适宜的MPO函数,整合早期实验反馈以细化ADMET预测。亲脂性配体效率(Lipophilic Ligand Efficiency, LLE)是常用指标。需要平衡相互冲突的目标,防止模型利用ADMET预测的弱点。3) 先导化合物优化阶段:挑战在于通过复杂的MPO策略平衡效力、安全性、生物利用度等,避免局部最优和模型利用。此时还需考虑制剂可行性、知识产权空间和长期毒性风险,这些都需要人类在环的指导。贯穿始终的是,预测模型应在模型适用域内提供阶段适宜的预测,并与药物化学直觉协同。每一轮新的实验测量都应提高模型的准确性和适用性,使后续设计周期更高效、更具针对性。
结论与未来展望 文章总结道,要使GenAI对药物发现产生实质性影响,其必须超越新颖性和合成可行性,持续提出与项目需求治疗目标一致的“美丽”分子。这需要准确预测和优化药理学相关特性,并克服数据、模型和整合方面的重大挑战。尽管一些专注于自动化和端到端循环的生物技术平台公司涌现,但现实世界的成功仍依赖于科学判断——这是任何流程都无法完全取代的。未来的进展将依赖于:1) 更好的属性预测模型:需要更具代表性、高质量和多样化的数据集。2) 更好的数据:包括实验和计算生成的数据。3) 更好的人机协作:RLHF等交互式学习框架对于引导GenAI产生在实践中能推动项目的分子至关重要。此外,在分子表示、模型架构以及融入发现工作流方面的持续创新也至关重要。作者引用Rich Sutton的“苦涩教训”,指出随着时间的推移,在大型数据集上训练并由硬件进步驱动的简单通用算法,往往会超越手工打造的领域特定系统。虽然量子计算等新兴技术可能在未来提供新的化学空间探索模式,但其实际效用目前仍是推测性的。最终,GADD的实现有赖于扎根于药物发现的复杂性、以实证验证为指导,并通过人机紧密合作来加强。没有针对奖励黑客和模型过度自信的防护措施,GenAI有可能提出满足目标函数字面意义、却违背良好药物设计精神的分子。生成“美丽”分子的前景是真实的,但需要更好的属性预测模型、更好的数据和更好的人机协作,才能充分释放GenAI在药物发现中的潜力。
文章的价值与意义 这篇视角文章的价值在于,它为快速发展的GADD领域提供了一份及时、全面且批判性的路线图。它不仅梳理了当前的技术现状(合成、ADMET预测、靶点作用预测、MPO),更深刻地指出了阻碍其转化为实际生产力的核心矛盾:即强大的生成能力与尚不完善的评价体系(预测模型)之间的鸿沟,以及纯数据驱动优化与依赖深厚经验的药物设计艺术之间的张力。文章强调“人类在环”和“美丽分子”的情境定义,是对当前过度强调全自动AI药物发现热潮的一种重要平衡和理性回调。它为AI科学家和药物发现专家之间的对话搭建了桥梁,指明了需要协同攻关的具体技术挑战(如模型可靠性、数据质量、可解释性),并提出了RLHF等切实可行的整合路径。因此,本文对于从事计算药物发现、AI辅助分子设计的研究人员和工业界从业者具有重要的指导意义和参考价值。