DualPG-DTA：一种用于增强药物-靶点亲和力预测及发现新型CDK9抑制剂的大语言模型驱动图神经网络框架

分享自：
DualPG-DTA：一种用于增强药物-靶点亲和力预测及发现新型CDK9抑制剂的大语言模型驱动图神经网络框架

生物物理及生物化学
化学
期刊:Advanced ScienceDOI:10.1002/advs.202513099
【点击此处】阅读全文、收藏及针对性提问
本研究由Yihao Chen、Jindi Huang、Cong Liu、Shipeng Zhang、Xinze Li、Zhang Zhang、Tie-Gen Chen和Ling Wang共同完成。参与机构包括华南理工大学生物科学与工程学院（生物合成与医药联合国际研究实验室、教育部、广东省发酵与酶工程重点实验室、广东省生物制药工程技术研究中心）、暨南大学药学院（生物活性分子与成药性评价国家重点实验室、传统中药现代化与创新药物发现国际合作实验室、广州市精准化学药物开发重点实验室）以及中国科学院上海药物研究所中山药物创新研究院。该研究成果于2026年发表在期刊《Advanced Science》上，具体文章标识符为doi: 10.1002/advs.202513099。
本研究的科学领域属于计算生物学与药物发现的交叉领域，具体聚焦于利用人工智能（Artificial Intelligence, AI）技术进行药物-靶点结合亲和力（Drug-Target Affinity, DTA）预测，并应用于新药先导化合物的发现。在药物研发的早期阶段，准确预测小分子药物与靶点蛋白之间的相互作用强度至关重要，传统基于生化与分子生物学的实验方法不仅耗时、昂贵，而且难以应对海量候选化合物的筛选需求。因此，发展高效、准确的AI预测模型成为近年来的研究热点。自2018年首个深度学习（Deep Learning, DL）模型DeepDTA问世以来，该领域涌现了多种改进方法，如使用注意力机制（Attention Mechanism）的AttentionDTA、利用图神经网络（Graph Neural Network, GNN）的GraphDTA、以及融合多模态（Multimodal）特征的MMDTA等。然而，现有模型在预测精度、泛化能力以及对具有新颖结构骨架化合物的预测可靠性方面仍有提升空间。同时，预训练大语言模型（Large Language Model, LLM）在自然语言处理和结构生物学（如AlphaFold）领域的巨大成功，为提升分子和蛋白质的特征表征能力提供了新思路。基于此背景，本研究旨在开发一个集成先进预训练模型与图神经网络的统一框架，旨在实现更精准的结合亲和力预测，并最终将该框架应用于发现针对特定疾病靶点（本研究选择CDK9）的新型高活性抑制剂，以验证其在真实药物发现场景中的实用价值。本研究的主要目标包括：1）提出并构建名为DualPG-DTA的新模型架构；2）在标准基准数据集上系统评估其性能；3）应用该模型发现新型CDK9抑制剂；4）对发现的先导化合物进行全面的实验验证，包括体外活性、选择性、药理性质及体内抗肿瘤疗效评估。
本研究的工作流程可以概括为三个核心阶段：模型开发与基准测试、模型应用于CDK9抑制剂发现、以及先导化合物的实验验证。
第一阶段：DualPG-DTA模型的构建与验证。 首先，研究者设计了DualPG-DTA的架构，它由三个核心模块组成：药物特征提取模块、蛋白质特征提取模块和多模态融合预测模块。其核心创新在于利用两个预训练大语言模型生成高质量的初始特征。对于药物分子，使用基于3D分子构象预训练的Uni-Mol模型，输入分子的SMILES字符串，输出原子级的512维表征。对于蛋白质靶点，使用基于序列预训练的ESM-2模型，输入氨基酸序列，输出残基级的2560维表征。随后，将这些原子/残基级别的表征分别构建成图结构。药物分子图中，节点是原子，节点特征是Uni-Mol输出的原子表征，边特征则通过RDKit计算，编码了键的类型、共轭和杂化状态。蛋白质图中，节点是氨基酸残基，节点特征是ESM-2输出的残基表征，边的权重则基于ESMFold预测的蛋白质三维结构中Cα原子之间的距离计算（截断距离8埃），以体现空间邻近关系。这两种图分别送入专门的三层GATv2（Graph Attention Network v2）图神经网络进行处理。GATv2配备了动态注意力机制，能够为图中重要的节点（如药物中的关键药效团、蛋白质结合口袋附近的残基）分配更高的权重，从而提取出上下文感知的图级别特征。这两个图级别特征被拼接后，输入到多模态融合模块。该模块采用多头自注意力机制捕获不同特征子空间中的交互模式，然后通过一系列全连接层（带有批量归一化和ReLU激活函数）进行降维和整合，最终输出预测的结合亲和力值（如pKd、KIBA分数等）。为训练和评估模型，研究使用了两个广泛采用的基准数据集：Davis（包含激酶与小分子的Kd值）和KIBA（整合了多种测量值的复合分数）。采用五折交叉验证策略，并利用Optuna库进行超参数贝叶斯优化。评估指标包括均方误差（Mean Squared Error, MSE）、一致性指数（Concordance Index, CI）和修改决定系数（R²m）。
第二阶段：应用DualPG-DTA发现CDK9抑制剂。 研究者将框架应用于一个具体的药物发现任务：寻找新型CDK9（细胞周期蛋白依赖性激酶9）抑制剂。CDK9是急性髓系白血病（Acute Myeloid Leukemia, AML）治疗中一个备受关注的靶点。首先，他们利用一个包含约1330个结构多样的CDK9抑制剂的内部数据集，使用DualPG-DTA框架训练了一个回归模型（预测IC50值）和一个分类模型（预测有无活性）。这两个模型在测试集上均表现出良好的性能（回归模型R=0.796；分类模型AUC=0.881）。接着，为了探索模型识别新颖结构骨架的能力，研究者基于已知的CDK9抑制剂BAY1251152，通过骨架跃迁（Scaffold Hopping）策略设计了四个结构新颖的化合物（C1-C4）。他们使用训练好的回归和分类模型对这些新化合物进行了预测打分。预测结果显示，C1和C2具有较高的抑制潜力和结合亲和力预测值，而C3和C4的预测活性较低。
第三阶段：先导化合物的实验验证。 根据模型预测结果，研究者合成了C1-C4四个化合物，并进行了全面的实验验证。1）体外激酶活性测试：生化实验证实，C1和C2对CDK9表现出纳摩尔级的强效抑制活性（IC50分别为1.2 nM和3.9 nM），而C3和C4活性微弱，这与模型的预测高度一致，证明了模型在“骨架跃迁”场景下的准确预测能力。2）作用机制与选择性研究：通过分子对接、分子动力学模拟和结合自由能计算（MM/PBSA）证实，C1能与CDK9铰链区的Cys106形成稳定的氢键，并与多个关键残基产生相互作用，结合自由能为-33.88 kcal/mol。激酶谱筛选显示，C1对CDK9、CDK6和CDK16有强抑制，但对CDK家族其他成员选择性较高，是一个选择性CDK9抑制剂。3）细胞水平抗白血病活性：C1在AML细胞系（HL-60, MV4-11）中表现出强效的抗增殖活性，并对正常细胞MRC-5显示出一定的选择性。机制研究表明，C1能剂量依赖性地抑制CDK9底物RNA聚合酶II CTD（Ser2）的磷酸化，并下调其下游靶点c-Myc和Mcl-1的表达，诱导细胞凋亡和G0/G1期细胞周期阻滞。特别重要的是，在已对Bcl-2抑制剂Venetoclax产生耐药的MV4-11-VR细胞中，C1依然表现出强效的抗增殖活性，并能有效下调Mcl-1水平，这为克服Venetoclax耐药提供了潜在策略。4）药代动力学与安全性评估：C1在人肝微粒体中表现出高代谢稳定性（t1/2 = 98.18 min）。在大鼠体内的药代动力学研究显示，其口服生物利用度（F）为24.3%，半衰期长（口服t1/2 ≈ 13.5小时），血浆暴露量充足，支持每日一次的口服给药方案。5）体内抗肿瘤疗效：在MV4-11-VR细胞构建的AML小鼠异种移植瘤模型中，每日口服C1的盐酸盐（C1·HCl，25和50 mg/kg）能显著抑制肿瘤生长，肿瘤生长抑制率分别为47.2%和62.7%，且疗效优于阳性对照药物Venetoclax。治疗期间小鼠体重未出现显著下降，表明其具有良好的耐受性。
本研究的主要结果如下：在模型基准测试中，DualPG-DTA在Davis和KIBA数据集的所有评估指标上均达到了最优性能（例如，Davis: MSE=0.169, CI=0.908, R²m=0.788；KIBA: MSE=0.138, CI=0.894, R²m=0.791），显著超越了包括DeepDTA、GraphDTA、Bicomp-DTA在内的多个现有先进模型。消融实验（Ablation Study）证实，移除分子图或蛋白质图构建部分、或用GCN或静态GAT替换GATv2，均会导致模型性能下降，从而验证了双图结构、注意力机制特别是动态注意力机制在模型中的关键作用。Y-扰乱测试（Y-Scrambling Test）证明了模型捕获的是输入与输出之间真实有意义的关系，而非随机关联。在应用层面，模型成功地从四个通过骨架跃迁设计的新化合物中，准确识别出了两个高活性的CDK9抑制剂C1和C2，其预测活性排序与实验测得的IC50值完全吻合。对先导化合物C1的深入实验验证获得了一系列积极结果：强效的CDK9抑制活性（IC50 = 1.2 nM）、良好的激酶选择性、优异的药代动力学特性（口服生物利用度高、半衰期长）、以及在对Venetoclax耐药的AML模型中展现出的显著体内抗肿瘤疗效和良好耐受性。这些结果环环相扣：基准测试结果证明了DualPG-DTA框架的预测能力领先；骨架跃迁的成功预测验证了该框架在发现新颖结构活性化合物方面的实用价值；而对C1从分子、细胞到动物水平的全面验证，则最终将计算预测转化为一个具有明确成药潜力的实体先导化合物，形成了一个从“方法开发”到“实际应用”再到“实验验证”的完整闭环。
本研究得出结论：DualPG-DTA是一个创新且高效的深度学习框架，它通过集成预训练大语言模型和具有动态注意力机制的图神经网络，显著提升了药物-靶点结合亲和力预测的准确性。该框架不仅在标准基准测试中表现优异，更重要的是，它成功应用于真实世界的药物发现流程，识别出了新型、强效、高选择性的CDK9抑制剂C1。C1在体外和体内均表现出卓越的抗白血病活性，特别是在克服Venetoclax耐药方面显示出巨大潜力，且具备良好的药代动力学和安全性特征，是一个极具开发前景的治疗AML（尤其是Venetoclax耐药患者）的先导化合物。这项研究不仅为精确的结合亲和力预测建立了一个统一且强大的框架，而且通过一个成功案例，展示了人工智能驱动的新药发现从虚拟筛选到临床前候选化合物确定的完整可行路径。
本研究的亮点在于：1）方法学创新：首次将两个分别针对分子3D结构和蛋白质序列的预训练大语言模型（Uni-Mol和ESM-2）与图神经网络（GATv2）有机结合，构建了DualPG-DTA框架，实现了原子级和残基级精细化特征提取与动态注意力权重分配的融合。2）卓越的性能：在多个基准数据集上全面超越了既往十年间的先进模型，证明了其预测精度和鲁棒性。3）成功的转化应用：不仅停留在模型层面，而是将其应用于具体的靶点（CDK9），并通过骨架跃迁策略发现了结构新颖的高活性先导化合物C1，实现了从“AI预测”到“实验验证”的闭环，充分体现了AI在药物发现中的实际价值。4）全面的先导化合物验证：对C1进行了从分子机制、激酶选择性、细胞药效、药代动力学到体内疗效和安全性的全方位、多层次的严谨验证，数据详实，为其后续开发奠定了坚实基础。5）针对重大临床需求：所关注的CDK9靶点及Venetoclax耐药问题，是当前AML治疗中的难点和热点，使得研究成果具有明确的临床转化意义和应用前景。
此外，研究还探讨了DualPG-DTA框架的通用性，指出其原则上可应用于任何蛋白质靶点家族（如GPCRs、离子通道），只要能够提供蛋白质序列和分子信息即可。同时，研究者也客观指出了模型的局限性，例如依赖预计算的3D分子构象、训练时计算资源需求较高等，为未来的优化方向提供了思路。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问