分享自:

人工智能加速的虚拟筛选平台在药物发现中的应用

期刊:Nature CommunicationsDOI:10.1038/s41467-024-52061-7

该文档属于类型a,即报告了一项原创性研究。以下是基于文档内容的学术报告:


主要作者及研究机构
本研究由Guangfeng Zhou、Domnita-Valeria Rusnac、Hahnbeom Park等十位作者共同完成,分别来自University of Washington、Howard Hughes Medical Institute、Korea Institute of Science and Technology等机构。该研究于2024年发表在期刊《Nature Communications》上,文章标题为“An artificial intelligence accelerated virtual screening platform for drug discovery”。

学术背景
本研究属于药物发现领域,特别是基于结构的虚拟筛选(structure-based virtual screening, SBVS)。随着化学库规模的不断扩大(如数十亿化合物的超大型库),传统的虚拟筛选方法在计算时间和成本上变得难以承受。尽管已有一些技术(如高性能计算集群并行化、深度学习引导的化学空间探索)被提出,但现有的方法在预测蛋白质-配体结合构象和结合亲和力方面仍存在不足。本研究旨在开发一种高精度的基于物理的虚拟筛选方法,并构建一个开源的人工智能加速虚拟筛选平台,以高效筛选超大型化学库,并发现潜在的药物分子。

研究流程
1. 开发RosettaVS虚拟筛选方法
研究团队基于Rosetta通用力场(RosettaGenFF)开发了改进的力场RosettaGenFF-VS,并结合RosettaGaligandDock开发了RosettaVS协议。该方法能够精确预测蛋白质-配体的结合构象和结合亲和力,特别是通过建模受体灵活性(如侧链和部分主链的移动)来提高准确性。RosettaVS包括两种模式:虚拟筛选快速模式(VSX)用于初步筛选,虚拟筛选高精度模式(VSH)用于最终排名。

  1. 构建开源虚拟筛选平台OpenVS
    为了高效筛选超大型化学库,研究团队开发了OpenVS平台,该平台集成了所有必要的组件,并采用主动学习技术(active learning)在筛选过程中同时训练目标特异性神经网络模型,以高效选择最有潜力的化合物进行进一步筛选。

  2. 虚拟筛选实验
    研究团队使用OpenVS平台对两个无关靶点进行了虚拟筛选:

    • KLHDC2:一种人类泛素连接酶,筛选了Enamine Real库(约55亿化合物),发现了7个具有单微摩尔级结合亲和力的命中化合物。
    • Nav1.7:人类电压门控钠通道,筛选了Zinc22库(约41亿化合物),发现了4个具有单微摩尔级结合亲和力的命中化合物。
      整个筛选过程在7天内完成,使用了一个配备3000个CPU和1个RTX2080 GPU的本地高性能计算集群。
  3. 实验结果验证
    通过高分辨率X射线晶体学验证了KLHDC2配体复合物的预测结合构象,证明了该方法的有效性。

  4. 性能评估
    研究团队使用CASF2016和DUD数据集对RosettaGenFF-VS和RosettaVS进行了基准测试。结果表明,RosettaGenFF-VS在结合构象预测和筛选准确性方面均优于其他方法,特别是在极性、浅层和小蛋白口袋中表现尤为突出。RosettaVS在早期ROC富集方面达到了最先进的性能。

主要结果
1. 虚拟筛选命中化合物
- 针对KLHDC2,发现了7个命中化合物,命中率为14%。
- 针对Nav1.7,发现了4个命中化合物,命中率为44%。
这些化合物均具有单微摩尔级的结合亲和力。

  1. 晶体结构验证
    KLHDC2配体复合物的X射线晶体学结构与预测的结合构象高度一致,验证了RosettaVS的准确性。

  2. 性能评估结果

    • 在CASF2016数据集上,RosettaGenFF-VS在结合构象预测和筛选准确性方面均表现优异。
    • 在DUD数据集上,RosettaVS在早期ROC富集方面显著优于其他方法。

结论
本研究开发了一种高精度的基于物理的虚拟筛选方法RosettaVS,并构建了一个开源的人工智能加速虚拟筛选平台OpenVS。该平台能够高效筛选超大型化学库,并成功发现了多个具有潜在药物价值的命中化合物。研究结果表明,RosettaVS在结合构象预测和筛选准确性方面均达到了最先进的水平,特别是在极性、浅层和小蛋白口袋中表现尤为突出。该研究为药物发现领域提供了一种高效、精准的虚拟筛选工具,具有重要的科学和应用价值。

研究亮点
1. 高精度虚拟筛选方法:RosettaVS通过建模受体灵活性显著提高了结合构象和结合亲和力的预测准确性。
2. 开源虚拟筛选平台:OpenVS平台集成了主动学习技术,能够高效筛选超大型化学库。
3. 高效命中化合物发现:在7天内筛选了数十亿化合物,并发现了多个具有单微摩尔级结合亲和力的命中化合物。
4. 晶体结构验证:通过X射线晶体学验证了预测的结合构象,证明了方法的可靠性。
5. 性能领先:在多个基准数据集上,RosettaVS和RosettaGenFF-VS均表现出最先进的性能。

其他有价值的内容
研究团队还提出了未来改进方向,包括集成GPU加速和深度学习模型,以提高虚拟筛选的效率和准确性。此外,该方法还可用于探索非小分子结合物(如大环化合物或抗体环)作为模板结构,以指导小分子虚拟筛选。


以上是对该研究的全面报告,涵盖了背景、流程、结果、结论和亮点,为药物发现领域的研究者提供了重要的参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com