《现代AI辅助药物发现中的图神经网络》综述报告
本文档是一篇发表于《Chemical Reviews》期刊的综述文章。文章作者包括Odin Zhang, Haitao Lin, Xujun Zhang, Xiaorui Wang, Zhenxing Wu, Qing Ye, Weibo Zhao, Jike Wang, Kejun Ying, Yu Kang, Chang-Yu Hsieh, 以及Tingjun Hou。该文章于2025年6月7日收到,并于同年8月27日被接受。文章系统性地回顾了图神经网络(Graph Neural Networks, GNNs)在AI辅助药物发现(AI-aided drug discovery, AIDD)领域的理论基础、方法进展及代表性应用。
本文的核心论点是:图神经网络,作为深度学习中能够直接处理拓扑/结构信息的模型,已成为AI辅助药物发现中的强大工具。通过直接在分子图(Molecular Graph)上操作,GNNs为学习类药分子的复杂拓扑和几何特征提供了一个直观且富有表现力的框架,从而奠定了其在现代分子建模中的核心地位。文章旨在为化学、生物学领域应用AI的研究者以及为生化应用开发模型的计算机科学家提供一个统一的建模框架,弥合数学严谨性与化学直觉之间的鸿沟。
主要观点一:分子图是药物发现的自然表示,图神经网络是处理该表示的关键范式。 作者首先阐述了药物发现是一个资源密集且耗时的过程,而人工智能的快速发展为其注入了新的动力。在AI辅助药物发现中,将分子结构编码成机器可理解的表示是首要步骤。文章对比了多种分子表示策略,包括基于字符串的线性化方法(如SMILES、SELFIES)、分子指纹、以及基于图和3D体素网格的表示。文章指出,分子在本质上就是图结构对象,其中原子构成节点,化学键构成边,三维坐标定义其构象几何。这种表示形式与图神经网络的建模范式天然契合。相比于传统“扁平化”的表示,基于图的表示具有三大优势:(i) 物理一致性,保留了拓扑和几何信息;(ii) 表示普适性,可部署于属性预测、生成建模和药理学分析等多种任务;(iii) 增强的可解释性,可通过子图注意力、边归因和结构显著性图来实现。因此,图表示正日益成为分子建模的标准,并被罗氏(Roche)、诺华(Novartis)等制药公司以及BenevolentAI、Insilico Medicine等AI驱动的生物技术初创公司广泛采用。
主要观点二:图神经网络的方法学基础正不断演进,以应对药物发现中的特定挑战。 文章花费大量篇幅详细梳理了GNNs的方法学进展,并将其分为几个关键方向: 1. 谱方法与空间方法:GNNs可分为基于谱图理论和基于空间信息聚合的两大范式。基于谱的方法(如SCNN、ChebNet、GCN)通过图拉普拉斯矩阵的特征分解在谱域定义卷积,数学优雅但灵活性有限。而基于空间的方法(如图采样与聚合GraphSAGE、图同构网络GIN、图注意力网络GAT)则通过消息传递神经网络(Message Passing Neural Network, MPNN)框架直接在节点局部邻域聚合信息,因其概念清晰和生态支持已成为化学相关任务的主流范式。MPNN框架通过消息函数、聚合函数、更新函数和读出函数四个核心组件形式化了GNNs的操作,为大多数现代GNN架构提供了统一的抽象。 2. 对称性图神经网络:为了处理分子的3D几何构象并遵守物理定律(如旋转和平移不变性/等变性),研究者开发了对称性GNNs。文章将其分为三类:(i) 基于内坐标的不变GNNs(如SchNet、DimeNet、GemNet):将笛卡尔坐标转换为键长、键角、二面角等内部坐标(这些量在坐标变换下保持不变)作为模型输入,适用于预测能量等标量性质,并通过能量梯度计算获得等变的力。(ii) 基于张量积的等变GNNs(如Tensor Field Networks, SE(3)-Transformer):利用群表示理论和Clebsch-Gordan张量积,直接在几何特征上操作,能够处理高阶(如l>1)的等变特征(如偶极矩),在大型生物分子结构预测(如AlphaFold、RoseTTAFold)中显示出强大潜力。(iii) 基于向量的等变GNNs(如几何向量感知器GVP、等变图神经网络EGNN、NewtonNet):针对实际任务中常见的低阶(l=0, 1)特征进行高效设计,通过向量神经元或坐标差缩放等机制实现等变性,在计算效率和表达能力之间取得良好平衡。 3. 大规模与深度图神经网络:随着模型和数据规模的扩大,GNNs面临独特挑战,包括过度平滑(Oversmoothing,节点表征趋于相似)、过度挤压(Oversquashing,远距离节点信息在传递中被压缩)和梯度异常。文章总结了应对这些挑战的策略,如通过拓扑扰动(DropNode, DropEdge)、各向异性消息传递(如注意力机制)、残差连接(如GCNII、JKNet)来缓解过度平滑;通过图重布线(如SDRF)来缓解过度挤压;以及通过激活函数、梯度裁剪、批归一化和权重初始化来缓解梯度异常。 4. Transformer-like图神经网络:受自然语言处理中Transformer成功的启发,研究者将Transformer架构与图结构相结合。文章指出,Transformer可被视为在全连接图上的GNN,而GNN可被视为具有稀疏(仅邻居)注意力的Transformer。图Transformer(如GraphTransformer、Graphormer、SAN、SpecFormer)的核心思想是将图的结构先验(如拉普拉斯特征向量、节点度、最短路径距离、边特征)注入到注意力机制中。GraphGPS框架进一步提出了一个统一模块化架构,结合了位置编码和结构编码,并融合了局部MPNN模块和全局Transformer模块,以兼顾局部结构感知和全局依赖捕获。 5. 图生成模型与概率学习:文章简要提及了基于似然的方法(如流模型、能量模型、自回归模型)和基于潜变量的方法(如变分自编码器VAE、生成对抗网络GAN、扩散模型)在图生成领域的应用,以及图编辑与强化学习在分子优化中的作用。
主要观点三:图神经网络在药物发现的核心任务中展现出广泛而深入的应用价值。 文章随后系统性地阐述了GNNs在AIDD关键环节的应用: 1. 分子性质预测:这是GNNs最直接的应用。文章讨论了任务与挑战,包括数据稀缺问题及通过多任务学习、元学习和迁移学习等策略进行缓解。特别强调了不确定性量化(区分数据固有的偶然不确定性和模型认知的不确定性)和可解释GNN(通过特征归因、子结构归因、事实解释和反事实解释方法揭示模型决策依据)对于构建可靠预测模型、控制风险及指导化学家设计分子的重要性。 2. 虚拟筛选:GNNs被用于预测结合位点、预测蛋白质-配体结合结构(分子对接)以及预测结合亲和力。文章介绍了从半柔性对接到柔性对接(共折叠和诱导契合)的方法进展,并讨论了GNN评分函数超越传统回归方法的“四种能力”,以及其面临的过拟合挑战。 3. 分子生成:文章区分了自由分子生成(原子级和片段级)和约束分子生成(如基于3D构象、基于靶点结构)。此外,还介绍了分子优化方法,包括基于搜索的方法(遗传算法、蒙特卡洛树搜索)、基于图嵌入的方法和基于强化学习的方法,并讨论了多目标和多目标优化的挑战。 4. 知识图谱:GNNs可用于构建生物医学知识图谱,并进行链接预测(推断药物协同作用、副作用、药物重定位、靶点识别)以及节点和图预测(如癌症基因发现、亚型分类、生物标志物识别和药物反应预测)。文章也指出了知识图谱面临的数据中心范式、数据不完整与噪声、可解释性及多组学整合等挑战。 5. 化学反应:GNNs在化学合成领域应用于反应任务,包括合成路线规划(逆合成预测、正向反应预测)和反应性质预测(反应分类、反应条件预测、反应产率预测)。文章指出构象信息至关重要,并展望了分子生成与专家合成系统的结合以及跨反应预测的未来方向。
主要观点四:应用图神经网络于真实世界药物发现管线面临实际挑战与方法学瓶颈,未来存在明确的发展方向。 文章在结论部分总结了GNNs在AIDD中的成功,同时也坦诚地指出了将GNNs应用于实际药物发现管线时遇到的挑战。这些挑战包括但不限于:数据质量与稀缺性、模型的可解释性与可信度、计算效率与可扩展性、以及如何将复杂的几何和物理约束更有效地整合到模型中。文章展望了未来可能的方向,例如开发更强大的几何深度学习架构、改进自监督和预训练策略以更好地利用未标记数据、构建更可靠的评估基准、以及推动GNNs与自动化实验平台和专家知识的深度融合。
文章的意义与价值: 这篇综述文章具有重要的学术价值和实践指导意义。首先,它从模型中心(model-centric)的视角,为读者提供了一个关于GNNs在AIDD中从理论基础到前沿应用的全景式、结构化的知识体系,帮助研究人员建立连贯的概念框架。其次,文章不仅总结了成功案例,还重点剖析了方法论瓶颈和实际挑战,为领域内的研究者指明了亟待解决的问题和未来的研究机遇。最后,通过强调GNNs与自监督学习、多任务学习、元学习和预训练等现代深度学习范式的结合,文章展示了如何提升模型在真实药物发现场景下的数据效率、泛化能力和鲁棒性。因此,本文既是领域新人的入门指南,也是资深研究者的参考手册,有力地推动了图神经网络在药物发现领域的深入发展和更广泛应用。