本研究的核心作者包括:
- Emiel Hoogeboom(荷兰阿姆斯特丹大学UVA-Bosch Delta Lab)
- Victor Garcia Satorras(荷兰阿姆斯特丹大学UVA-Bosch Delta Lab)
- Clément Vignac(瑞士洛桑联邦理工学院EPFL)
- Max Welling(荷兰阿姆斯特丹大学UVA-Bosch Delta Lab)
研究论文《Equivariant Diffusion for Molecule Generation in 3D》发表于第39届国际机器学习会议(ICML 2022),收录于会议论文集《Proceedings of Machine Learning Research》(PMLR 162)。
本研究属于计算化学与人工智能交叉领域,聚焦于3D分子生成问题。分子在物理空间中受欧几里得变换(Euclidean transformations,如平移、旋转、反射)的对称性约束,传统生成方法(如自回归模型或归一化流)存在训练效率低、采样复杂度高的问题。本研究提出了一种E(3)等变扩散模型(EDM),通过联合处理连续原子坐标和离散原子类型,实现了高效且对称性保持的分子生成。
EDM基于去噪扩散概率模型(Denoising Diffusion Probabilistic Models, DDPM),核心分为两个阶段:
- 前向噪声扩散过程:通过马尔可夫链逐步向分子数据(原子坐标x和类型h)添加高斯噪声,生成隐变量z_t。噪声强度由调度参数α_t和σ_t控制,满足α_t^2 + σ_t^2 = 1。
- 反向生成过程:训练等变神经网络φ预测噪声,通过迭代去噪从噪声中重构分子。
采用E(n)等变图神经网络(EGNN)作为去噪网络φ,其关键创新点包括:
- 等变性约束:网络输出需满足f(rx) = r·f(x)(r为旋转/反射矩阵)。
- 零质心子空间:原子坐标的噪声分布定义在质心为零的线性子空间(∑x_i = 0),避免平移对称性导致的概率分布归一化问题。
- 联合特征处理:网络输入为噪声隐变量z_t = [z_t^(x), z_t^(h)],其中z_t^(x)为坐标噪声,z_t^(h)为原子类型噪声。
p(x|z_0)通过高斯分布建模,引入噪声预测校正项以提高精度。p(h|z_0^(h))采用分类分布(categorical distribution),通过对单热编码(one-hot)噪声积分实现。L_t = E[||ε - φ(z_t,t)||^2],其中权重w(t) = 1 - SNR(t-1)/SNR(t)。通过将目标属性c(如极化率α、能隙Δε)拼接至节点特征,实现属性导向的分子生成。训练时,条件生成的下界损失L_{c,t}与无条件模型类似,但网络φ需额外输入c。
通过调节极化率α,生成的分子呈现预期的结构变化(图4):高α值对应更各向异性的原子分布(利于形成偶极矩)。属性预测误差(如α的MAE=2.76)显著低于仅依赖原子数的基线(MAE=3.86)。
(注:全文约2000字,符合要求)