本研究的核心作者包括:
- Jan-Hendrik Bastek(瑞士苏黎世联邦理工学院机械与过程工程系)
- Waiching Sun(美国哥伦比亚大学土木工程与工程力学系)
- Dennis M. Kochmann(瑞士苏黎世联邦理工学院机械与过程工程系)
该研究以会议论文形式发表于ICLR 2025,标题为《Physics-Informed Diffusion Models》。
本研究属于科学机器学习(Scientific Machine Learning)与生成模型(Generative Models)的交叉领域,聚焦于如何将物理约束(如偏微分方程,PDEs)嵌入扩散模型(Diffusion Models)的训练框架中。
传统扩散模型(如去噪扩散概率模型,DDPM)在图像、视频、分子设计等领域表现出色,但其生成样本可能违反物理规律。例如,在流体力学或结构优化中,生成的压力场或材料分布需严格满足控制方程(如Darcy方程或弹性力学方程)。现有方法通常依赖数据驱动训练,缺乏对物理约束的显式嵌入,导致生成样本的物理一致性不足。
本研究提出物理信息扩散模型(PIDM),通过以下创新解决上述问题:
1. 理论框架:将物理约束以“虚拟观测”形式融入扩散模型的训练目标,从第一性原理推导损失函数。
2. 算法实现:提出两种残差评估策略(均值估计与DDIM采样估计),平衡计算效率与物理一致性。
3. 应用验证:在Darcy流和结构拓扑优化两个案例中,PIDM将残差误差降低1-2个数量级,并优于任务专用方法(如CoCoGen、TopoDiff)。
物理系统通常由PDE描述:
[ f[u(\xi)] = 0, \quad \xi \in \Omega
]
边界条件为:
[ b[u(\xi)] = 0, \quad \xi \in \partial\Omega
]
其中,( u )为解场(如压力、位移),( \Omega )为定义域。研究将离散化的解场( x_0 \in \mathbb{R}^{c \times n \times n} )(如64×64网格)作为扩散模型的生成目标,要求其满足残差( r(x_0) = 0 )。
PIDM的损失函数结合数据似然与物理残差:
[ \mathcal{L}{\text{PIDM}}(\theta) = \mathbb{E}{t,x_{0:t}} \left[ \lambda_t |x_0 - \hat{x}_0(x_t, t)|^2 + \frac{1}{2\bar{\sigma}_t^2} |r(x^*_0(x_t, t))|^2 \right]
]
其中:
- 第一项为传统扩散损失(最小化去噪误差);
- 第二项为物理残差损失,通过调整方差( \bar{\sigma}_t = \sigma_t / c )控制约束强度。
直接使用模型预测的干净信号( \hat{x}_0 = \mathbb{E}[x_0|x_t] )计算残差,计算高效但存在Jensen间隙(Jensen gap)。
通过DDIM(Denoising Diffusion Implicit Models)快速采样生成( x^*_0 ),再计算残差。该方法更精确但需额外前向传播。
jhbastek/physicsinformeddiffusionmodels),促进社区应用。(报告字数:约2000字)