基于生成对抗机制的物理信息神经网络(GA-PINNs)在正反问题求解中的应用研究
一、作者与发表信息
本文由Wensheng Li(大连理工大学数学科学学院)、Chuncheng Wang(哈尔滨工业大学数学学院)、Hanting Guan(大连理工大学数学科学学院)、Jian Wang(中国石油大学(华东)理学院)、Jie Yang与Chao Zhang(大连理工大学数学科学学院及辽宁省计算数学与数据智能重点实验室)、Dacheng Tao(新加坡南洋理工大学计算与数据科学学院)合作完成,发表于期刊《Computers and Mathematics with Applications》2025年第183卷(98–120页)。研究聚焦于小样本条件下物理信息神经网络(Physics-Informed Neural Networks, PINNs)的优化,提出了一种结合生成对抗网络(Generative Adversarial Networks, GANs)机制的新型框架GA-PINNs。
二、学术背景与研究目标
科学领域:本研究属于计算数学与深度学习交叉领域,核心问题为偏微分方程(Partial Differential Equations, PDEs)的数值求解。传统数值方法(如有限元法FEM、有限差分法FDM)依赖网格生成与高计算成本,而PINNs通过神经网络直接拟合PDE的解,避免了网格划分,但面临两大挑战:
1. 小样本局限性:实际工程中高精度标签样本(如传感器数据)稀缺,传统PINNs难以充分利用有限标签提升精度;
2. 训练不稳定性:复杂网络结构导致训练过程易发散。
研究目标:提出GA-PINNs框架,通过生成对抗机制增强PINNs对小样本的利用效率,提升正问题(正向求解PDE)和反问题(参数反演)的精度与训练稳定性,并推广至Deep Ritz Method(DRM)和Deep Galerkin Method(DGM)。
三、研究方法与流程
1. 网络结构设计
- 生成器(Generator):继承传统PINNs结构,输入为PDE定义域或边界点,输出为解的近似值,激活函数为tanh(·)。
- 判别器(Discriminator):输入为真实标签样本或生成器输出,通过复合激活函数σ = sigmoid(tanh(·))判断样本真伪,其导数峰值更小、活跃区域更窄,提升小样本训练的稳定性。
2. 训练策略
- 对抗损失函数:
- 判别器损失(Discriminative Loss, L_D):最小化真实样本与生成样本的判别误差;
- 生成器损失(Generative Loss, L_G):结合监督损失(L_T)和对抗损失,驱动生成器逼近真实解。
- 物理信息约束:每轮对抗训练后,进一步优化物理信息损失(L_PI),确保生成器输出满足PDE方程与边界条件。
- 学习率调整:判别器学习率(η_D)设为生成器(η_G)的5倍,强化判别器对生成器的引导作用。
3. 实验设计
- 正问题测试:Burgers方程、Schrödinger方程等6类PDE,标签样本数J ≪ 训练点数N(如J=10 vs. N=10,000)。
- 反问题测试:Allen-Cahn方程、Burgers方程等4类含未知参数的PDE,通过标签样本反演参数。
- 对比模型:PINN、PINN†(引入L_T)、GA-PINN、GA-PINN†、GA-PINN‡(预训练后对抗微调)。
4. 数据与评估
- 采样方法:拉丁超立方采样(LHS)生成训练点,每几百次迭代重新采样以覆盖解空间。
- 评估指标:归一化均方根误差(NRMSE)衡量解精度,迭代次数衡量训练效率。
四、主要结果
1. 正问题求解性能
- 精度提升:GA-PINN†在Schrödinger方程中NRMSE降至0.0085,优于PINN†(0.0227)和原始PINN(0.0669)。
- 效率优势:Helmholtz方程中,GA-PINN†仅需1142次迭代达到NRMSE=0.0034,而PINN†需1207次(NRMSE=0.0133)。
- 可视化验证:误差热图显示GA-PINNs在大部分区域更接近真实解(表6)。
2. 反问题参数反演
- 收敛速度:GA-PINN§在Allen-Cahn方程中,参数D的估计值更快收敛至真实值0.001(表13右列)。
- 稳定性:标签样本减少时,GA-PINN§的NRMSE波动小于PINN§(表14)。
3. 方法泛化性
- GA-DRM与GA-DGM:在Poisson方程中,GA-DRM的NRMSE(0.0234)低于DRM†(0.0429);GA-DGM在高维Poisson方程中表现最优(NRMSE=0.0261)。
五、结论与价值
科学价值:
1. 理论创新:首次将GAN的对抗机制与PINNs结合,提出小样本条件下PDE求解的新范式;
2. 方法普适性:框架可扩展至DRM、DGM,为其他物理建模任务提供参考。
应用价值:
- 工程场景:适用于传感器数据有限的实际问题(如流体力学、地质预测);
- 计算效率:减少对高精度标签的依赖,降低实验与仿真成本。
六、研究亮点
1. 对抗机制创新:通过判别器引导生成器,显式利用标签样本的物理信息;
2. 稳定性设计:复合激活函数与动态学习率策略有效抑制梯度异常;
3. 跨方法验证:在PINNs、DRM、DGM三类方法中均验证有效性。
其他贡献:开源代码(GitHub)与详细实验设置,推动领域复现与后续研究。
(注:本文为类型a——单篇原创研究的学术报告,全文约2000字,涵盖背景、方法、结果与结论的完整逻辑链。)