本研究的通讯作者为Yi-Qing Ni(香港理工大学土木与环境工程系),第一作者为Lei Yuan(同单位),合作者包括Xiang-Yun Deng和Shuo Hao。研究团队来自香港理工大学土木与环境工程系及轨道交通电气化与自动化国家工程研究中心香港分中心。论文发表于Journal of Computational Physics(2022年卷462,页码111260),为开放获取文章,遵循CC BY-NC-ND 4.0许可协议。
研究领域:本研究属于计算物理与深度学习交叉领域,聚焦于非线性积分微分方程(Integro-Differential Equations, IDEs)的数值求解问题。IDEs广泛存在于经济学、纳米力学、人口动力学等学科中,但传统数值方法(如有限元法)需离散积分项,引入截断误差且计算效率低。
研究动机:物理信息神经网络(Physics-Informed Neural Networks, PINNs)近年来在偏微分方程求解中表现出色,但其在IDEs中的应用受限于积分算子的处理。现有方法依赖数值离散(如高斯-勒让德积分),导致误差累积和计算成本高昂。本研究提出辅助物理信息神经网络(Auxiliary PINN, A-PINN),通过引入辅助变量替代积分运算,避免离散化误差,并提升高维问题的求解效率。
目标:开发一种无需积分离散的通用框架,精确求解IDEs的正向(预测解)和逆向(参数反演)问题,尤其针对非线性、高维及Fredholm/Volterra型IDEs。
核心创新:
- 多输出神经网络:同时预测主变量(如方程解(u(x)))和辅助变量(如积分项(v(x)))。
- 自动微分替代积分:通过定义辅助变量满足的微分关系(如(dv/dx = k(x)u(x))),将积分方程转化为微分方程组,利用神经网络自动微分能力解析求解。
- 物理约束嵌入:在损失函数中加入辅助变量与主变量的关系约束(即输出条件),确保物理一致性。
工作流程:
1. 网络构建:采用全连接前馈神经网络,输入为自变量(如(x)或(t, x_1, \dots, x_9)),输出为主变量和辅助变量。例如,对Volterra IDE (du/dx + u = \lambda \int_0^x e^{t-x}u(t)dt),定义辅助输出(v(x) = \int_0^x e^{t-x}u(t)dt),并约束其满足(dv/dx = u(x) - v(x))。
2. 损失函数设计:
- 初始/边界条件残差(MSEi, MSEb):如(|u(0)-1|^2)。
- 控制方程残差(MSEf):如(\left| \frac{du}{dx} + u - \lambda v \right|^2)。
- 输出条件残差(MSEo):如(\left| \frac{dv}{dx} - u + v \right|^2)。
3. 自适应权重策略:动态调整损失项权重(如(w_i = \text{MSE}_i / \min(\text{MSE}_i, \text{MSE}_f, \text{MSE}_o))),加速收敛。
4. 优化器:采用L-BFGS(拟牛顿法)最小化总损失函数。
研究通过6类数值实验验证A-PINN的有效性:
1. 一维Volterra IDE基准问题:与离散积分PINN对比,A-PINN相对L2误差降低至0.0259%(原方法为0.2%)。
2. Volterra IDE方程组:求解耦合非线性系统,相对误差0.00559%。
3. 二维Volterra IDE:10D高维问题中,相对误差0.519%。
4. Fredholm IDE:固定积分限问题,误差0.0477%。
5. 参数反演(逆向问题):在含噪声数据下,成功识别(\lambda)(误差%)。
科学价值:
1. 误差控制:消除积分离散化误差,提升解的精度。
2. 通用性:适用于线性和非线性、Volterra和Fredholm型、低维和高维IDEs。
3. 工程应用潜力:在参数反演(如材料特性识别)、多物理场耦合问题中具实用前景。
创新点:
- 多输出网络设计:首次将辅助变量作为网络输出,通过微分关系隐式表达积分。
- 自适应权重策略:解决多目标损失平衡难题,提升收敛稳定性。
局限性:
- 对强奇异性或非光滑解的适应性需进一步验证。
- 高维问题中网络训练时间较长,需优化并行计算。
本研究为IDEs的机器学习求解开辟了新途径,代码已开源(GitHub),可供后续研究直接应用或扩展。