分享自:

用于求解中子扩散特征值问题的数据驱动物理信息神经网络全面数值研究

期刊:annals of nuclear energy

中国科学院数学与系统科学研究院、上海交通大学、四川大学及中国核动力研究设计院的多位研究人员于2022年在《Annals of Nuclear Energy》期刊上发表了一项题为《A Data-Enabled Physics-Informed Neural Network with Comprehensive Numerical Study on Solving Neutron Diffusion Eigenvalue Problems》的研究。这项研究提出了一种名为数据启用的物理信息神经网络(Data-Enabled Physics-Informed Neural Network, DePINN)的新方法,用于解决工业规模的中子扩散特征值问题(Neutron Diffusion Eigenvalue Problems, NDEPs)。该研究是科学机器学习(Scientific Machine Learning, SML)在核反应堆物理领域应用的重要探索。

研究的学术背景主要源于核反应堆工程中对中子通量分布进行准确预测的迫切需求。中子扩散理论是核芯中子物理模拟的基础,传统上依赖于有限差分法、节点法等多种成熟的数值计算方法。近年来,科学机器学习,特别是物理信息神经网络(Physics-Informed Neural Networks, PINN)的发展,为解决偏微分方程提供了无网格、易于实现的可能途径。然而,在核反应堆物理领域,尤其是针对复杂几何和实际工程问题(广泛使用双群扩散方程),PINN的应用研究尚不充分,缺乏系统性的数值验证。先前的工作(如[8])主要集中于简单一维单能问题,对于实际工程问题中PINN的表现、训练稳定性、准确性以及如何结合少量先验数据提升性能等问题,亟需更全面的研究。因此,本研究旨在深入探究PINN在解决复杂中子扩散特征值问题上的可行性,并发展一种能够有效利用少量实验或高保真模拟先验数据的DePINN框架,以期为实际核工程应用提供一种高精度、高效率的补充或替代方案。

本研究的工作流程系统而全面,主要包含以下关键步骤:

第一,DePINN模型构建与损失函数设计。研究团队采用全连接神经网络作为近似器,网络的输出是近似的中子通量解。与一般PINN不同,DePINN的关键创新在于其损失函数不仅包含控制方程残差项、边界条件项,还引入了基于先验数据的项。如公式(4)所示,总损失函数L由三部分加权和构成:L_res(方程残差平方和)、L_b(边界条件平方和)以及L_p(网络预测解与先验数据点处参考解之差的平方和)。这里的先验数据被定义为从物理实验或高保真数值解(如有限元解)中提取的少量数据点。这种设计使得网络训练不仅受物理规律约束,还被少量已知数据“锚定”,从而有助于在复杂问题中找到唯一且工程可接受的解,同时避免了为特征值(或有效增殖因子k_eff)设计专门搜索算法的麻烦,因为k_eff也被作为网络内部的可训练变量。

第二,自适应优化策略的开发与实现。针对PINN训练中常用的Adam与LBFGS组合优化策略存在的缺陷(如Adam训练轮数固定导致效率低下或损失函数波动影响LBFGS启动),本研究设计了一种创新的自适应优化算法。该算法(如算法1所述)的核心思想是动态判断Adam优化的收敛状态,以决定何时切换至LBFGS优化。具体而言,算法监控最近2s1个训练周期内损失函数的变化,计算两个连续s1周期内的平均变化量dif1和dif2。当dif1与dif2的绝对差值小于一个预设阈值ε1时,认为Adam优化已充分工作且损失函数趋于平稳,此时自动切换至LBFGS优化器进行精细调优。这种方法有效避免了因Adam训练不足或在其损失值波动高点切换而导致的性能下降问题。

第三,系统性的数值实验与参数研究。为了全面评估DePINN的性能,研究选择了三个复杂度递增的基准问题:1) 一维单能有限球状反应堆(Case-1),具有解析解;2) 二维单能有限圆柱状反应堆(Case-2),同样具有解析解;3) 二维IAEA基准问题(2D IBP),这是一个模拟实际压水堆的复杂二维双群扩散问题,几何和材料参数复杂,是工程验证的“试金石”。对于2D IBP,其参考解通过有限元软件FreeFem++获得。

研究流程围绕2D IBP这一核心案例展开了详尽的参数敏感性分析,这是工作的重点: 1. 网络架构敏感性:首先探究了网络深度和宽度对结果的影响。实验表明,在宽度固定为80的情况下,随着深度从2层增加到8层,解的精度逐步提升。考虑到模型复杂度和泛化能力,后续实验固定采用宽度80、深度8的网络结构。 2. 损失函数权重分配:系统研究了损失函数中各项权重(α1, α2, α3)的影响。实验发现,在仅有少量先验点的情况下,增大先验数据项L_p的权重α3至10,能显著提升训练效果和最终精度。而过度增大残差项或边界条件项的权重则可能导致训练困难。因此,最终确定α1=1, α2=1, α3=10为较优配置。研究还解释了选用平方和误差(SSE)而非均方误差(MSE)的原因,在于SSE为自适应优化算法中的超参数设置提供了更大范围。 3. 优化策略对比:将提出的自适应优化策略(策略-3)与两种固定策略(策略-1:固定Adam训练5000轮;策略-2:损失值低于阈值后停止Adam)进行了对比。结果显示,自适应策略在保证精度的同时,实现了更高的训练效率,避免了其他策略可能存在的过早停止或无效训练的问题。进一步实验确定了自适应算法中的超参数s1=2000和ε1=1.0为较优选择。 4. 采样策略影响:深入探讨了先验数据点(xp)的选取策略。由于不同材料区域(如燃料区ω1,2,3与反射层ω4)物理系数差异巨大,研究设计了实验来考察先验点分布对结果的影响。关键发现是:将燃料区(ω1)的先验点固定在其与反射层(ω4)的交界处,同时让反射层内的先验点从交界处向区域中心移动,有助于网络更好地学习界面处通量的剧烈变化,从而获得更优结果。此外,还研究了计算域内残差点(xr)和边界点(xb)的采样率影响,发现更高的采样率(如0.75)带来更好的精度,但计算成本也相应增加,需权衡后选择。 5. 模型泛化性能测试:在固定所有其他最优参数后,研究改变了2D IBP中关键参数(ω2和ω3区域的宏观吸收截面σa,2)的值,用训练好的DePINN模型求解一系列参数化问题,以测试其泛化能力。

本研究的主要结果体现在以下几个方面:

首先,在简单基准问题(Case-1和Case-2)上,使用不含先验数据项的普通PINN即可获得极高精度。如表V所示,预测解与解析解在L∞范数和L2范数下的相对误差均达到10^-4至10^-5量级,平均预测误差(APE)和均方误差(MSE)也极低,性能优于文献[7, 8]中报道的模型。这验证了PINN框架解决简单中子扩散问题的有效性。

其次,也是更重要的,是针对复杂工程问题2D IBP的全面数值结果。研究通过大量对比实验,系统地展示了不同因素对DePINN性能的影响。 1. 先验数据的关键作用:表I和表II的对比有力地证明了引入少量先验数据的巨大价值。表I显示,在训练初期,先验损失项L_p占总损失的绝大部分(98.80%),其快速下降引导网络快速逼近真实解。随着训练进行,边界损失项L_b成为主导(后期超过96%),表明网络对边界条件高度敏感。表II的对比更加直观:在没有先验信息的情况下,即使训练5万轮,通量u和v的相对L∞误差仍高达0.6290和1.0001,k_eff误差为0.0118;而引入先验数据后,仅训练1万轮,各项误差就已显著降低(u和v的L∞误差降至0.0668和0.3487,k_eff误差降至0.0021),训练至8万轮时精度进一步提升(u和v的L∞误差降至0.0110和0.0331,k_eff误差低至0.0002)。 2. 最优配置下的最终性能:在确定了网络架构、损失权重、优化策略、采样策略等所有最优参数后,DePINN在2D IBP上取得了满足工程验收标准的成果。如图13所示,DePINN预测的通量分布(u和v)与FreeFem++高保真参考解在视觉上高度一致。绝对误差图显示,误差主要出现在不同材料交界的角落和界面区域,这符合物理预期,也指明了未来改进需重点关注这些区域。具体误差数据汇总于表VIII,在各子区域(ω1至ω4)内,通量u和v的L∞相对误差基本在1%量级(最高约3.15%),L2相对误差更低。最关键的有效增殖因子k_eff的相对误差达到了0.0001至0.0002的极高精度,远优于工程要求的0.005。 3. 泛化性能验证:如表VI和表VII所示,当改变ω2和ω3区域的σa,2参数(从0.080到0.130)进行22组实验时,训练好的DePINN模型在所有情况下计算得到的k_eff相对误差最大值仅为0.0049(发生在ω2区域),通量误差也均满足工程验收标准(相对通量<0.9的区域误差<8%,>0.9的区域误差%)。这充分证明了所提出的DePINN模型具有良好的参数泛化能力,一旦网络结构训练完毕,可以高效应用于其他输入参数设置。

本研究的结论明确:提出并验证了一种数据启用的物理信息神经网络(DePINN),用于有效求解从中子扩散特征值问题。通过从简单几何到复杂几何、从单能方程到双群方程的三个典型基准问题的系统性测试,证实了该方法的可行性。研究表明,对于复杂的工程尺度问题,引入少量先验数据对于达到工程可接受的精度至关重要。所设计的自适应优化算法能有效加速训练收敛。全面的参数研究为实际应用DePINN提供了重要指导。最终,在具有实际工程背景的2D IAEA基准问题上,DePINN在满足严格工程验收标准的同时,展现了优异的泛化性能。这确认了DePINN在核反应堆物理实际工程应用中的潜力。

本研究的亮点突出:第一,研究主题具有前沿性和明确的工程应用导向,首次对PINN在复杂双群中子扩散特征值问题(IAEA基准问题)上进行了全面、系统的数值研究,填补了该领域空白。第二,方法创新显著,提出了“数据启用”的概念,强调了利用少量先验数据(模拟实验测量)来提升PINN在复杂工程问题中精度和效率的思想,并设计了相应的损失函数。第三,技术细节深入,不仅提出了新颖的自适应优化算法,还对损失函数权重、采样策略等关键超参数进行了详尽的实验分析和最优选择,为后续研究者提供了宝贵的经验参考。第四,验证体系完整,从简单解析案例到复杂工程问题,从精度验证到泛化性能测试,构建了严谨的评估链条,结论可信。第五,开放科学精神,作者公开了所有数据和代码,便于复现和进一步研究。这些工作共同推动了科学机器学习在核工程领域的实用化进程。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com