分享自:

基于先验知识的物理信息神经网络电磁反演方法

期刊:ieee transactions on geoscience and remote sensingDOI:10.1109/tgrs.2024.3371528

本文介绍一项发表于《IEEE Transactions on Geoscience and Remote Sensing》第62卷(2024年)的研究,标题为“A Priori Knowledge-Based Physics-Informed Neural Networks for Electromagnetic Inverse Scattering”。该研究由胡一荻、王晓华(IEEE会员)、周辉与王磊共同完成,他们均来自中国电子科技大学的物理学院。该研究属于电磁学与计算科学交叉领域,具体聚焦于电磁逆散射问题(Electromagnetic Inverse Scattering Problem, ISP),旨在提出一种高效、准确的散射体参数重构方法。

电磁逆散射问题在无损检测、生物医学成像、地球物理勘探和安全筛查等多个领域具有重要应用价值。其核心挑战在于,根据测量得到的散射电磁场数据,反推确定不可见区域内散射体的空间位置和物理特性(如介电常数)。这是一个复杂的非线性、不适定过程。传统解决方案大致分为两类:一类是基于线性近似模型的非迭代方法,其计算快速但忽略了多重散射效应,精度受限;另一类是迭代反演方法,如Born迭代法、畸变Born迭代法、对比源反演法和子空间优化方法等,它们虽然精度高、鲁棒性好,但计算复杂度极大,需要在精度与效率之间权衡。近年来,深度学习,特别是监督学习范式下的数据驱动方法,为实时、像素级精度的重构提供了可能。然而,这些方法严重依赖大量高质量、带标签的训练数据集,而在电磁逆散射问题中,获取这样的数据集极其困难,这限制了其在更广泛实际问题中的应用。此外,当测试数据与训练数据分布差异较大时,其性能会显著下降。

为了克服上述局限,无监督的物理信息神经网络(Physics-Informed Neural Networks, PINNs)应运而生。PINNs将已知的物理方程(如麦克斯韦方程组)作为约束直接嵌入神经网络的损失函数中,无需依赖带标签的训练数据,从根本上避免了泛化性问题。然而,将PINNs直接应用于电磁逆散射求解时,仍然面临收敛性、稳定性、精度等方面的挑战。本研究的出发点正是为了应对这些挑战,研究目标是开发一种新型的两步反演方法,以融合传统迭代反演方法与PINNs框架的优势,在无需大规模数据集的前提下,实现更高效率、更高精度的电磁逆散射成像。

本研究提出的方法被命名为DFIM-PINN,其核心工作流程分为两个步骤。第一步,利用一种传统反演算法——基于畸变有限差分频域的迭代方法(Distorted Finite-Difference-Frequency-Domain-based Iterative Method, DFIM)——作为“先验知识生成模块”。该模块的任务是快速计算感兴趣区域内的总电场和介电常数分布的初始解。这里的“快速”和“初始”是关键:DFIM只在较粗的网格(例如30x30像素)上进行计算,因此耗时很短;其结果虽非最终的高精度解,但已经包含了散射体位置和大致轮廓的初步信息。这个步骤为后续的神经网络训练提供了至关重要的物理约束起点。第二步,构建一个级联的PINN框架(模块DNN)。该框架包含多个串联的PINN子模块,数量等于发射源的数量。每个PINN子模块都是一个全连接神经网络,输入是空间坐标(x, y),输出是预测的介电常数ε和总电场Ez。本方法的核心创新在于对PINN损失函数的精心设计。损失函数包含四部分残差项:L1是控制物理规律的偏微分方程残差,即亥姆霍兹方程;L2是介电常数的数据残差,强制网络预测与上一步(对于第一个子模块是DFIM提供的初始解,对于后续子模块是前一个子模块的输出)接近;L3是感兴趣区域内总电场的数据残差,强制网络预测与DFIM提供的总电场数据接近;L4是接收器位置处总电场的数据残差,这是与实测数据(或仿真数据)的直接匹配项。通过将DFIM提供的“先验知识”(初始介电常数和总电场)作为L2和L3项纳入损失函数,本研究实质上为原本可能陷入局部最优或难以收敛的PINN训练过程提供了一个强而有效的“正则化”引导,极大地增强了训练的稳定性和最终解的准确性。

为了验证DFIM-PINN方法的性能,研究团队设计了三个实验案例。实验一(Example I)旨在验证方法的基础精度和抗噪声能力。研究构建了五种复杂度递增的散射体模型(从简单的多个圆柱体到包含高对比度目标的复杂结构),并在接收场数据中分别添加了25%和50%的高斯白噪声。对比方法选择了传统的DFIM(在细网格上运行至完全收敛)。结果显示,在低噪声和中等噪声情况下,两种方法对于普通对比度的散射体都能成功重构形状。但在50%高噪声下,DFIM的结果出现明显失真,而DFIM-PINN仍能大致识别目标位置和轮廓。最关键的是对于高对比度散射体(相对介电常数10),传统DFIM完全失效,无法准确重构轮廓和峰值,而DFIM-PINN则给出了质量好得多的成像结果。这表明,DFIM提供的初始解即使在某些情况下不准确(如高对比度情况),但作为损失函数的一部分,其负面影响是有限的,PINN能够通过学习物理方程进一步修正和优化最终结果。定量指标(数值误差1ε和结构相似性指数SSIM)和计算时间对比均表明,DFIM-PINN在保持与传统方法相当甚至更高精度的同时,计算效率显著提升。

实验二(Example II)采用了一个更具挑战性的经典模型——“奥地利”轮廓散射体,由一个环和两个盘组成,用以评估方法对复杂结构的成像能力。本研究设置了更为广泛的对比实验组,包括:传统DFIM、子空间优化方法(SOM)、传统PINN(无先验知识约束)、数据驱动的卷积神经网络(CU-Net)、以及两种用于展示框架灵活性的混合方法——DFIM-ANN(用ANN替代PINN,无PDE约束)和SOM-PINN(用SOM替代DFIM提供先验知识)。结果表明,传统PINN由于缺乏有效引导,收敛性和重构结果最差。数据驱动的CU-Net在经过大量数据训练后,能够实现近乎实时的优质成像,但其训练耗时极长(约487分钟),且依赖特定数据集。其他所有融合了先验知识的方法都成功重构了目标。其中,DFIM-ANN的结果表明,仅靠数据项约束能获得一定改善,但精度有限。而SOM-PINN和DFIM-PINN这两种同时融合了先验数据约束和物理方程约束的方法,取得了最好的成像质量,且DFIM-PINN略优。实验还展示了级联PINN各子模块的中间输出,清晰显示了随着更多源的总场信息被纳入,成像质量逐步提升的过程。此外,研究对比了不同的采样策略(均匀采样与混合采样)对PINN中PDE残差项计算的影响,证明混合采样(结合均匀采样和Sobol序列采样)能获得更随机、更具代表性的残差点,从而更准确地捕捉精细结构特征,得到误差更小的结果。

实验三(Example III)使用法国菲涅尔研究所提供的真实实验数据进行验证。待测目标是一个已知参数的圆柱体。基于实测数据的反演结果进一步证实了前述结论:DFIM-PINN方法能够有效地处理实际测量中的噪声和模型误差,相比单独使用DFIM,能提供形状更清晰、轮廓更准确的成像结果。

本研究的主要结论是:成功提出了一种新颖、高效且准确的电磁逆散射两步反演方法(DFIM-PINN)。该方法创造性地将传统迭代反演算法产生的先验知识作为额外的数据损失项,融入到物理信息神经网络的训练框架中。这种融合带来了多重好处:首先,它显著加速了PINN的收敛并提高了其稳定性与最终精度;其次,由于属于无监督学习框架,该方法不依赖于难以获取的大规模标记数据集,对各类逆散射问题表现出很强的适应性和泛化能力;最后,它在计算效率上超越了传统高精度迭代方法,在成像质量上媲美甚至优于需要大量训练的数据驱动深度学习方法。因此,本研究不仅在逆散射问题求解能力上超越了传统方法和现有深度学习方法,更重要的是,它在两者之间构建了一座桥梁,为物理驱动与数据驱动融合的科学研究范式提供了一个成功的范例。

本研究的亮点和重要发现包括:1)提出了一种新的、包含先验知识生成模块和级联PINN模块的两步反演框架,这是方法的核心架构创新。2)设计了创新的损失函数,将传统算法提供的粗糙解作为正则化项引入,有效解决了纯PINN在逆问题中训练不稳定、精度不足的难题。3)通过系统的数值与实验验证,证明了该方法在精度、效率和抗噪声鲁棒性方面的综合优势,特别是在处理高对比度、复杂形状散射体时表现突出。4)展示了所提框架的灵活性,例如可以用SOM等其他传统算法替代DFIM作为先验知识源(SOM-PINN),显示了其作为通用框架的潜力。5)深入探讨了采样策略对PINN性能的影响,为相关研究提供了实践参考。

尽管取得了显著成果,作者也指出了该方法的两个主要局限性:一是训练好的PINN网络无法像某些数据驱动模型那样,对新的、未见过的案例进行实时预测,每次求解一个新问题都需要重新训练网络(尽管训练本身是高效的);二是PINN的最终解在一定程度上仍会受到传统算法所提供的初始解精度的影响。未来的工作可以围绕这些局限性,探索网络泛化能力的提升以及更鲁棒的先验知识融合机制。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com