分享自:

基于数据驱动物理信息神经网络与长短期记忆网络的二维圆柱绕流流场重构与预测

期刊:Engineering Applications of Artificial IntelligenceDOI:10.1016/j.engappai.2025.110547

这是一项发表于《Engineering Applications of Artificial Intelligence》期刊2025年卷149期、编号为110547的原创性研究论文。作者是四川大学水利水电学院水力学与山区河流开发保护国家重点实验室的窦业浩、韩迅(通讯作者)和林鹏智(通讯作者)。该研究旨在解决物理信息神经网络(Physics-Informed Neural Network, PINN)在数据驱动应用中,因训练数据不足或质量不佳而导致的在数据集边缘区域拟合能力下降、以及外推预测能力受限的问题,为此提出了一种名为LSTM-PINN(简称LP)的新型耦合模型。

学术背景

本研究的主要科学领域为计算流体力学与人工智能的交叉领域,特别是深度学习在流体动力学建模与预测中的应用。近年来,深度学习作为人工智能的一个重要分支,通过构建多层神经网络模型,以端到端的方式自动从原始数据中学习特征表示,在计算机视觉、自然语言处理等领域取得了显著进展。与此同时,深度学习因其对复杂时空系统中非线性关系强大的建模能力,在计算流体动力学领域也获得了广泛关注。例如,研究者们利用全连接深度神经网络回归雷诺应力,使用融合卷积神经网络通过圆柱表面压力场预测速度场,以及利用人工神经网络建立大涡模拟中的亚网格尺度应力模型。

尽管数据驱动模型能够学习从格式化输入到输出的映射,但其训练数据往往依赖于高保真仿真或实验观测,这些数据的获取通常计算成本高昂。为了缓解对大量高质量数据的依赖并提升模型的鲁棒性和可解释性,Raissi等人于2019年提出的物理信息神经网络(PINN)成为一种有效的解决方案。PINN的核心思想是将控制物理过程的偏微分方程(如纳维-斯托克斯方程)作为约束项嵌入神经网络的损失函数中,使得模型在拟合观测数据的同时,必须遵循底层的物理规律。这种方法显著降低了对训练数据量和质的苛刻要求。

然而,在数据驱动的PINN框架中,若训练样本不足,模型可能无法充分学习物理过程的特征,从而导致泛化能力下降,尤其在时空域的边界处会出现显著的“边缘误差”(edge errors)。这种误差在流体动力学等涉及边界条件的问题中尤为关键。传统的数据获取方法成本高、耗时长,因此需要开发新的方法来克服训练数据不足的挑战。本研究正是在此背景下展开,旨在通过结合擅长处理时间序列长期依赖关系的长短期记忆网络(Long Short-Term Memory, LSTM),增强PINN在流场重建和时间序列预测方面的能力。

研究流程详述

本研究工作流程清晰,主要包含以下几个关键步骤:基础问题定义与数值模拟数据生成、传统PINN模型的建立与验证、PINN模型的简化探索、LSTM网络的独立验证,以及最终的LSTM-PINN(LP)耦合模型的构建与应用验证。

1. 研究对象与数据生成: 研究选取了经典的二维圆柱绕流问题作为验证对象。流体假设为不可压缩,圆柱直径D=1米,运动粘度μ=0.01 m²/s,入口均匀来流速度U=1 m/s,对应的雷诺数Re=100。计算域为[-4, 16] × [-4, 4],水平和垂直方向网格尺寸δx=δy=0.05米,总计算时间100秒,时间步长δt=0.01秒。采用非线性涡粘模型模拟卡门涡街现象。研究从稳定的流场中,截取位于圆柱后方一个半径距离处的一个矩形区域([1, 9] × [-2, 2])内、持续5秒时长的流场数据作为核心训练数据集。该数据集包含了时空坐标(x, y, t)以及对应的速度分量u和v。

2. 传统PINN模型的构建与验证: 研究首先构建了一个标准的PINN模型。其网络架构是一个多层感知机,输入层为3个节点(对应x, y, t),输出层为2个节点(对应一个潜在变量φ和压力p,其中速度u, v通过φ的偏导数求得,此举旨在自动满足连续性方程并减少网络输出)。隐藏层设置为10层,每层20个神经元,使用tanh激活函数。 损失函数由两部分构成:数据损失和物理方程损失。数据损失基于已知时空点上的速度测量值与网络预测值之间的均方误差。物理方程损失则由纳维-斯托克斯方程的残差构成,方程中的偏导数项通过自动微分技术计算得到。总损失是两项损失的加权和(研究中权重α和β均设为1)。网络使用L-BFGS优化器进行训练,选取了共计4000个数据点和20000个方程残差点(分别约占总数据量的0.2%和1.0%)进行训练。经过5万次迭代后,总损失、数据损失和物理损失均降至10⁻⁴以下。将训练好的PINN模型在训练时间段内(如t=2.5秒)的预测结果与计算流体动力学数值解进行对比,结果显示两者速度场分布高度一致,验证了传统PINN模型对该问题的有效性。

3. PINN模型的简化探索: 研究者基于一个观察提出了一个创新性的简化思路:所选训练区域位于圆柱后方,处于边界层之外的自由流区域,流体粘度的影响可能相对较小。因此,他们尝试在构建物理方程损失时,忽略纳维-斯托克斯方程中的粘性项(即μ∇²u和μ∇²v项),从而形成了一个无粘版本的PINN损失函数。使用相同的网络架构和训练设置,该简化模型同样能将损失降至10⁻⁴以下,并且其预测的流场速度分布与完整PINN模型以及CFD结果基本一致。进一步的测试表明,在低粘度条件下(如Re=100, 200, 1000),忽略粘度项的简化模型在保持可接受精度(RMSE略有升高但仍在较低水平)的同时,训练时间几乎减少了一半。这为低粘度条件下的流场重构提供了一种快速可行的替代方案。

4. 传统PINN的局限性揭示: 为了凸显新模型的优势,研究者测试了传统PINN模型在预测训练数据集时间范围之外的流场(从5.2秒到6.0秒)时的表现。结果显示,随着预测时间超出训练范围,模型的预测精度逐步下降,相对误差逐渐增大,涡旋结构出现明显偏差。这直观地证明了数据驱动PINN在缺乏数据区域(时间边缘)泛化能力不足的问题。

5. LSTM网络的独立验证: 作为LP模型的一部分,研究首先独立验证了LSTM网络在时间序列预测上的性能。他们从流场中选取特定空间点,收集其完整时间序列的速度数据。构建了一个LSTM模型(包含一个LSTM层和两个全连接层),用于基于历史时间步数据预测未来时间步的速度。作为对比,同时训练了一个参数规模相当的传统前馈神经网络。在固定观测点上,使用相同的数据集进行训练和验证。结果表明,LSTM模型在预测u和v速度分量时,其决定系数R²分别达到0.9999和0.9998,均方根误差和平均绝对误差均显著低于传统神经网络,且收敛更快。这证明了LSTM在处理此类时间序列数据上的优越性,为其作为数据扩充工具融入PINN奠定了基础。

6. LSTM-PINN(LP)耦合模型的构建与性能评估: LP模型的核心架构是一个双向输入模型。其主要思想是:除了将已知的时空数据点输入PINN进行训练外,还在训练集中引入一些位于已知时间序列末端之外的“未知”数据点。这些“未知”点不贡献数据损失,但必须满足物理方程约束(即贡献物理损失)。为了给这些点提供数据约束以提升精度,研究者利用训练好的LSTM模型(输入已知时间序列,输出未来时间序列的预测),生成这些“未知”时间点上的速度预测值。然后,将这些LSTM预测值与PINN对同一点的预测值进行比较,构成新的数据损失项。这样,LSTM的预测能力被用来“填充”时间边缘缺失的数据,从而引导PINN在物理约束和数据约束的共同作用下,做出更准确的时空外推预测。 将该LP模型应用于单圆柱绕流问题,预测5.2秒至6.0秒的流场。结果显示,相比传统PINN,LP模型预测的垂直速度场与CFD结果吻合得更好,相对误差显著降低。定量分析表明,在预测时间段内,LP模型预测的u和v速度分量与CFD结果的决定系数R²分别高达99.98%和99.95%,且均方根误差在整个预测时段内保持稳定低位。

7. 复杂场景验证:三圆柱绕流 为了进一步验证LP模型在处理更复杂、非线性更强的流场时的鲁棒性,研究设计了一个三圆柱绕流的场景。数值设置与单圆柱类似,训练数据集位于最右侧圆柱后方5倍半径处的矩形区域。同样使用传统PINN和LP模型进行训练和超时预测。结果表明,在更强的非线性干扰下,传统PINN在训练时间范围外的预测误差迅速增长,流场重构精度严重恶化。而LP模型则依然表现出色,其预测的流场与CFD结果高度一致,误差远低于传统PINN。定量指标再次证实,LP模型在高度非线性的三圆柱问题中,仍能保持高精度和稳定的预测性能,显著优于传统模型。

主要结果

本研究获得了一系列系统性结果,层层递进地支撑了最终结论。

首先,传统PINN模型的有效性得到确认。在二维圆柱绕流问题上,使用仅占总量约1.2%的稀疏数据点进行训练,PINN能够成功学习并重构出与高保真CFD模拟高度一致的流场(如图6所示)。这表明将物理方程嵌入损失函数能够有效利用物理先验知识,降低对数据量的需求。

其次,提出并验证了一个实用的PINN简化方案。研究发现,在低粘度流动的特定区域(如圆柱远场尾迹),忽略纳维-斯托克斯方程中的粘性项,构建简化PINN模型,仍能获得可接受的预测精度(RMSE与传统PINN同量级,见图8和表1)。更重要的是,此简化将训练时间减少了近一半,为快速流场重构提供了一种潜在的高效方法。

第三,明确揭示了数据驱动PINN的局限性——时间外推能力弱。当要求模型预测训练数据时间窗口之外的流场时,其精度随着预测时间的延伸而显著下降,边缘误差凸显(如图9所示)。这直接点明了本研究的核心问题:数据稀缺(尤其是时间边缘数据稀缺)制约了PINN的泛化与预测能力。

第四,独立验证了LSTM在流场时间序列预测中的优越性。在固定空间点的时间序列预测任务中,LSM模型在R²、RMSE和MAE等多个指标上均大幅超越传统前馈神经网络(图10和表2),证明了其捕获时间依赖关系的强大能力,为其作为LP模型的数据扩充模块提供了性能保障。

第五,也是最核心的结果,是LP耦合模型显著提升了时空预测性能。在单圆柱案例中,LP模型将传统PINN在5.2-6.0秒预测时段的误差大幅降低,流场结构预测更加准确(对比图9与图12)。定量指标显示,预测速度与CFD结果的决定系数R²接近1,且RMSE在整个预测时段保持平稳低值(图13,图14)。这证实了通过LSTM预测补充时间边缘“虚拟数据”的策略,能有效缓解PINN因数据不足导致的泛化能力下降问题。

第六,LP模型在更复杂的非线性流场中展现出更强的鲁棒性。在三圆柱绕流这一更具挑战性的场景中,传统PINN的预测在训练时间外迅速失效,而LP模型依然保持了高精度的预测能力(对比图17与图18)。其R²值保持高位,RMSE曲线稳定(图19,图20)。这一结果有力地证明了LP模型不仅适用于简单流场,对于非线性更强、流态更复杂的真实工程问题也具有良好的应用潜力。

这些结果之间存在清晰的逻辑链条:PINN的基础有效性是起点;其在外推预测中的局限性是提出新模型的动机;LSTM在时序预测上的优异表现是新模型可行的技术基础;最终,LP模型的成功验证,不仅解决了传统PINN的边缘误差问题,还通过三圆柱案例证明了其在复杂场景下的优越性,从而全面达成了研究目标。

结论与研究意义

本研究的结论是:所提出的LSTM-PINN(LP)耦合模型,通过整合LSTM在时间序列预测上的优势与PINN的物理约束框架,有效地弥补了传统数据驱动PINN在训练数据不足时产生的边缘误差,显著增强了模型对流场进行时间序列预测的短期能力。该模型在单圆柱和复杂的三圆柱绕流案例中均表现优异,展现了其在流场重建与预测方面的巨大潜力。

本研究的科学价值在于,为解决物理信息机器学习中“数据饥饿”与“物理约束”之间的平衡问题提供了一个创新性的融合框架。它并非简单地将两种网络叠加,而是设计了一种双向交互机制:LSTM为PINN在时间边缘提供高质量的数据先验,而PINN的物理定律则约束和校正LSTM的纯数据驱动预测,两者相辅相成。这种架构上的创新为处理时空动力系统的偏微分方程求解与预测问题提供了新思路。

其应用价值十分明确:在实际工程和科学问题中,获取完整、高分辨率的流场数据通常成本高昂或不可行。LP模型能够利用有限的观测数据,结合物理规律,高精度地重建和预测流场演化,从而节省大量计算资源和时间。这对于流体机械设计、环境流体力学、空气动力学优化等领域的高效数字化建模与仿真具有重要的实用意义。

研究亮点

  1. 方法创新性:本研究最主要的亮点是提出了一种新颖的LSTM-PINN耦合模型架构。该架构创造性地利用LSTM生成的时间序列预测来扩充PINN训练集在时间维度上的边界,从而直接针对并有效缓解了数据驱动PINN中常见的“边缘误差”这一瓶颈问题。
  2. 性能优越性:通过严谨的对比实验(与传统PINN对比,与简单NN对比),在经典和复杂的流场案例中,系统地证明了LP模型在时空外推预测精度和稳定性上的显著优势。特别是在非线性强烈的三圆柱绕流问题中,其性能提升尤为突出。
  3. 实用化探索:除了主模型外,研究还提出了一个具有洞察力的简化PINN方案,即在低粘度区域忽略粘性项。这一做法在保证一定精度的前提下大幅降低了计算成本,为特定条件下的快速流场重构提供了切实可行的技术路径,体现了研究工作的工程实用性思维。
  4. 系统性验证:研究工作流程完整,从数据生成、基线模型建立、问题剖析、组件验证到最终模型测试与复杂场景验证,层层递进,论证充分。使用了多种定量评估指标(R², RMSE, MAE等)和可视化对比,使结果非常具有说服力。

其他有价值内容

研究在讨论部分也坦诚地指出了LP模型的局限性:其预测精度和预测时间范围高度依赖于LSTM组件自身的预测能力。在流场模式极其复杂、演变迅速的情况下,仅依赖历史数据的LSTM预测会逐渐失效,从而限制整个LP模型的长期预测能力。作者为此指出了未来的改进方向,包括采用数据增强技术、优化LSTM架构、集成混合模型、优化数据采集策略以及在更广泛的流动条件下进行验证与校准等。这种对局限性的客观认识和对未来工作的展望,使得研究更加全面和严谨。

此外,研究所使用的训练数据集已公开,这有利于其他研究者复现和在此基础上进行进一步的工作,体现了开放科学的精神。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com