分享自:

基于深度强化学习的叶片通道最优CFD自动网格生成方法

期刊:journal of computational physicsDOI:10.1016/j.jcp.2025.114306

利用深度强化学习实现叶片通道最优CFD的自动网格生成方法研究报告

一、 主要作者、机构与发表信息

本研究由韩国浦项科技大学机械工程系的Innyoung Kim、Jonghyun Chae和通讯作者Donghyun You共同完成。研究成果以论文形式发表于journal of computational physics期刊,该论文于2025年8月16日在线发表,收录于期刊第541卷,论文编号为114306。该研究旨在解决计算流体力学领域中长期存在的、高成本且依赖专家经验的网格生成难题。

二、 研究学术背景

本研究属于计算流体力学与人工智能交叉学科领域,具体聚焦于湍流机械(如燃气轮机、蒸汽轮机、压缩机)叶片通道的CFD模拟前处理——结构化网格生成。

CFD模拟的精度、稳定性和效率高度依赖于计算网格的质量。然而,为复杂几何(如具有复杂曲率的叶片)生成高质量的结构化网格是一项极其耗时且需要大量人工干预的挑战性任务。传统方法通常需要工程师根据特定几何和流动条件,反复手动调整网格参数(如各方向网格节点数、膨胀比、聚类系数等),通过多次迭代CFD模拟来寻求网格无关解,此过程严重依赖专家经验且计算成本高昂。尽管已有自动网格生成工具,但它们通常仍需手动调整参数,缺乏通用性。

先前研究尝试利用优化算法(如遗传算法)或监督式深度学习来自动化网格生成,但它们存在明显局限:优化方法本质上是迭代的,且结果仅适用于特定配置,无法泛化;监督学习需要大量高质量的“网格-解”标签数据,而获取此类数据本身就需要巨大的人力与计算成本。深度强化学习作为一种试错学习范式,无需预先准备的标签数据,并通过智能体与环境的交互来学习最优策略,为解决网格生成中的泛化问题和自动化需求提供了新思路。

本研究的目标是开发一种基于深度强化学习的端到端自动网格生成方法。该方法的核心是训练一个智能体(网格生成器),使其能够针对任意给定的叶片几何形状和流动条件,在单次CFD模拟中即生成一个在几何质量和分辨率上都达到最优的网格,从而以最小计算成本获得最高模拟精度,彻底消除传统方法中为达到网格收敛而进行的迭代CFD流程。

三、 研究详细工作流程

本研究的工作流程分为两个主要步骤,以应对CFD模拟带来的高昂训练成本,并将10维的动作空间(网格参数)分解优化。

第一步:几何质量最大化训练 此步骤旨在训练网格生成器,使其能够为各种叶片通道构型自主选择控制网格形状的参数,以最大化网格的几何质量,无需CFD模拟。 1. 状态与动作定义: * 状态:包含叶片形状参数、通道宽度,以及预定义的与分辨率相关的参数(如O型网格总节点数、前后缘聚类强度、第一层网格高度)。这些分辨率参数在此步作为状态输入而非优化目标,为后续步骤预留灵活性。 * 动作:即需要优化的6个几何控制参数,包括进/出口垂直位置、周期性边界曲率、O型与H型网格交界位置,以及切向与法向节点数分配比例。 2. 奖励函数设计:奖励基于两个几何质量指标计算:雅可比矩阵行列式比值和单元偏斜度。这两个指标分别衡量网格单元的面积一致性(平滑度)和正交性。奖励函数取这两个指标在整个O型网格区域的最小值和平均值的综合,旨在同时改善最差单元质量和整体网格质量。 3. 学习过程:采用单步演员-评论家算法。每个训练回合,随机生成一个状态(代表一种叶片构型),演员网络根据状态输出动作(网格参数),网格生成器据此生成网格并计算几何质量奖励。将数据存入经验回放池,并用来更新评论家网络(更准确预测奖励)和演员网络(输出能最大化奖励的动作)。此过程重复约100万回合,直到网络收敛。训练完成的网格生成器能够为训练范围内的任意几何构型生成几何质量接近最优的网格。

第二步:融合CFD的最优训练 此步骤在第一阶段训练好的网格生成器基础上,引入CFD模拟结果,优化剩余的控制网格分辨率的4个参数,以实现模拟精度与计算成本的最优平衡。 1. 状态与动作定义: * 状态:扩展为包含流动条件的完整计算配置。包括叶片几何参数、通道宽度,以及无量纲化的出口等熵雷诺数、出口等熵马赫数和进气角。此外,还引入一个权重变量作为状态,用于在精度与成本之间进行权衡。 * 动作:即需要优化的4个分辨率控制参数,包括O型网格总节点数、前后缘聚类强度和第一层网格高度。 2. 奖励函数设计:采用多目标优化框架下的加权切比雪夫方法。目标函数有两个: * 成本函数:反映模拟总耗时,近似为迭代次数与总网格单元数的乘积。 * 误差函数:用于评估网格收敛性。通过比较基础网格(DRL生成)和其加密一倍后的精细网格的CFD结果(全场马赫数和叶片表面等熵马赫数)的均方根误差来计算。 * 最终奖励:根据状态中给定的权重,对标准化后的成本与误差函数进行加权切比雪夫标量化,旨在寻找帕累托前沿上的最优解。为加速数据获取,还设计了数据复现策略:单次CFD模拟得到成本和误差后,可通过随机改变权重生成多达100组不同权重下的奖励数据,极大提高了数据利用效率。 3. 学习过程:采用多智能体强化学习以并行加速数据收集。部署256个智能体,每个智能体被随机分配一个状态(包含几何、流动条件和权重)。各智能体并行执行动作(生成网格)、运行CFD模拟、计算奖励。完成模拟的智能体将数据(经复现后)存入中央经验回放池。中央的演员-评论家网络使用池中的数据进行更新。这种动态任务分配使得数据收集速度几乎与智能体数量成线性比例提升。此阶段共进行了约50万次RANS模拟,耗时约8周,最终训练出能够根据用户对精度/成本的偏好(权重),为未见过的叶片构型一次性生成最优网格的策略网络。

研究涉及的自主研发方法与算法: * 单步深度强化学习框架:针对网格参数优化这类“一步到位”的问题,将传统的多步DRL简化为单步决策,每个回合仅执行一次动作并获得奖励,更高效地寻找固定问题的最优解。 * 两阶段分解训练策略:将高维动作空间分解,先优化几何质量(无需CFD),再优化分辨率(需要CFD)。这降低了第二阶段探索的维度和难度,同时保证了用于CFD的网格已具备良好的几何基础,提高了数值稳定性和训练效率。 * 数据复现方法:利用多目标优化中权重可变的特性,从单次CFD结果中衍生出多组不同权重下的训练数据,显著提升了样本效率。 * 基于参数化的叶片几何生成:采用特定的参数化方法,能够随机生成涵盖高压涡轮、低压涡轮、轴流压缩机、超音速冲动式涡轮等多种类型的宽范围叶片几何,确保了训练数据的多样性和模型的泛化能力。

四、 研究主要结果

  1. 几何质量最大化步骤结果:训练过程显示,演员网络的损失值随训练回合增加而上升并最终收敛,表明网络成功学会了为随机出现的新叶片构型生成更高质量网格的策略。该步骤产出的网格生成器能在不考虑流动的情况下,为后续步骤提供几何质量优异的初始网格。

  2. 最优性验证结果:为验证训练后网络的性能,研究选取了未经训练的具体叶片构型进行测试。以LS89高压涡轮叶片在两种流动条件下的测试为例,将本方法(单次尝试)的结果与针对该特定构型从头进行迭代优化(运行多次DRL探索)的结果进行对比。

    • 结果显示,无论权重偏向低成本还是低误差,本方法单次尝试获得的成本与误差值,均能达到迭代优化方法(平均超过1000次迭代后收敛)所获最优值的96%以上。在某些情况下(如侧重误差时),本方法甚至略优于只针对单一目标进行迭代优化的结果。这证明了经过广泛训练的神经网络不仅具有优异的泛化能力,而且其一次性解决方案的质量与针对特定案例进行大量迭代优化的结果相当。
  3. 对未见叶片构型的应用结果:研究展示了训练后的网络为多种未见过的叶片构型生成帕累托最优网格序列的能力。

    • LS89高压涡轮叶片:对于不同的测试工况,网络能生成一系列从稀疏(低成本、高误差)到稠密(高成本、低误差)的网格。生成的网格能有效捕捉边界层、激波等关键流动特征。与实验数据和其他高精度模拟结果的对比表明,在适当的权重下,本方法能以更低的计算成本获得吻合良好的叶片表面压力分布。
    • T106c低压涡轮叶片:测试了包含流动分离的工况。网络成功生成了能够解析分离区的网格。通过调整权重,可以控制网格在分离区附近的疏密程度。研究还比较了使用全湍流模型和转捩模型的情况,结果表明网络能适应不同的物理模型需求,生成相应的最优网格。
    • 通用性验证:网络能够为参数化方法生成的各种“非标准”叶片几何生成合理网格,证明了其强大的泛化能力。
  4. 结果逻辑关系:第一步获得的几何质量优化网络是第二步成功的基础,它确保了CFD模拟使用的网格具备良好的数值稳定性。第二步通过大规模并行CFD模拟获取的“成本-误差”数据,驱动网络学习分辨率参数与最终模拟精度/效率之间的复杂关系。最终的网络整合了这两个阶段的成果,实现了端到端的最优网格生成。

五、 研究结论与价值

本研究成功开发并验证了一种基于深度强化学习的、非迭代的自动网格生成框架,用于叶片通道的CFD模拟。该框架的主要结论和价值在于:

科学价值: * 方法论创新:将DRL,特别是单步演员-评论家算法、多智能体并行以及两阶段分解训练策略,创造性地应用于CFD前处理这一复杂优化问题,为自动化科学计算工作流提供了新的范式。 * 解决泛化挑战:证明了通过在大范围参数空间上进行训练,单个DRL策略能够泛化到大量未见的几何和流动条件,克服了传统优化方法案例专用的局限性。 * 实现多目标帕累托最优:框架天然地支持在模拟精度和计算成本之间进行权衡,能够一次性生成对应于不同用户偏好的帕累托最优解集。

应用价值: * 极大提升工程效率:对于涡轮机械设计等需要大量CFD评估的场景(如不确定性量化、设计优化),本方法可以避免每个新设计点所需的重复性、经验性的网格生成与收敛性研究,将人力与计算成本从“每次设计”转移为“一次训练,多次使用”,具有显著的摊销优势。 * 保障结果可靠性:减少了结果对工程师个人经验的依赖,通过算法保证网格在给定资源下的近似最优性,提高了CFD分析流程的标准化和可重复性。 * 为高阶应用铺路:生成的优质网格和对应的收敛解,可作为构建高精度代理模型、进行快速设计探索的可靠数据源。

六、 研究亮点

  1. 端到端自动化:实现了从输入几何/流动条件,到输出网格收敛的CFD结果的全流程自动化,无需任何人工迭代。
  2. 新颖的两阶段训练框架:巧妙地分解问题,先解决几何质量(无CFD成本),再解决分辨率(有CFD成本),极大降低了直接使用CFD训练高维策略的难度和开销。
  3. 高效的多智能体与数据复现策略:通过256个智能体并行运行CFD,并结合数据复现,有效解决了DRL训练中数据采集慢的核心瓶颈,使如此大规模的CFD训练成为可能。
  4. 优异的泛化与最优性性能:经广泛训练的单一策略网络,对未见过的叶片构型能生成与案例专用迭代优化相媲美的最优网格,证明了其强大的泛化能力和实用价值。
  5. 明确的工程应用导向:研究紧密结合涡轮机械CFD工业实践中的痛点,选择结构化HOH网格拓扑,并针对边界层、激波、分离等实际流动特征进行验证,确保了方法的实用性和相关性。

七、 其他有价值的讨论

研究也坦诚地指出了当前方法的局限性与未来方向: * 激波捕捉的限制:由于采用结构化网格拓扑,局部加密灵活性受限,对强激波的捕捉能力有天花板。论文建议未来可探索与局部加密技术相结合。 * 训练成本:虽然应用阶段高效,但初始训练需要约50万次RANS模拟,计算投入巨大。然而,这在设计空间探索、多工况分析等需要大量重复计算的场景中是可摊销的。研究也指出,对于更窄的参数范围,训练成本可降低。 * 扩展到三维的潜力:论文讨论了将方法扩展到三维的可行性,尽管动作和状态空间的维度会爆炸式增长,但可通过迁移学习、分层强化学习等先进DRL方法予以应对。

总而言之,这项研究是人工智能赋能传统科学计算领域的一个出色范例,为解决CFD中长期存在的网格生成瓶颈问题提供了具有变革潜力的自动化解决方案。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com