本文由日本东北大学航空航天工程系的Yuto Iwasaki、Taku Nonomura、Kumi Nakai、Takayuki Nagata、Yuji Saito和Keisuke Asai共同完成,研究论文《Evaluation of optimization algorithms and noise robustness of sparsity-promoting dynamic mode decomposition》发表于期刊《IEEE Access》2022年7月21日网络版,并于2022年8月5日发布正式版本(DOI: 10.1109/ACCESS.2022.3193157)。本研究隶属于流体力学、数据分析和系统动力学交叉领域,主要聚焦于数据驱动模态分析方法的优化与评估。
一、 研究背景与目的
在实验流体力学和复杂系统分析中,从高维、含噪的时序数据中提取主导的相干结构(Coherent Structures)和动态模式至关重要。动态模态分解(Dynamic Mode Decomposition, DMD)作为一种强大的数据驱动工具,能够从数据中识别出与系统线性动力学相关的模态及其频率,广泛应用于流体不稳定性分析、周期性现象提取和系统辨识。然而,标准DMD方法产生的模态并非正交,且数量众多,如何从中自动、高效地选择出最能代表数据本质特征的少数关键模态,是一个组合优化难题。
为此,Jovanović等人提出了稀疏促进动态模态分解(Sparsity-Promoting DMD, DMDSP),通过引入稀疏惩罚项,在数据重构误差与模态数量之间进行权衡,自动选择稀疏的DMD模态。现有DMDSP主要有两种实现框架:基于系统演化的DMDSP(System-based DMDSP, SDMDSP)和基于观测数据的DMDSP(Observation-based DMDSP, ODMDSP)。前者由Jovanović等人提出,使用交替方向乘子法(Alternating Direction Method of Multipliers, ADMM)求解;后者由Ohmichi等人提出,使用贪心算法(Greedy Algorithm)求解。这两种方法在处理时间上相对较长,且它们在面对实验数据中不可避免的观测噪声和系统噪声时的鲁棒性尚未得到充分评估。
本研究旨在解决上述两个关键问题:第一,针对SDMDSP和ODMDSP,引入并评估更快的优化算法——快速迭代收缩阈值算法(Fast Iterative Shrinkage Thresholding Algorithm, FISTA),以提升计算效率;第二,系统评估SDMDSP和ODMDSP在不同噪声(观测噪声和系统噪声)条件下的鲁棒性,明确何种方法更适合处理含噪数据;第三,将性能更优的DMDSP方法应用于线性降阶模型(Linear Reduced-Order Model, LROM),以提升对后失速翼型绕流等复杂非定常流动的预测精度。
二、 研究流程与方法
本研究包含三个主要部分:三种优化算法的评估、DMDSP噪声鲁棒性评估,以及DMDSP在线性降阶模型中的应用。研究流程严谨,结合了理论分析、数值模拟和实验数据验证。
第一部分:三种优化算法的评估 1. 数据生成:研究首先生成了一个用于评估的人工数据矩阵X ∈ R^{1000×1001}。该数据矩阵模拟了湍流等复杂流动的特征,包含了200个幅值相近的特征值,这使得模态选择极具挑战性。研究共生成了100组不同的随机数据以消除随机数偏差,结果取平均值和标准差。 2. 数据处理流程:为避免过拟合,原始高维数据首先通过本征正交分解(Proper Orthogonal Decomposition, POD)进行降维。选择能量占比达到99%的主导POD模态,构成低维数据矩阵,然后对此低维数据应用DMD及相关算法。 3. 算法应用与比较:将FISTA、ADMM和贪心算法分别应用于SDMDSP和ODMDSP。对于FISTA和ADMM,通过调整正则化参数λ来控制所选模态的数量;对于贪心算法,则直接指定要选择的模态数量。为了公平比较,使用FISTA和ADMM得到的模态数量作为贪心算法的指定数量。 4. 评估指标:主要比较指标为处理时间和原始数据重构误差。原始数据重构误差衡量了使用所选DMD模态重构的数据与原始低维数据之间的差异(Frobenius范数)。
第二部分:DMDSP噪声鲁棒性评估 1. 含噪数据生成:为了模拟真实实验数据,研究构建了一个包含周期性成分和噪声的人工系统。该系统由状态方程和输出方程描述,包含三个共轭特征值对,用以模拟圆柱绕流或失速翼型绕流等流体现象。通过向系统中添加系统噪声(影响状态变量随时间累积的噪声)和观测噪声(影响输出数据、时间上不相关的噪声)来生成四类数据:无噪声原始数据、仅含观测噪声数据、仅含系统噪声数据、同时含观测和系统噪声数据。噪声强度通过参数n_v和n_w控制。 2. 分析流程:将SDMDSP和ODMDSP(均使用贪心算法)应用于上述含噪数据。评估指标为原始数据提取误差,即使用含噪数据选出的模态去重构无观测噪声的数据时产生的误差。这能够直接评估算法从噪声中提取真实信号的能力。研究分别从“基于系统”和“基于观测”两个角度计算了提取误差,并绘制了提取误差随所选模态数量的变化曲线。
第三部分:DMDSP在线性降阶模型中的应用 1. 实验数据:研究使用了来自先前风洞实验的时变速度场数据。实验对象为NACA0015翼型,在18度攻角(后失速状态)、雷诺数6.4×10^4条件下,采用粒子图像测速技术获取了10000个时间步长、空间分辨率为18706个向量点的高维数据。 2. 线性降阶模型构建:首先对训练数据应用POD,选取前100个POD模态进行降维。然后,分别基于SDMDSP和ODMDSP从POD模态的时间系数中提取稀疏的DMD模态。最后,利用选取的DMD模态及其特征值构建线性降阶模型,用于预测未来时刻的流动状态。 3. 模型精度评估:通过交叉验证方法评估模型预测精度。定义了一个基于一阶滞后系统误差概念的模型可预测时间范围,并将其无量纲化为η。通过改变训练集和测试集,计算不同数量DMD模态下η的平均值和标准差,以此比较SDMDSP-based LROM和ODMDSP-based LROM的预测性能。
三、 主要研究结果
1. 优化算法评估结果: * 处理时间:对于SDMDSP和ODMDSP,FISTA算法的处理时间均最短。SDMDSP结合FISTA的处理时间又显著短于ODMDSP结合FISTA。随着所选模态数量的增加,SDMDSP结合FISTA和贪心算法的处理时间增加,而结合ADMM的处理时间反而减少,这与迭代收敛条件受模态数量影响有关。 * 重构误差:三种优化算法(FISTA、ADMM、贪心算法)在SDMDSP和ODMDSP上得到的原始数据重构误差几乎没有差异。数值上,贪心算法的误差略低,这是由于优化策略不同所致(贪心算法是顺序优化,而FISTA和ADMM是联合优化)。 * 结论:综合考虑处理时间和重构误差,SDMDSP结合FISTA是最佳选择。贪心算法的优势在于可以直接指定所选模态的数量。
2. 噪声鲁棒性评估结果: * 无系统噪声系统:当系统噪声n_v=0时,SDMDSP和ODMDSP对观测噪声的鲁棒性相似。随着观测噪声n_w增大,两种方法准确提取原始数据所需的最小模态数减少(例如,n_w=0时需要6个模态对应6个周期成分;n_w=10^{-1}时仅需4个模态)。一个关键发现是,ODMDSP在基于观测的评估中,当选择的模态数超过最佳数量后,重构误差会显著上升,因为它会“忠实”地重构含噪数据本身,而不是去噪后的真实信号。而SDMDSP的误差在超过最佳模态数后趋于平缓。 * 小系统噪声系统:当系统噪声较小(n_v=10^{-6})时,SDMDSP和ODMDSP在不同观测噪声下的表现依然相似,没有显著差异。 * 大系统噪声系统:当系统噪声较大(n_v=10^{-4})时,在大多数观测噪声水平下,两种方法差异不大。然而,在观测噪声极大(n_w=10^{0}) 的情况下,ODMDSP在基于观测的评估中表现出了明显优于SDMDSP的鲁棒性,其原始数据提取误差更低。 * 总体结论:除了在系统噪声和观测噪声都很大的极端条件下ODMDSP更具优势外,SDMDSP和ODMDSP对噪声的鲁棒性基本相当。鉴于SDMDSP通常具有更短的处理时间,在大多数情况下推荐使用SDMDSP。
3. 在线性降阶模型中的应用结果: * 应用SDMDSP和ODMDSP从后失速翼型PIV数据中提取的相干结构不同,因此构建的LROM预测的流场和POD模态振幅也不同。 * 定量评估表明,当选择的DMD模态数量较少时,基于SDMDSP的LROM的预测精度(η值)高于基于ODMDSP的LROM。随着所选模态数量的增加,两种方法的预测精度趋于接近。 * 这表明,对于像后失速流动这样具有小观测噪声但高系统噪声特点的数据,SDMDSP提取的相干结构比ODMDSP提取的更适合用于构建线性降阶模型。
四、 研究结论与价值
本研究系统评估并优化了稀疏促进动态模态分解方法,主要得出以下结论: 1. 计算效率提升:将FISTA算法引入DMDSP优化问题,显著缩短了计算时间,使SDMDSP-FISTA成为在保证精度的前提下最快速的实现方案。 2. 噪声鲁棒性明晰:全面揭示了SDMDSP和ODMDSP在不同类型和强度噪声下的性能。两者对观测噪声的鲁棒性总体相似,但在系统噪声和观测噪声均极强的极端场景下,ODMDSP更具优势。这为处理不同质量实验数据时的算法选择提供了明确指导。 3. 工程应用验证:成功将DMDSP应用于从真实PIV数据构建流体降阶模型,并证明SDMDSP-based LROM对于后失速这类复杂非定常流动具有更高的短期预测精度,为基于数据的流动控制和状态估计提供了更有效的工具。
五、 研究亮点
六、 其他有价值内容
研究在附录中详细推导并对比了SDMDSP原有的和本研究提出的抛光算法。新算法通过仅计算被选中模态对应的矩阵块来求逆,避免了计算所有模态振幅再置零未被选中模态的冗余操作,降低了计算复杂度,且经数值验证与原有算法数学等价。这一优化虽属细节,但对提升大规模数据处理的效率有实际意义。