本论文的作者为郭冰鑫、谢昌俊(通讯作者)、张磊琪、李永佳、朱文超和魏鹏。其中,主要研究团队来自武汉理工大学自动化学院(School of Automation, Wuhan University of Technology),合作单位包括武汉理工大学国家工程师学院研究生院、国网浙江省电力有限公司电力科学研究院以及武汉理工大学汽车工程学院。该研究于2026年3月在线发表在*Journal of Cleaner Production*期刊上(Volume 551, 文章编号 147933)。
这项研究属于能源工程与人工智能交叉领域,具体聚焦于质子交换膜燃料电池(Proton Exchange Membrane Fuel Cell, PEMFC)的性能退化预测与健康管理。研究的学术背景源于全球能源转型和环境保护的迫切需求,PEMFC因其高效率、零排放等优点,被视为未来能源基础设施的关键一环,广泛应用于电力系统优化、热电联产、分布式发电网络及氢电混合铁路系统等领域。然而,PEMFC在长期运行中不可避免地会发生性能退化,其剩余使用寿命(Remaining Useful Life, RUL)的准确预测是降低维护成本、提高运行可靠性并加速商业化进程的关键挑战。传统的基于物理模型或混合模型的方法,由于PEMFC内部多物理场耦合的复杂性和降解机制的不完全性,面临巨大挑战。因此,数据驱动方法因其出色的可扩展性和泛化能力,成为解决PEMFC健康状态预测问题最具前景的途径之一。
尽管已有大量数据驱动研究,但现有方法大多存在三个主要局限:首先,多数模型仅采用单一电压时序信号作为输入,忽略了电流、温度、湿度、气体压力等多运行变量的耦合作用,这限制了模型在动态工况下的鲁棒性和预测准确性。其次,现有研究几乎完全依赖时域分析,而忽略了频域信息的重要价值。在动态负载循环条件下,水管理失衡和膜电极老化会共同改变高频欧姆特性和中低频传质特性,导致输出电压信号呈现出低频老化趋势与高频波动叠加的复合特征,纯粹的时域建模难以全面表征这一多尺度过程。最后,虽有少数研究尝试结合时频分析,但通常采用分解后预测的两阶段流程,导致计算复杂度随数据规模和维度快速增长,且缺乏一个能系统性地将多尺度频谱特征和频域先验知识嵌入深度学习模型的通用框架。因此,开发一种同时融合多变量和频域特征,兼顾预测精度与计算效率的退化建模方法,成为PEMFC健康预测领域的关键开放问题。
针对上述研究空白,本研究旨在提出一种创新的深度学习框架,以在动态负载工况下实现对PEMFC性能退化的精准点预测和可靠的区间估计。其核心目标是:1)利用多变量输入更全面地反映系统状态;2)通过时频分析(快速傅里叶变换FFT和离散小波变换DWT)提取与物理退化机制密切相关的多尺度频域特征;3)设计一种新颖的时频混合损失函数,在优化点预测的同时,实现对预测不确定性的量化;4)构建一个高效、统一的端到端神经网络模型,避免复杂的多阶段计算。
本研究的工作流程清晰,主要包括数据处理、特征选择、模型构建与训练、以及综合评估四个主要环节。
第一环节是数据处理与工况划分。 研究采用同济大学进行的长期动态耐久性测试公开数据集。该测试对一个单电池PEMFC执行了3076个动态负载循环,累计运行约1008小时。实验记录了包括电流、电压、阴阳极进出口温度与压力、露点温度、流量等在内的17个运行变量。为了聚焦关键退化阶段,研究者参考极化曲线特性,将九种负载电流水平划分为活化区、欧姆区和浓差区。本研究重点选取了位于欧姆区的三个代表性电流水平(I4, I5, I6)进行分析,因为这些工况更贴近实际稳定运行状态,能更好地反映典型的负载与退化动态。
第二环节是特征重要性分析与关键变量选择。 为了从17个初始变量中筛选出对电压退化预测最关键的特征,避免冗余噪声并提高模型效率,研究采用了随机森林(Random Forest)算法进行特征重要性评估。算法通过计算每个特征在决策树节点分裂时基尼不纯度(Gini Impurity)的减少量来量化其贡献度,并在所有树上进行平均和归一化,得到最终的特征重要性得分。结果显示,在三个电流水平下,重要性排名前五的特征高度一致,依次是:阳极端板温度(temp_anode_endplate)、功率(power)、阳极出口压力(pressure_anode_outlet)、阳极出口温度(temp_anode_outlet)和阴极出口温度(temp_cathode_outlet)。这五个特征的重要性之和高达0.94,表明它们在电压退化中起主导作用。因此,研究确定将这五个变量作为后续多变量预测模型的输入。
第三环节是核心模型FAMSnet的构建。 这是本研究方法论的创新核心。研究者提出了频率感知多尺度网络(Frequency-domain Aware Multi-scale Network, FAMSnet)。该模型采用并行架构处理经过筛选的关键时域特征:一路通过快速傅里叶变换(FFT)提取信号的全局周期性频谱特征,并选取幅度谱中前k个主导频率成分;另一路通过一级离散小波变换(DWT)将信号分解为低频近似系数和高频细节系数,分别对应长时退化趋势和短时动态波动。随后,将FFT和DWT提取的频域特征张量沿频率维度拼接,形成一个统一的多尺度频域表征。为了从这个三维张量(时间×特征×频率)中提取更深层的时空耦合信息,模型引入了一个二维卷积层,将时间和特征维度视为一个平面,频率维度作为通道,通过卷积核滑动捕捉时间与特征间的局部相关性。最后,模型设计了一个自适应聚合模块:首先对每个频率通道的特征图进行全局池化,得到每个通道的重要性标量,再通过Softmax函数归一化为权重向量,最后对各个频率通道的特征进行加权求和。这种机制使得模型能够动态关注与退化最相关的频带(如低频段)。融合后的多尺度频域信息经由全连接层输出最终的电压点预测值。
第四环节是时频混合损失函数的设计与模型训练。 为了进一步提升模型的预测能力和不确定性建模水平,本研究创造性地提出了时频混合损失函数(Time-Frequency Hybrid Loss, TFHL)。该损失函数由两部分构成:1)时域分位数损失(Quantile Loss):通过同时优化多个分位数(如0.025, 0.5, 0.975)对应的输出,模型不仅能给出中位数(τ=0.5)作为稳健的点预测,还能直接生成相应的预测区间(如95%置信区间)。分位数损失使用“Pinball”损失函数,对正负误差给予不对称的惩罚。2)频域傅里叶损失(Fourier Loss):将模型的中位数预测值和真实值分别进行FFT,计算两者频谱的实部和虚部之间的L1范数误差。这个损失项从频域角度约束模型,使其预测结果在频谱结构上与真实退化过程保持一致,尤其关注对低频退化趋势的捕捉。最终的总损失是两者加权和(λ=1)。TFHL使得模型训练过程同时受到时域精度和频域一致性的双重约束。
第五环节是模型性能的综合评估与分析。 研究设计了一系列严谨的实验来验证所提方法的优越性。评估模式包括单步预测和直接多步预测。对比的基线模型涵盖了主流的深度学习架构,如LSTM、TCN、CNN和Transformer。评估指标既有点预测精度指标(MAE, RMSE, MAPE),也有区间预测可靠性指标(预测区间覆盖概率PICP和平均预测区间宽度MPIW)。此外,研究还进行了多项深入分析:1)不同训练数据长度下的鲁棒性分析,测试模型在数据有限时的表现;2)不同输入特征策略的对比,比较仅用电压、使用全部特征、使用RF筛选特征三种策略的效果;3)FAMSnet架构有效性分析,与基线模型进行精度对比,并可视化自适应聚合权重以解释其关注点;4)TFHL损失函数的泛化性分析,将TFHL应用于各基线模型,评估其对点预测和区间预测的提升效果;5)计算效率分析,比较各模型的参数量、训练和推理时间;6)多步预测性能与适用性分析,测试模型在5、10、20、50步长预测下的表现,并与ESN、SVM、ANN、Informer-GPR等现有方法对比。
研究取得了多项显著成果。在点预测精度方面,FAMSnet模型在三种动态工况(I4, I5, I6)下均取得了最佳性能。相较于LSTM、TCN、CNN和Transformer等主流模型,其平均MAE降低了29.23%至48.86%,平均RMSE降低了31.49%至48.86%。这表明FAMSnet通过时频多尺度特征提取和自适应融合,显著增强了对PEMFC复杂退化动态的表征能力。可视化分析显示,模型的自适应权重分配明显倾向于低频的FFT成分和DWT近似系数,这与PEMFC退化主要由低频动态响应的物理机制相符,说明模型能有效聚焦于与长期退化和传质过程相关的关键频带。
在不确定性量化与区间预测方面,结合了TFHL的FAMSnet模型展现出卓越的性能。其生成的95%预测区间在三种工况下均保持了接近理论值(95%)的高覆盖概率(PICP在94.88%至95.33%之间),同时平均预测区间宽度(MPIW)最窄。特别是在波动较大的I6工况下,FAMSnet-TFHL的MPIW(0.005795)远低于其他模型,实现了“高覆盖、窄区间”的理想特性。这表明该模型不仅能提供准确的点估计,还能可靠地评估预测的不确定性,对于风险预警和决策支持至关重要。
TFHL损失函数被证明具有出色的泛化能力。当将其集成到LSTM、TCN、CNN、Transformer等基线模型中时,所有模型的点预测误差(MAE, RMSE)均得到一致降低。其中,与FAMSnet的结合产生了最强的协同效应,在I6工况下MAE和RMSE降低率分别高达42.65%和39.9%。这验证了TFHL通过引入频域约束来引导模型学习退化内在模式的有效性。
在多步长预测任务中,FAMSnet-TFHL同样表现优异。随着预测步长从5增加到50,其预测误差虽如预期般增长,但增长斜率最小,且在50步长预测时,其RMSE(0.0067-0.0073)显著优于对比的ESN、SVM、ANN及先进的Informer-GPR模型(平均降低25.18%)。更重要的是,其预测区间宽度能自适应地随步长增加而合理扩大,同时保持高覆盖概率,证明了模型对长期预测中不确定性累积的准确感知和量化能力。
在计算效率方面,尽管FAMSnet引入了FFT/DWT等运算,但其可训练参数量(33,318)远少于Transformer,训练和推理时间仍在可接受范围内(单批次推理约4毫秒)。集成TFHL带来的额外计算开销很小(推理时间增加约2.2%),性能提升的回报率很高。
本研究的结论明确而有力。研究成功提出并验证了一种名为FAMSnet-TFhl的新型时频协作多尺度神经网络框架,用于动态运行条件下PEMFC的性能退化预测与区间估计。该框架通过随机森林筛选关键运行变量,利用FFT和DWT进行多尺度频域分解,并通过二维卷积和自适应聚合机制高效融合特征。所设计的时频混合损失函数创新性地结合了时域分位数回归和频域傅里叶约束,使模型能够同时提供高精度的点预测和可靠的预测区间。大量实验证明,该方法在点预测精度、区间估计可靠性、对不同训练数据量的鲁棒性、多步长预测能力以及计算效率等方面,均优于现有的主流方法。
该研究的科学价值在于,它首次系统地构建了一个融合多变量、多尺度时频特征和双约束损失函数的端到端PEMFC退化预测框架,为数据驱动的燃料电池健康管理开辟了一条新的技术路径。其提出的频域感知和时频混合优化的思想,对处理其他具有多尺度动态特性的复杂系统(如锂电池、轴承等)的退化预测问题也具有重要的借鉴意义。在应用价值方面,该模型能够为PEMFC系统的在线健康监测、剩余使用寿命预测、维护策略优化以及运行风险预警提供强大、可靠的工具,有助于降低系统全生命周期成本,提高其运行安全性与经济性,从而加速氢能技术的商业化应用进程。
本研究的亮点突出体现在以下几个方面:1)方法论创新:提出了全新的频率感知多尺度网络(FAMSnet)和时频混合损失函数(TFHL),将频域分析深度整合到深度学习框架中。2)物理机理结合:模型设计紧密联系PEMFC水管理失衡、欧姆损失、传质限制等物理退化机制在频域的表现,增强了模型的可解释性。3)性能全面领先:在点预测精度和不确定性区间估计质量上均实现了对现有主流方法的显著超越。4)强大的泛化与鲁棒性:TFHL能普遍提升不同基線模型的性能;FAMSnet在数据量有限、工况变化和多步长预测等挑战性场景下均表现稳定。5)工程实用性:模型兼顾了高性能与可接受的计算开销,具备在线部署的潜力。这些亮点共同构成了本研究对PEMFC prognostics领域乃至更广泛的 prognostics and health management(PHM)领域的重要贡献。