本文题为“A Contrastive Learning Framework Enhanced by Unlabeled Samples for Remaining Useful Life Prediction”,主要作者包括Ziqian Kong, Xiaohang Jin, Zhengguo Xu, 和Zian Chen,分别隶属于浙江大学工业控制技术国家重点实验室、浙江工业大学机械工程学院、宁海浙江工业大学科学技术研究院等研究机构。该研究发表于2023年《Reliability Engineering and System Safety》(Elsevier出版)的第234卷。
研究的主要目的是在工业设备剩余寿命(RUL, Remaining Useful Life)预测领域提出一种新的对比学习框架,用以处理工业实践中标记数据稀缺的难题,通过利用大量的无标记数据来增强深度学习模型的学习能力和预测性能。
RUL预测是智能维护管理(PHM, Prognostics and Health Management)领域的重要研究问题,其核心在于基于工业设备运行数据准确预测设备的剩余寿命,以便进行主动性维护,从而避免突发性故障及由此导致的经济损失。
传统的深度学习方法,如卷积神经网络(CNN, Convolutional Neural Network)和循环神经网络(RNN, Recurrent Neural Network),通常需要大量带标记的数据进行监督训练。然而,工业设备出于维护策略考虑,通常不会运行至完全失效,多数收集到的数据为缺乏标记信息的截断数据(Truncated Data)。这种标记数据的稀缺性极大地限制了深度学习模型的训练效果。因此,本研究的目标是提出一种能够充分利用无标记数据的框架,在标记数据不足的情况下提升RUL预测的准确性与鲁棒性。
为实现上述目标,作者提出了一种新颖的对比学习框架,通过结合标记和无标记的设备运行数据,增强深度学习模型的学习能力,并在航天发动机和滚动轴承的实验数据集上验证了该框架的效果。
本研究分为以下关键步骤:
考虑到无标记数据在工业场景中的普遍性,作者设计了一种创新的增强方法,对无标记数据中的样本对进行差值建模,生成伪标签赋予样本对。假设设备的最终失效时间未知,那么通过滑动时间窗口构建的样本对之间的时间差,即可用作伪标签。这种伪标签被定义为两个时间窗口的剩余寿命差值。增强方法不仅挖掘了无标记数据的退化信息,也极大扩展了用于模型训练的样本数量。
研究中提出的对比学习框架包含三大核心组成部分:
(a) Elastic Weight Consolidation (EWC)
为了避免模型在从无标记样本学习过程中遗忘标记样本中的已有知识,作者引入了EWC作为约束机制,通过正则化方式保持模型参数的稳定性,避免灾难性遗忘问题。
(b) 对比学习模块
对比学习的核心思想是通过预测样本对之间的伪标签,提取设备退化过程中的对比信息。模型同时输入样本对的特征,计算它们的预测剩余寿命差值,并与伪标签进行误差优化。
© Anchor Point(锚点约束)
为了解决对比学习中的RUL漂移问题(RUL Drift),框架将标记样本作为锚点,提供绝对值约束,与伪标签的相对值约束形成互补,从而显著提升模型的预测精度。
框架通过多目标损失函数(Multi-Objective Loss Function)综合考虑EWC、对比学习和锚点约束的效果,并结合反向传播算法不断优化模型参数。
本文分别在C-MAPSS 商用航空发动机数据集与XJTU-SY 滚动轴承数据集上验证了框架的泛化能力和适用性。
C-MAPSS数据集实验设计
C-MAPSS数据集包含4个子数据集(FD001至FD004),其中FD001与FD004数据分别具有较简单及复杂的操作条件。研究者模拟工业应用中的数据稀缺场景,随机选择很少数量的标记样本(1台发动机的生命周期数据),并引入不同数量的无标记样本(5、10及20台发动机的运行数据)用于增强模型的训练。性能指标采用均方根误差(RMSE, Root Mean Square Error)。
XJTU-SY 滚动轴承实验设计
XJTU-SY数据集包含15个滚动轴承的完整寿命振动数据。实验中选取1个轴承作为标记样本,1个作为测试集,其余3个轴承数据的标记信息被去除,并被用作无标记样本。对原始振动信号提取13种统计特征,并通过特征选择提取更具意义的子集用于模型训练。
实验表明:
(1) 提高了RUL预测精度
在C-MAPSS与XJTU-SY数据集的多任务实验中,随着无标记样本数量的增加(从5到20个),模型的RMSE均显著降低,表明对比学习框架可以有效利用无标记样本的信息来提升预测性能。以C-MAPSS的FD001子数据集为例,20个无标记样本下,RMSE从30.46减少到25.12。
(2) 对比学习缓解了标记数据稀缺问题
引入伪标签以及锚点约束后的对比学习框架极大扩展了样本总量,有效解决了标记数据不足导致的模型过拟合问题。
(3) LSTM在时序特征提取上的优势
结果显示,基于LSTM模型的框架(USL-LSTM)在时间序列数据(如振动信号)分析中相比CNN模型具有更高的预测鲁棒性和精度,RMSE普遍低于USL-CNN。
作者通过本研究提出的对比学习框架,成功展示了如何在缺乏标记数据的工业场景中,通过充分利用无标记数据的潜在信息提升深度学习模型在RUL预测任务中的性能。该方法不仅适用于航空发动机、滚动轴承等设备的数据分析,还具有广泛的泛化能力,适合多种复杂工业场景。
此外,研究提出的多目标损失函数与使用伪标签构建的无标记样本增强方法,展现了创新性与实用性,为工业智能维护管理提供了一项可行的解决方案。未来研究可进一步探讨如何更好平衡标记与无标记样本的信息权重,以及如何应用于更广泛的工业设备类型与使用场景。