分享自:

基于LLM的两阶段框架在部分信息下旋转机械可靠性评估中的应用

期刊:reliability engineering and system safetyDOI:10.1016/j.ress.2024.110312

这篇文档属于类型a,即单篇原创研究的学术报告。以下是对该研究的详细介绍:

主要作者及研究机构

本研究的主要作者包括Zhendong Pang、Yingxin Luan、Jiahong Chen和Teng Li。他们分别来自山东大学控制科学与工程学院(School of Control Science and Engineering, Shandong University)和不列颠哥伦比亚大学机械工程系(Department of Mechanical Engineering, University of British Columbia)。该研究发表于2024年的期刊《Reliability Engineering and System Safety》(第250卷,第110312页)。

学术背景

本研究的主要科学领域是旋转机械的可靠性评估(reliability assessment of rotating machine)。旋转机械(如电动机、发电机等)在工业设备中扮演着至关重要的角色,其核心部件(如轴承和齿轮)由于不同的操作条件、长时间负载及其他外部因素,存在较高的故障风险。传统的可靠性评估方法依赖于大量标注数据,但在实际应用中,获取完整的故障信息及大量标注数据往往不可行。因此,如何在部分信息(partial information)条件下进行有效的可靠性评估成为一个关键问题。

近年来,大语言模型(Large Language Models, LLMs)在自然语言处理领域表现出色,尤其是在处理序列数据方面。受此启发,本研究探索了在部分信息条件下使用LLM进行旋转机械可靠性评估的可行性。研究的主要目标是提出一种基于LLM的两阶段框架,通过自监督学习(self-supervised learning)和弱监督学习(weakly supervised learning)来提升在有限标注数据条件下的可靠性评估性能。

研究流程

本研究提出了一个名为ParInfoGPT的两阶段框架,具体流程如下:

第一阶段:自监督重建(Self-Supervised Reconstruction Stage)

  1. 数据预处理:将未标注的时间序列数据切割成多个时间片段(patches),并通过基于互信息(Mutual Information, MI)的信息掩码策略(informative masking strategy)选择最具信息量的片段进行掩码处理。
  2. 特征提取与重建:将掩码后的时间序列输入到改进的GPT-2模型中,通过多层Transformer块提取关键特征,并使用重建头(reconstruction head)将特征映射回原始时间序列。该阶段的目标是通过自监督学习最小化重建时间序列与原始时间序列之间的差异。
  3. 损失函数:使用均方误差(Mean Squared Error, MSE)作为重建阶段的损失函数,衡量重建时间序列与原始时间序列之间的差异。

第二阶段:弱监督分类(Weakly Supervised Classification Stage)

  1. 数据预处理:将少量标注的时间序列数据切割成时间片段,但不进行掩码处理。
  2. 特征提取与分类:将时间片段输入到GPT编码器和并行侧适配器(Parallel Side-Adapter, PSA)中,提取特征表示,并使用分类头(classification head)推断故障类型。该阶段的目标是通过弱监督学习最小化预测故障类型与标注故障类型之间的差异。
  3. 损失函数:使用交叉熵(Cross Entropy, CE)作为分类阶段的损失函数,衡量预测故障类型与真实标签之间的差异。

主要结果

本研究在两个公开的旋转机械数据集(风电机组轴承数据集WTB和东南大学齿轮箱数据集SU)上进行了系统实验,结果表明: 1. WTB数据集:ParInfoGPT在四个不同操作条件下的评估准确率均优于其他基准模型,最高提升了40.7%的准确率。 2. SU数据集:ParInfoGPT在两个操作条件下的评估准确率均优于其他基准模型,最高提升了38%的准确率。 3. 有限标注数据条件下的性能:即使在每个类型仅有2个标注样本的极端情况下,ParInfoGPT仍然能够保持较高的评估准确率(WTB数据集为46%,SU数据集为80%),显著优于其他模型。

结论

本研究提出的ParInfoGPT框架在部分信息条件下实现了旋转机械的可靠性评估,具有以下科学价值和应用价值: 1. 科学价值:首次将大语言模型引入旋转机械的可靠性评估领域,证明了LLM在处理时间序列数据方面的潜力。 2. 应用价值:在工业设备维护中,ParInfoGPT能够在有限的标注数据条件下提供准确的故障诊断,降低了数据标注的成本和难度。

研究亮点

  1. 两阶段框架:通过自监督重建和弱监督分类两阶段框架,充分利用了未标注数据和少量标注数据,提升了模型的性能。
  2. 基于互信息的信息掩码策略:通过选择最具信息量的时间片段进行掩码处理,增强了模型对关键特征的提取能力。
  3. 并行侧适配器(PSA):通过设计轻量级的并行侧适配器,有效减少了模型的参数量,避免了过拟合问题。

其他有价值的内容

本研究还进行了详细的消融实验,验证了各组件(如PSA、MI掩码策略等)对模型性能的贡献。此外,研究还对关键模型参数(如掩码比例、PSA维度等)进行了优化,进一步提升了模型的性能。

本研究通过创新的两阶段框架和基于LLM的方法,成功解决了在部分信息条件下旋转机械可靠性评估的难题,为工业设备的故障诊断提供了新的解决方案。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com