分享自:

基于CNN-BiGRU和AM模型的轴承故障诊断新方法

期刊:journal of mechanical science and technologyDOI:10.1007/s12206-024-0610-2

学术研究报告:基于CNN-BiGRU与注意力机制的轴承故障诊断新方法

一、研究团队与发表信息
本研究的通讯作者为电子科技大学机械与电气工程学院的Hong-zhong Huang教授(邮箱:hzhuang@uestc.edu.cn),第一作者为Ziwei Xu。合作者包括Yan-feng Li、Zhiming Deng和Zixing Huang,均来自电子科技大学系统可靠性与安全性研究中心。研究成果发表于《Journal of Mechanical Science and Technology》2024年第38卷第7期(页码3361~3369),DOI号为10.1007/s12206-024-0610-2。

二、学术背景与研究目标
轴承是机械设备的核心部件,其故障(如点蚀、磨损等)可能导致严重事故。传统故障诊断方法分为模型驱动(依赖专家经验)和数据驱动(如深度学习)两类,但现有方法常忽略空间与时间特征的权重分配,且未系统评估数据预处理(如快速傅里叶变换FFT)和注意力机制(Attention Mechanism, AM)位置对诊断效果的影响。

本研究提出了一种创新方法,结合卷积神经网络(CNN)、双向门控循环单元(BiGRU)和注意力机制(AM),旨在解决以下问题:
1. 如何通过AM动态分配空间与时间特征的权重;
2. 是否使用FFT预处理数据对诊断结果的影响;
3. AM在特征提取中的最佳位置(CNN-AM-BiGRU或CNN-BiGRU-AM)。

三、研究流程与方法
1. 模型架构设计
- CNN模块:通过1D卷积层(卷积核大小3,步长1)提取轴承振动信号的局部空间特征,采用ReLU激活函数,并加入批归一化(BatchNorm)和最大池化层降维。
- BiGRU模块:双向结构捕捉时间序列的前后依赖关系,隐藏层单元数为64,输出128维特征(双向拼接)。
- 注意力机制(AM):采用软注意力(Soft Attention),通过权重系数优化特征重要性,公式包括注意力分布值计算(式1)、权重归一化(式2)和加权输出(式3)。

  1. 实验设置

    • 数据集
      • CWRU轴承数据集:包含正常、驱动端和风扇端故障数据,故障类型涵盖内圈、外圈和滚珠损伤,故障尺寸为7~28 mil(1 mil=0.0254 mm),采样频率12 kHz/48 kHz,负载0~3 hp。
      • XJTU-SY数据集:采样频率25.6 kHz,振动信号超过正常值10倍时判定为完全失效。
    • 预处理:对比FFT预处理与未处理数据,采用Z-score标准化。
    • 模型变体:测试CNN-AM-BiGRU、CNN-BiGRU、CNN-BiGRU-AM三种结构,迭代50次,优化器为Adam(学习率0.001)。
  2. 数据分析

    • 评估指标:训练与测试阶段的损失收敛曲线、不确定性值(Uncertainty Values)和概率值(Probability Values)。
    • 对比实验:与现有方法(如CNN-AM-BiLSTM、CNN-BiLSTM)计算效率对比。

四、主要结果
1. 模型性能
- CNN-AM-BiGRU表现最优:在CWRU数据集(无FFT预处理)中,训练和测试概率值分别达0.989和0.988(表6),显著高于其他变体。
- FFT预处理的影响
- CNN-BiGRU-AM在无FFT时效果更佳(CWRU测试概率值0.972);
- CNN-AM-BiGRU和CNN-BiGRU需FFT支持(XJTU-SY测试概率值0.941 vs. 0.908)。
- 计算效率:CNN-AM-BiGRU耗时仅37.744秒(表7),优于对比方法。

  1. 不确定性分析

    • 随着迭代次数增加,不确定性值收敛至零(图5-7),验证了模型的稳定性。
    • FFT预处理可降低CNN-BiGRU的不确定性(XJTU-SY数据集从0.7~0.8降至0.2~0.3)。
  2. AM位置的影响

    • CNN-AM-BiGRU(AM作用于CNN特征后)优于CNN-BiGRU-AM(AM作用于BiGRU输出),表明空间特征权重的分配比时间特征更关键。

五、结论与价值
1. 科学价值
- 提出了一种融合CNN-BiGRU-AM的端到端故障诊断框架,首次系统评估了FFT预处理与AM位置的影响。
- 通过软注意力机制动态优化特征权重,提升了模型对关键特征的敏感性。

  1. 应用价值
    • 为工业轴承故障诊断提供了高效解决方案,尤其适用于高噪声、变工况场景。
    • 方法计算成本低(表7),适合实时监测系统部署。

六、研究亮点
1. 方法创新:首次将AM嵌入CNN-BiGRU架构,并对比不同AM位置的性能差异。
2. 数据驱动:通过多数据集(CWRU、XJTU-SY)验证了模型的泛化能力。
3. 工程指导性:明确了FFT预处理的适用场景(依赖模型类型),为实际应用提供决策依据。

七、其他价值
作者指出未来可研究方向:
1. 解决类别不平衡问题(正常样本远多于故障样本);
2. 增强深度学习模型的可解释性,例如通过特征可视化分析AM的注意力分布。

资助信息:本研究得到国家科技重大专项(编号J2019-IV-0004-0071)支持。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com