学术研究报告:基于CNN-BiGRU与注意力机制的轴承故障诊断新方法
一、研究团队与发表信息
本研究的通讯作者为电子科技大学机械与电气工程学院的Hong-zhong Huang教授(邮箱:hzhuang@uestc.edu.cn),第一作者为Ziwei Xu。合作者包括Yan-feng Li、Zhiming Deng和Zixing Huang,均来自电子科技大学系统可靠性与安全性研究中心。研究成果发表于《Journal of Mechanical Science and Technology》2024年第38卷第7期(页码3361~3369),DOI号为10.1007/s12206-024-0610-2。
二、学术背景与研究目标
轴承是机械设备的核心部件,其故障(如点蚀、磨损等)可能导致严重事故。传统故障诊断方法分为模型驱动(依赖专家经验)和数据驱动(如深度学习)两类,但现有方法常忽略空间与时间特征的权重分配,且未系统评估数据预处理(如快速傅里叶变换FFT)和注意力机制(Attention Mechanism, AM)位置对诊断效果的影响。
本研究提出了一种创新方法,结合卷积神经网络(CNN)、双向门控循环单元(BiGRU)和注意力机制(AM),旨在解决以下问题:
1. 如何通过AM动态分配空间与时间特征的权重;
2. 是否使用FFT预处理数据对诊断结果的影响;
3. AM在特征提取中的最佳位置(CNN-AM-BiGRU或CNN-BiGRU-AM)。
三、研究流程与方法
1. 模型架构设计
- CNN模块:通过1D卷积层(卷积核大小3,步长1)提取轴承振动信号的局部空间特征,采用ReLU激活函数,并加入批归一化(BatchNorm)和最大池化层降维。
- BiGRU模块:双向结构捕捉时间序列的前后依赖关系,隐藏层单元数为64,输出128维特征(双向拼接)。
- 注意力机制(AM):采用软注意力(Soft Attention),通过权重系数优化特征重要性,公式包括注意力分布值计算(式1)、权重归一化(式2)和加权输出(式3)。
实验设置
数据分析
四、主要结果
1. 模型性能
- CNN-AM-BiGRU表现最优:在CWRU数据集(无FFT预处理)中,训练和测试概率值分别达0.989和0.988(表6),显著高于其他变体。
- FFT预处理的影响:
- CNN-BiGRU-AM在无FFT时效果更佳(CWRU测试概率值0.972);
- CNN-AM-BiGRU和CNN-BiGRU需FFT支持(XJTU-SY测试概率值0.941 vs. 0.908)。
- 计算效率:CNN-AM-BiGRU耗时仅37.744秒(表7),优于对比方法。
不确定性分析
AM位置的影响
五、结论与价值
1. 科学价值
- 提出了一种融合CNN-BiGRU-AM的端到端故障诊断框架,首次系统评估了FFT预处理与AM位置的影响。
- 通过软注意力机制动态优化特征权重,提升了模型对关键特征的敏感性。
六、研究亮点
1. 方法创新:首次将AM嵌入CNN-BiGRU架构,并对比不同AM位置的性能差异。
2. 数据驱动:通过多数据集(CWRU、XJTU-SY)验证了模型的泛化能力。
3. 工程指导性:明确了FFT预处理的适用场景(依赖模型类型),为实际应用提供决策依据。
七、其他价值
作者指出未来可研究方向:
1. 解决类别不平衡问题(正常样本远多于故障样本);
2. 增强深度学习模型的可解释性,例如通过特征可视化分析AM的注意力分布。
资助信息:本研究得到国家科技重大专项(编号J2019-IV-0004-0071)支持。