基于CNN-BiGRU和AM模型的轴承故障诊断新方法

分享自：
基于CNN-BiGRU和AM模型的轴承故障诊断新方法

人工智能
信息科学
工程学
机械
计算机科学
期刊:journal of mechanical science and technologyDOI:10.1007/s12206-024-0610-2
【点击此处】阅读全文、收藏及针对性提问
学术研究报告：基于CNN-BiGRU与注意力机制的轴承故障诊断新方法
一、研究团队与发表信息
 本研究的通讯作者为电子科技大学机械与电气工程学院的Hong-zhong Huang教授（邮箱：hzhuang@uestc.edu.cn），第一作者为Ziwei Xu。合作者包括Yan-feng Li、Zhiming Deng和Zixing Huang，均来自电子科技大学系统可靠性与安全性研究中心。研究成果发表于《Journal of Mechanical Science and Technology》2024年第38卷第7期（页码3361~3369），DOI号为10.1007/s12206-024-0610-2。
二、学术背景与研究目标
 轴承是机械设备的核心部件，其故障（如点蚀、磨损等）可能导致严重事故。传统故障诊断方法分为模型驱动（依赖专家经验）和数据驱动（如深度学习）两类，但现有方法常忽略空间与时间特征的权重分配，且未系统评估数据预处理（如快速傅里叶变换FFT）和注意力机制（Attention Mechanism, AM）位置对诊断效果的影响。
本研究提出了一种创新方法，结合卷积神经网络（CNN）、双向门控循环单元（BiGRU）和注意力机制（AM），旨在解决以下问题：
 1. 如何通过AM动态分配空间与时间特征的权重；
 2. 是否使用FFT预处理数据对诊断结果的影响；
 3. AM在特征提取中的最佳位置（CNN-AM-BiGRU或CNN-BiGRU-AM）。
三、研究流程与方法
 1. 模型架构设计
 - CNN模块：通过1D卷积层（卷积核大小3，步长1）提取轴承振动信号的局部空间特征，采用ReLU激活函数，并加入批归一化（BatchNorm）和最大池化层降维。
 - BiGRU模块：双向结构捕捉时间序列的前后依赖关系，隐藏层单元数为64，输出128维特征（双向拼接）。
 - 注意力机制（AM）：采用软注意力（Soft Attention），通过权重系数优化特征重要性，公式包括注意力分布值计算（式1）、权重归一化（式2）和加权输出（式3）。
实验设置
数据集：
 CWRU轴承数据集：包含正常、驱动端和风扇端故障数据，故障类型涵盖内圈、外圈和滚珠损伤，故障尺寸为7~28 mil（1 mil=0.0254 mm），采样频率12 kHz/48 kHz，负载0~3 hp。
 
XJTU-SY数据集：采样频率25.6 kHz，振动信号超过正常值10倍时判定为完全失效。
 
预处理：对比FFT预处理与未处理数据，采用Z-score标准化。
 
模型变体：测试CNN-AM-BiGRU、CNN-BiGRU、CNN-BiGRU-AM三种结构，迭代50次，优化器为Adam（学习率0.001）。
 
数据分析
评估指标：训练与测试阶段的损失收敛曲线、不确定性值（Uncertainty Values）和概率值（Probability Values）。
 
对比实验：与现有方法（如CNN-AM-BiLSTM、CNN-BiLSTM）计算效率对比。
 
四、主要结果
 1. 模型性能
 - CNN-AM-BiGRU表现最优：在CWRU数据集（无FFT预处理）中，训练和测试概率值分别达0.989和0.988（表6），显著高于其他变体。
 - FFT预处理的影响：
 - CNN-BiGRU-AM在无FFT时效果更佳（CWRU测试概率值0.972）；
 - CNN-AM-BiGRU和CNN-BiGRU需FFT支持（XJTU-SY测试概率值0.941 vs. 0.908）。
 - 计算效率：CNN-AM-BiGRU耗时仅37.744秒（表7），优于对比方法。
不确定性分析
随着迭代次数增加，不确定性值收敛至零（图5-7），验证了模型的稳定性。
 
FFT预处理可降低CNN-BiGRU的不确定性（XJTU-SY数据集从0.7~0.8降至0.2~0.3）。
 
AM位置的影响
CNN-AM-BiGRU（AM作用于CNN特征后）优于CNN-BiGRU-AM（AM作用于BiGRU输出），表明空间特征权重的分配比时间特征更关键。
 
五、结论与价值
 1. 科学价值
 - 提出了一种融合CNN-BiGRU-AM的端到端故障诊断框架，首次系统评估了FFT预处理与AM位置的影响。
 - 通过软注意力机制动态优化特征权重，提升了模型对关键特征的敏感性。
应用价值
 为工业轴承故障诊断提供了高效解决方案，尤其适用于高噪声、变工况场景。
 
方法计算成本低（表7），适合实时监测系统部署。
 
六、研究亮点
 1. 方法创新：首次将AM嵌入CNN-BiGRU架构，并对比不同AM位置的性能差异。
 2. 数据驱动：通过多数据集（CWRU、XJTU-SY）验证了模型的泛化能力。
 3. 工程指导性：明确了FFT预处理的适用场景（依赖模型类型），为实际应用提供决策依据。
七、其他价值
 作者指出未来可研究方向：
 1. 解决类别不平衡问题（正常样本远多于故障样本）；
 2. 增强深度学习模型的可解释性，例如通过特征可视化分析AM的注意力分布。
资助信息：本研究得到国家科技重大专项（编号J2019-IV-0004-0071）支持。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问