分享自:

基于联合机制的判别式故障诊断迁移学习网络

期刊:Scientific ReportsDOI:10.1038/s41598-025-93996-1

面向旋转机械故障诊断的联合机制下判别式迁移学习网络研究学术报告

第一作者及研究机构

本研究的共同第一作者为来自中国东北林业大学(Northeast Forestry University)机电工程学院的Yang Yuxuan、Jing Jiarui、Zhang Jian和Liu Ziyu,以及清华大学机械工程系的Li Xueyi教授(通讯作者)。该研究成果2025年发表在Scientific Reports期刊(卷15,文章号8888)。

学术背景与研究意义

该研究属于机械故障诊断与人工智能交叉领域,聚焦于旋转机械(如轴承、齿轮)在无监督条件下的跨工况故障诊断难题。旋转机械作为现代工业核心组件,其可靠性直接影响生产安全与经济效益。传统故障诊断方法依赖技术人员经验,存在主观性强、效率低下的局限。虽然基于深度学习的诊断方法显示出潜力,但面临两个本质挑战:不同工况下振动信号分布差异导致的领域偏移(domain shift)问题,以及大规模标注数据获取成本高昂的问题。

研究团队针对现有方法的四个关键缺陷展开攻关:(1)传统CNN对振动信号上下文感知不足;(2)现有迁移方法仅关注特征映射或对抗策略的单一层面;(3)联合分布方法存在领域混淆管理困难;(4)诊断方法忽视判别性特征学习的重要性。为此,本研究提出集成SE注意力机制(Squeeze-and-Excitation attention mechanism)、改进分布对齐框架和条件对抗网络的创新解决方案,旨在实现不同工况下的高精度知识迁移。

研究方法与工作流程

1. 网络架构设计

研究团队构建了名为IADTLN的创新网络架构,其核心技术组成包括: 1. 特征提取模块:采用四层1D-CNN作为主干网络,每层包含卷积层、批量归一化(BN)和ReLU激活函数。特别在首层后嵌入SE注意力机制,通过压缩-激励-重加权三阶段动态调整通道特征响应。该机制首先通过全局平均 pooling生成通道描述符(公式6),再经两层全连接网络(公式7)计算通道权重,最终实现特征重校准(公式8)。

  1. 判别特征学习模块:提出改进的I-softmax损失函数(公式9),相比传统softmax引入灵活决策边界参数x和y。如图2所示,当特征向量f_i©>0时采用ef_i©/y-x的变换,否则使用eyf_i©-x变换,通过增强类间分离度提升特征判别性。

  2. 领域适配模块:创新性地整合两种策略:

    • 集成分布对齐框架(IDAF):联合局部最大均值差异(JMMD)和相关性对齐(CORAL)方法。JMMD通过希尔伯特空间表征联合分布(公式5),CORAL对齐二阶统计量(公式1-3),二者加权构成复合度量(公式11-12)。
    • 条件对抗网络(CDAN+E):在传统DANN基础上引入特征-预测外积操作(⊗)构建条件判别器(公式14),并集成熵感知权重(公式15)改进对抗训练(公式16)。

2. 实验验证方案

研究采用三组工业数据集系统验证方法有效性:

  1. CWRU轴承数据集:包含四种故障状态(正常、内圈、滚珠、外圈故障),在四种转速(1797/1772/1750/1730 r/min)下采集振动信号,构成6种迁移场景(如G1→G2表示1797→1772r/min迁移)。

  2. NEFU齿轮数据集:包含六类故障(剥落、磨损、点蚀、断齿、裂纹、正常),在三组转速(900/1200/1500 rpm)下采集,建立6种迁移任务。

  3. JNU补充数据集:包含N205/NU205轴承在不同转速(600/800/1000 r/min)下的故障数据,用于验证跨设备泛化能力。

实验设计包含消融实验对比实验两类: - 消融实验分别去除SE、I-softmax、IDAF、CDAN+E模块,验证各组件贡献(表4-5)。 - 对比实验涵盖10种基线方法,包括CORAL、JMMD、DANN、CDAN等代表性算法(表6-8)。

核心研究成果

1. 消融实验结果

在CWRU数据集的G3→G1迁移任务中: - 完整模型准确率达94.64%,显著高于缺失任一模块的情况(缺失IDAF时仅47.10%)。 - SE模块提升特征选择性,使准确率提高5.78个百分点; - I-softmax相比传统softmax带来6.54个百分点的提升。

在更具挑战性的NEFU数据集H3→H1任务中: - 完整模型准确率96.12%,而基线方法(如Method 1)出现负迁移(65.43%<基线75%)。 - 熵条件对抗策略(CDAN+E)对复杂齿轮故障的适应性尤为突出。

2. 跨数据集性能比较

在全部18个迁移任务中,IADTLN的平均准确率超过96%,较次优方法(Method 8)提升2.3个百分点。特别是在JNU数据集的J3→J1任务中,面对未知设备(NU205→N205)的迁移仍保持92.16%的准确率(图7-10的混淆矩阵显示各类别误判均衡)。

3. 可视化分析

t-SNE降维显示(图8,10): - 传统方法特征空间存在明显领域偏移和类别重叠。 - IADTLN学习到的特征呈现清晰的类内聚集和类间分离,证实其双重对齐(特征分布+类别判别)的有效性。

研究结论与价值

本研究通过有机整合注意力机制、判别性学习和对抗迁移,确立了旋转机械无监督故障诊断的新范式。其科学价值体现在三方面: 1. 方法学创新:首次将SE注意力与改进softmax损失结合用于振动信号处理;提出IDAF框架统一统计矩匹配与核空间度量。 2. 工程适用性:在标注数据稀缺的现实工业场景下,实现平均96%以上的跨工况诊断准确率。 3. 理论启示:证实熵条件对抗训练能有效缓解负迁移,为领域自适应提供新思路。

研究亮点

  1. 多模态特征学习:SE模块实现通道级特征优化,I-softmax增强角空间判别力,构成层次化特征学习体系。
  2. 混合对齐策略:IDAF从均值(JMMD)和协方差(CORAL)双视角减小领域差异,数学推导显示其等价于最小化再生核希尔伯特空间中的复合距离(公式13)。
  3. 动态训练机制:β_jmmd参数随epoch动态调整(公式20-21),平衡对齐强度与分类性能。

未来展望

作者指出当前工作限于单一振动信号分析,下一步将融合声发射、温度等多传感器数据。此外,提出的框架可扩展至其他时序故障诊断场景,如电力变压器、液压系统等,这需要针对特定信号的网络结构调整与超参数优化。该研究获得国家自然科学基金(52161135101)、中央高校基本科研业务费(2572022bf07)等项目的支持。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com