本研究的共同第一作者为来自中国东北林业大学(Northeast Forestry University)机电工程学院的Yang Yuxuan、Jing Jiarui、Zhang Jian和Liu Ziyu,以及清华大学机械工程系的Li Xueyi教授(通讯作者)。该研究成果2025年发表在Scientific Reports期刊(卷15,文章号8888)。
该研究属于机械故障诊断与人工智能交叉领域,聚焦于旋转机械(如轴承、齿轮)在无监督条件下的跨工况故障诊断难题。旋转机械作为现代工业核心组件,其可靠性直接影响生产安全与经济效益。传统故障诊断方法依赖技术人员经验,存在主观性强、效率低下的局限。虽然基于深度学习的诊断方法显示出潜力,但面临两个本质挑战:不同工况下振动信号分布差异导致的领域偏移(domain shift)问题,以及大规模标注数据获取成本高昂的问题。
研究团队针对现有方法的四个关键缺陷展开攻关:(1)传统CNN对振动信号上下文感知不足;(2)现有迁移方法仅关注特征映射或对抗策略的单一层面;(3)联合分布方法存在领域混淆管理困难;(4)诊断方法忽视判别性特征学习的重要性。为此,本研究提出集成SE注意力机制(Squeeze-and-Excitation attention mechanism)、改进分布对齐框架和条件对抗网络的创新解决方案,旨在实现不同工况下的高精度知识迁移。
研究团队构建了名为IADTLN的创新网络架构,其核心技术组成包括: 1. 特征提取模块:采用四层1D-CNN作为主干网络,每层包含卷积层、批量归一化(BN)和ReLU激活函数。特别在首层后嵌入SE注意力机制,通过压缩-激励-重加权三阶段动态调整通道特征响应。该机制首先通过全局平均 pooling生成通道描述符(公式6),再经两层全连接网络(公式7)计算通道权重,最终实现特征重校准(公式8)。
判别特征学习模块:提出改进的I-softmax损失函数(公式9),相比传统softmax引入灵活决策边界参数x和y。如图2所示,当特征向量f_i©>0时采用ef_i©/y-x的变换,否则使用eyf_i©-x变换,通过增强类间分离度提升特征判别性。
领域适配模块:创新性地整合两种策略:
研究采用三组工业数据集系统验证方法有效性:
CWRU轴承数据集:包含四种故障状态(正常、内圈、滚珠、外圈故障),在四种转速(1797/1772/1750/1730 r/min)下采集振动信号,构成6种迁移场景(如G1→G2表示1797→1772r/min迁移)。
NEFU齿轮数据集:包含六类故障(剥落、磨损、点蚀、断齿、裂纹、正常),在三组转速(900/1200/1500 rpm)下采集,建立6种迁移任务。
JNU补充数据集:包含N205/NU205轴承在不同转速(600/800/1000 r/min)下的故障数据,用于验证跨设备泛化能力。
实验设计包含消融实验与对比实验两类: - 消融实验分别去除SE、I-softmax、IDAF、CDAN+E模块,验证各组件贡献(表4-5)。 - 对比实验涵盖10种基线方法,包括CORAL、JMMD、DANN、CDAN等代表性算法(表6-8)。
在CWRU数据集的G3→G1迁移任务中: - 完整模型准确率达94.64%,显著高于缺失任一模块的情况(缺失IDAF时仅47.10%)。 - SE模块提升特征选择性,使准确率提高5.78个百分点; - I-softmax相比传统softmax带来6.54个百分点的提升。
在更具挑战性的NEFU数据集H3→H1任务中: - 完整模型准确率96.12%,而基线方法(如Method 1)出现负迁移(65.43%<基线75%)。 - 熵条件对抗策略(CDAN+E)对复杂齿轮故障的适应性尤为突出。
在全部18个迁移任务中,IADTLN的平均准确率超过96%,较次优方法(Method 8)提升2.3个百分点。特别是在JNU数据集的J3→J1任务中,面对未知设备(NU205→N205)的迁移仍保持92.16%的准确率(图7-10的混淆矩阵显示各类别误判均衡)。
t-SNE降维显示(图8,10): - 传统方法特征空间存在明显领域偏移和类别重叠。 - IADTLN学习到的特征呈现清晰的类内聚集和类间分离,证实其双重对齐(特征分布+类别判别)的有效性。
本研究通过有机整合注意力机制、判别性学习和对抗迁移,确立了旋转机械无监督故障诊断的新范式。其科学价值体现在三方面: 1. 方法学创新:首次将SE注意力与改进softmax损失结合用于振动信号处理;提出IDAF框架统一统计矩匹配与核空间度量。 2. 工程适用性:在标注数据稀缺的现实工业场景下,实现平均96%以上的跨工况诊断准确率。 3. 理论启示:证实熵条件对抗训练能有效缓解负迁移,为领域自适应提供新思路。
作者指出当前工作限于单一振动信号分析,下一步将融合声发射、温度等多传感器数据。此外,提出的框架可扩展至其他时序故障诊断场景,如电力变压器、液压系统等,这需要针对特定信号的网络结构调整与超参数优化。该研究获得国家自然科学基金(52161135101)、中央高校基本科研业务费(2572022bf07)等项目的支持。