关于《一种结合多源信息与多域信息融合的轴承故障诊断方法》的学术研究报告
本报告旨在向国内研究人员介绍由Tao Sui、Yixiang Feng、Sitian Sui、Xueran Xie、Hui Li和Xiuzhi Liu共同完成,并于2025年3月31日发表于期刊《Machines》(卷13,文章289)的一项原创性研究成果。该研究团队主要来自山东科技大学电气与自动化工程学院,部分成员来自海洋科学与工程学院。
一、 研究学术背景
本研究属于机械状态监测与故障诊断领域,具体聚焦于旋转机械关键部件——滚动轴承的智能故障诊断。在现代工业环境中,轴承通常在复杂多变的工况下运行,受到环境噪声和运行条件变化的挑战。传统的、依赖于单一类型传感器(如仅用振动信号)的故障诊断方法,往往难以提供全面、稳定的故障信息,导致诊断性能下降,尤其是在变工况条件下。这一挑战被称为轴承故障诊断中的变工况问题。
近年来,随着深度学习技术的发展,基于数据驱动的智能诊断方法因其强大的自动特征提取和模式识别能力,在该领域获得了广泛关注。然而,现有方法仍面临两大层面的挑战:在模型层面,深度学习模型在恒定工况下表现良好,但在变工况下易受领域漂移影响,泛化能力和鲁棒性不足;在数据源层面,单一来源的数据仅能反映设备状态的部分信息,且易受外部干扰,导致模型输出不稳定。
为应对这些挑战,研究前沿主要集中在两个方面:一是从模型层面改进,例如引入注意力机制、自适应卷积等增强模型对关键特征的聚焦能力和环境适应性;二是从数据层面融合,即整合来自不同类型传感器(如振动、电流)和不同分析域(时域、频域、时频域)的信息,以获得更全面的健康状态表征。然而,如何有效地设计和融合来自多传感器、多变换域的特征,以构建一个对变工况不敏感、且诊断精度高的鲁棒模型,仍是亟待解决的问题。
本研究旨在解决上述问题,其核心目标是提出一种创新的轴承故障诊断框架,通过深度融合多源(振动与电流信号)与多域(时域、频域、时频域)信息,并结合注意力机制,以显著提升在复杂变工况下的故障识别准确率与模型鲁棒性。
二、 研究详细工作流程
本研究提出了一种名为M2IFD(Multi-source and Multi-domain Information Fusion method for fault Diagnosis)的轴承故障诊断方法。其整体框架分为三个主要阶段,具体工作流程如下:
第一阶段:多域数据扩展 * 研究对象与处理:研究使用来自两个公开数据集(德国帕德博恩大学数据集和韩国科学技术院数据集)的轴承运行数据。数据包含在多种负载、转速组合的变工况下采集的振动信号和电机电流信号。原始信号均为时域信号。 * 处理流程:为了从不同视角挖掘故障特征,研究对原始的时域振动和电流信号进行了两种变换: 1. 包络谱变换(Envelope Spectral Transform, EST):用于生成频域表示。具体步骤包括:首先,使用快速谱峭度(Fast Spectral Kurtosis, FSK)方法识别包含最显著故障冲击的共振频带;接着,使用巴特沃斯带通滤波器对原始信号进行滤波以抑制噪声;然后,对滤波后的信号进行希尔伯特变换以提取包络信号;最后,对包络信号进行傅里叶变换得到包络谱。此变换对轴承故障(尤其是内外圈或滚动体缺陷)引起的调制信号具有高灵敏度。 2. 贝塞尔变换(Bessel Transform, BT):用于生成时频域表示。这是一种基于贝塞尔核函数的时频分析方法,源自Cohen类分布。该变换通过引入贝塞尔函数构造的核,能够在处理非平稳信号时有效抑制交叉项干扰,提供高分辨率的时频联合表示,从而捕捉信号瞬时频率的变化,非常适合分析轴承的非平稳故障信号。 * 结果输出:经过此阶段,每个原始样本(包含振动和电流两个源)被扩展为三个域的数据:原始时域、EST变换后的频域、BT变换后的时频域图像。
第二阶段:多源特征提取与融合 * 研究对象:针对第一阶段得到的每个域(时、频、时频)的数据,分别对振动信号和电流信号这两个“源”进行处理。 * 处理流程: 1. 特征提取:为每个信号源在每个域的数据,设计并采用了一个多尺度卷积神经网络(Multi-scale CNN, MSCNN) 作为基础特征提取器。该网络结构受计算机视觉领域多尺度建模思想启发,集成了并行卷积路径:包含1x1、3x3、5x5不同尺寸的卷积核以及平均池化层,以捕获从局部细微特征到全局特征的不同尺度信息。同时借鉴了ResNet的1x1卷积进行通道降维,以及VGGNet的连续小卷积堆叠策略,旨在高效提取对工况变化不敏感的鲁棒故障特征。 2. 多源特征融合:对于同一个域(例如时域)下,从振动和电流信号中分别提取出的特征,研究设计了一个基于注意力机制的多源特征融合模块。该模块的核心思想是让模型自适应地评估不同信号源对于不同故障的敏感度差异,并进行加权融合。具体步骤为:首先,对两个源的特征分别进行全局平均池化和全局最大池化,生成紧凑的全局特征表示;接着,将这些池化后的特征拼接并通过一个全连接层进行融合与非线性映射,生成一个综合的特征向量;然后,通过Softmax函数对该向量进行处理,生成分别对应于振动和电流特征的“激励信号”(即注意力权重);最后,将这些权重与原始特征进行逐元素相乘并加上原始特征(引入残差连接),得到该域下融合了双源信息的新特征。此过程确保了重要的信号特征在融合结果中占据更大比重。
第三阶段:多域特征融合与故障分类 * 研究对象:经过第二阶段,得到了分别代表时域、频域、时频域的三个融合特征。 * 处理流程: 1. 多域特征融合:由于来自不同域的特征通常存在显著差异,不能直接拼接。为此,研究设计了另一个基于注意力机制的多域特征融合模块。该模块对每个域的融合特征进行独立处理:首先进行全局平均池化,然后通过两个全连接层(分别结合ReLU和Sigmoid激活函数)生成该域的注意力权重。这些权重用于对原始域特征进行加权增强,再通过残差连接与原始特征相加,得到注意力加权的域特征。此举旨在将不同域的特征映射到一个统一的表示空间。 2. 分类输出:将上述三个加权后的域特征进行通道维度的拼接,实现最终的多域特征融合。融合后的特征被输入到一个全连接层进行分类,最终输出轴承的健康状态或故障类型(共6类:健康、外圈电火花加工损伤、外圈电雕刻损伤、外圈钻孔损伤、内圈电火花加工损伤、内圈电雕刻损伤)。
数据分析流程:研究在帕德博恩大学数据集上设置了六种跨工况实验组合(如用工况A数据训练,用工况B数据测试,记为AB实验),以严格评估模型在未知工况下的泛化能力。所有实验在统一的PyTorch框架下进行,使用负对数似然损失函数(NLLLoss)和Adam优化器。模型性能以平均分类准确率作为主要评价指标,并通过混淆矩阵进行详细分析。
三、 研究主要结果
多源数据对比实验结果:在帕德博恩数据集上,仅使用电流信号进行诊断的平均准确率为85.05%,仅使用振动信号为90.77%。而当通过提出的多源特征融合网络结合两者时,平均准确率显著提升至98.88%。混淆矩阵分析进一步显示,单一信号(如振动信号)会将某些故障(如内圈电火花加工损伤)误判为健康状态的概率较高(28.8%),而多源融合后此类误判基本消除。这证明单一信号源的特征表征能力有限,而融合振动与电流信号能提供更全面、互补的故障信息,使模型学习到更丰富、更具判别力的特征集。
多变换域数据对比实验结果:在帕德博恩数据集上,仅使用时域、频域(EST)、时频域(BT)数据作为输入时,平均准确率分别为94.40%、95.73%和96.78%。其中,基于贝塞尔变换的时频域数据表现略优。然而,当通过多域特征融合模块将三个域的数据特征进行融合后,平均准确率进一步提升至99.11%。该结果证实,不同变换域的分析技术各有优势和局限,时域、频域、时频域特征的融合能够实现信息互补,更全面地捕捉信号特征,从而超越单一域分析的表面症状分析,深入挖掘故障根源。
不同模型对比实验结果:研究将提出的M2IFD模型与多种经典方法进行对比。传统支持向量机(SVM)结合经验模态分解(EMD)的方法平均准确率仅为71.57%。基于深度学习的1D-CNN和2D-CNN方法平均准确率分别为86.75%和91.12%。相比之下,M2IFD方法取得了最高的平均准确率98.90%。这一结果不仅凸显了深度学习相对于传统方法的优势,更证明了本研究提出的多源、多域信息融合策略在提升复杂变工况下故障诊断性能方面的显著有效性。
在第二个数据集(KAIST数据集)上的验证结果:为了验证模型的普适性,研究在另一个独立的轴承数据集上重复了上述对比实验。结果趋势一致:多源融合(振动+电流)的准确率(98.38%)远高于单一源(电流82.62%,振动90.81%);多域融合的准确率(98.9%)也高于任何单一域(时域92.07%,频域94.25%,时频域94.9%)。这强有力地证明了M2IFD方法在不同数据源和故障类型上均具有良好的适应性和鲁棒性。
逻辑关系:多源对比实验证明了融合振动与电流信号的必要性,为后续在多域分析中同时对这两个信号源进行处理提供了依据。多域对比实验则证明了融合时、频、时频域特征能进一步提升性能,从而验证了整体三阶段框架(先分源分域提取,再分层融合)设计的合理性。模型对比实验最终从整体上确立了M2IFD方法相对于现有主流技术的优越性。这些结果层层递进,共同支撑了研究的核心结论。
四、 研究结论与价值
本研究成功提出并验证了一种结合多源(振动、电流传感器)与多域(时、频、时频域)信息融合的轴承故障诊断方法(M2IFD)。该方法通过引入包络谱变换和新型的贝塞尔变换进行多域数据扩展,并创新性地设计了基于注意力机制的多尺度CNN特征提取网络、多源特征融合模块以及多域特征融合模块,实现了对变工况下轴承故障高效、准确的识别。
科学价值:
应用价值:
五、 研究亮点
六、 其他有价值内容
研究中对数据预处理流程的描述非常详细,包括信号重叠采样、特定频带的滤波(Butterworth滤波器)等,这些工程细节对于复现研究和实际应用具有重要参考价值。此外,论文对MSCNN网络结构的设计灵感(Inception, ResNet, VGGNet)进行了说明,体现了其设计并非凭空而来,而是建立在成熟的计算机视觉架构思想之上,并针对一维信号处理进行了适配和优化,这种跨领域借鉴与改进的思路也值得学习。