基于变分模态分解与深度迁移学习的机械故障诊断

分享自：
基于变分模态分解与深度迁移学习的机械故障诊断

期刊:农业工程学报DOI:10.11975/j.issn.1002-6819.2020.14.016
学术研究报告：基于变分模态分解与深度迁移学习的机械故障诊断方法
一、 研究作者、机构与发表信息
本研究由施杰（第一作者，昆明理工大学机电工程学院，兼云南农业大学机电工程学院）、伍星（通讯作者，昆明理工大学机电工程学院）、柳小勤和刘韬（昆明理工大学机电工程学院）共同完成。研究成果以题为《变分模态分解结合深度迁移学习诊断机械故障》的论文形式，发表于《农业工程学报》（Transactions of the Chinese Society of Agricultural Engineering）2020年第36卷第14期（2020年7月），页码范围为129-137页。
二、 学术背景与研究目的
本研究隶属于机械工程领域的设备状态监测与故障诊断方向，具体聚焦于旋转机械（尤其是滚动轴承）的智能故障诊断技术。随着工业装备向大型化、复杂化、智能化发展，其运行工况（如转速、负载）往往处于动态变化之中，导致采集到的振动信号呈现出强烈的非线性和非平稳性特征。传统的、基于恒定工况和平稳信号假设的故障诊断方法（如小波变换、经验模式分解等）在这种变工况条件下极易出现误诊或漏诊。因此，如何从变工况、大数据的背景中，自适应地提取有效的故障特征并实现高精度的智能识别，成为了一个亟待解决的关键科学问题。
针对上述挑战，本研究设定了明确的研究目标：提出一种能够有效融合信号自适应特征提取与智能模式识别的端到端故障诊断框架。具体而言，旨在解决两个核心难题：第一，解决变分模态分解（Variational Mode Decomposition， VMD）这一先进信号处理方法中，其关键参数（本征模态函数分解个数K和惩罚因子α）难以自适应确定的问题，以提升特征提取的自动化程度和效果。第二，解决在变工况下，不同来源或不同工况采集的数据集（称为源域和目标域）之间存在概率分布差异（即“领域偏移”）的问题，导致基于深度学习的诊断模型泛化能力下降。为此，研究计划将参数优化的VMD算法与深度迁移学习（Deep Transfer Learning， DTL）模型相结合，以期构建一个鲁棒性强、诊断精度高的智能故障诊断新方法。
三、 详细研究流程与方法
本研究的工作流程是一个系统的、多步骤的管道，涵盖了从原始信号处理到最终智能诊断的完整链条，具体可分为以下几个核心步骤：
步骤一：基于多种群差分进化算法优化的变分模态分解（MPDE-VMD） 首先，研究针对VMD参数自适应问题，提出了一种创新的优化算法。VMD虽然能有效处理非平稳信号，但其分解效果严重依赖于预设的参数K和α。传统方法多依靠经验设定，缺乏自适应性。本研究引入多种群差分进化（Multiple Population Differential Evolution， MPDE）算法作为优化器。MPDE是一种改进的差分进化算法，它通过同时维护多个种群并进行种群间的信息共享与竞争，增强了全局搜索能力和收敛速度，避免了标准算法易陷入局部最优的缺陷。研究者设计了包络熵作为适应度函数。包络熵能够量化信号冲击特征的稀疏性：故障特征越明显，冲击成分越突出，信号的包络熵值就越小。因此，MPDE算法的优化目标就是寻找一组（K, α）参数，使得经过VMD分解后得到的信号分量（本征模态函数，IMF）的包络熵总和最小。具体实现时，MPDE算法初始化多个种群，每个个体代表一组（K, α）参数。在进化过程中，通过变异、交叉、选择等操作，并利用包络熵适应度函数进行评估，最终迭代寻找到最优的参数组合。这一步骤的创新性在于，将智能优化算法与信号处理方法的参数寻优相结合，实现了VMD关键参数的自适应、自动化确定。
步骤二：信号重构与时频特征获取 获得最优VMD参数并完成信号分解后，得到一系列IMF分量。并非所有IMF都包含有效的故障信息，有些可能主要是噪声。为了聚焦于故障特征，研究采用了平均峭度准则进行IMF筛选。峭度指标对信号中的冲击成分非常敏感，是轴承故障诊断中常用的特征指标。计算所有IMF分量的峭度值并求取平均值，然后选取峭度值高于平均值的IMF分量进行叠加，重构出新的信号。这一重构过程相当于一次自适应滤波，强化了故障冲击成分，抑制了无关噪声。随后，对重构后的信号进行连续小波变换（Continuous Wavelet Transform， CWT），将其从一维时间序列转换为二维的时频图像（小波时频图）。时频图能够同时展示信号的频率成分及其随时间的变化，为后续深度学习模型提供了更丰富、更直观的输入特征。
步骤三：构建深度迁移学习（DTL）诊断模型 为了应对变工况下的领域偏移问题，研究构建了一个深度迁移学习模型。该模型以深度残差网络（Deep Residual Network， ResNet）为骨干网络。ResNet通过引入残差连接，有效缓解了深层网络训练中的梯度消失问题，能够学习更深层次、更抽象的特征。模型的创新点在于，在ResNet分类器之前加入了一个“自适应层”。该层采用边缘分布自适应方法，具体通过计算源域数据和目标域数据在多核再生核希尔伯特空间中的最大均值差异（Multiple Kernel Maximum Mean Discrepancy， MK-MMD），并将其作为一项正则化损失函数。模型的总损失函数由两部分构成：一部分是常规的分类损失（如在源域带标签数据上的交叉熵损失），用于确保模型能够正确识别已知的故障模式；另一部分就是MK-MMD距离损失，其目标是尽可能缩小源域和目标域特征分布之间的差异。通过联合优化这两部分损失，模型在训练过程中不仅学习了如何分类，还学会了提取对领域变化不敏感的、具有泛化能力的“域不变特征”。模型使用PyTorch深度学习框架搭建，在Intel Xeon E5处理器平台上运行。
步骤四：实验设计与对比验证 为了全面验证所提MPDE-VMD+DTL方法的有效性，研究设计了严谨的实验。实验数据来自四个公开的、不同工况下的滚动轴承数据集：美国凯斯西储大学的CWRU数据集、西安交通大学与昇阳科技的XJTU-SY数据集、美国辛辛那提大学智能维护中心的IMS数据集，以及昆明理工大学振动噪声监测与控制研究所的MCVN数据集。这些数据集涵盖了不同的轴承型号、故障类型（内圈、外圈、滚动体、保持架及其复合故障）、转速和负载条件，具有充分的多样性和代表性。 在实验设置上，研究者将前三个数据集（CWRU, XJTU-SY, IMS）组合作为源域数据集，共计24,891个样本，用于训练深度迁移学习模型。将MCVN数据集作为目标域数据集，共计2,100个样本，用于测试模型在“新”工况下的诊断性能。这种设置模拟了现实场景：利用已有的、标签丰富的历史数据（源域）来建立一个模型，使其能够诊断来自不同设备或不同运行条件（目标域）的无标签或少量标签数据。 为了凸显所提方法的优势，研究选取了三种具有代表性的基线方法进行对比：1）传统浅层学习模型：BP神经网络，以手工提取的8个时域、频域特征（如峭度、峰值因数等）作为输入。2）深度学习方法：标准的ResNet卷积神经网络（不含迁移学习自适应层），直接使用时频图进行训练和测试。3）传统迁移学习方法：迁移成分分析（Transfer Component Analysis， TCA），一种经典的基于特征映射的域适应方法。所有对比实验均在相同的数据划分下进行，并重复10次以消除随机性，取平均精度作为最终评价指标。
四、 主要研究结果与分析
结果一：MPDE-VMD优化算法的有效性验证 研究以CWRU数据集中的轴承内圈故障信号为例，展示了MPDE-VMD的优化过程。MPDE算法进化至第3代即收敛，寻得最优参数组合为[K=9， α=2350]，此时适应度函数（包络熵）值最小（0.521602）。使用该参数进行VMD分解后，根据峭度准则筛选出IMF4、IMF5、IMF8、IMF9四个分量进行重构。对重构信号进行包络谱分析，清晰地在162 Hz处发现了故障特征频率及其倍频，且与理论计算的内圈故障特征频率（157.94 Hz）非常接近，诊断误差仅为2.57%。作为对比，使用传统的经验模式分解（Empirical Mode Decomposition， EMD）处理同一信号，其包络谱中虽然也能识别出故障频率（163 Hz），但背景噪声更多，干扰谱线复杂，且诊断误差（3.20%）略高于MPDE-VMD方法。这一结果直观地证明，MPDE-VMD能够更精确、更清晰地提取出故障特征频率，为后续诊断提供了质量更高的输入特征。
结果二：MPDE-VMD+DTL方法的整体诊断性能 在四数据集跨工况诊断任务中，所提出的MPDE-VMD+DTL方法取得了显著优于所有对比方法的性能。其平均故障诊断精度达到了84.36%。而三种对比方法的平均诊断精度分别为：BP神经网络 23.60%， ResNet卷积神经网络 71.63%， 迁移成分分析（TCA） 19.68%。这一组对比数据具有极强的说服力，清晰地揭示了不同方法层次的能力差异： * BP神经网络精度最低：这主要是因为其依赖手工设计的浅层特征，在复杂的变工况、跨域场景下，这些特征的表征能力有限，无法捕捉深层的、域不变的模式。 * ResNet精度次之但远高于BP：这表明深度学习模型（ResNet）自动学习特征的能力远强于手工特征。然而，71.63%的精度说明，当源域（三个组合数据集）和目标域（MCVN数据集）的数据分布存在差异时，即使使用深度网络，其泛化能力也会受到严重制约，模型在源域学到的知识不能直接很好地迁移到目标域。 * TCA方法精度甚至低于BP：这暴露出传统浅层迁移学习方法在应对高维、复杂的机械振动信号（时频图）时的局限性。TCA缺乏从原始数据中自动学习深层特征的能力，其基于浅层特征的分布适配效果不佳。 * MPDE-VMD+DTL方法精度最高：84.36%的诊断精度综合证明了本研究提出的两阶段框架的成功。首先，MPDE-VMD阶段通过自适应参数优化和特征重构，为模型提供了噪声更少、故障信息更突出的高质量时频特征图。其次，更重要的是，DTL模型通过引入MK-MMD域适应损失，在训练过程中显式地最小化了源域和目标域之间的特征分布差异，使得模型学习到的特征具有更强的跨域泛化能力。这两个阶段的协同作用，最终实现了在变工况下的高精度端到端智能诊断。
五、 研究结论与价值
本研究成功提出并验证了一种将优化变分模态分解（MPDE-VMD）与深度迁移学习（DTL）相结合的机械故障诊断新方法。主要结论如下： 1. 方法有效性：所提出的MPDE-VMD算法能够自适应确定VMD的最优参数，有效增强了故障信号的特征，解决了VMD应用中的参数依赖问题。 2. 诊断性能优越：MPDE-VMD+DTL方法在跨多个不同工况轴承数据集的诊断任务中，取得了84.36%的平均诊断精度，显著优于传统的BP神经网络、深度ResNet网络以及迁移成分分析方法，证明了其在变工况条件下具有更高的诊断精度、更好的泛化能力和鲁棒性。 3. 端到端框架：该方法将信号预处理、特征提取与智能识别融合在一个统一的框架内，减少了对人工先验知识和经验的依赖，为实现工业现场机械装备的端到端智能故障诊断提供了可行的技术路线。
本研究的价值体现在： * 科学价值：为解决变工况下机械故障诊断的领域自适应问题提供了一个创新的解决方案。它将信号处理领域的自适应参数优化与人工智能领域的深度迁移学习进行了有效融合，为相关交叉学科研究提供了参考。 * 应用价值：所提出的方法具有较强的工程应用潜力。它能够利用现有设备（源域）积累的带标签数据，来构建诊断模型，并使其适用于新设备或新工况（目标域），这对于降低数据标注成本、加速诊断模型在新场景下的部署具有重要意义。
六、 研究亮点
创新性的算法融合：首次将多种群差分进化算法（MPDE）用于优化VMD参数，实现了信号分解关键参数的自适应选取，提升了特征提取步骤的自动化水平和可靠性。
系统的诊断框架：构建了一个完整的“优化特征提取+深度域适应”诊断管道。不仅关注特征本身的质量（通过MPDE-VMD），更关注特征在不同领域间的可迁移性（通过DTL），双管齐下应对变工况挑战。
严谨的跨域验证：实验设计科学，采用了四个独立、公开的轴承数据集构建具有挑战性的跨工况诊断任务，通过与多种基线方法的充分对比，有力证明了所提方法的优越性和泛化能力。
明确的工程导向：整个研究面向实际工程问题（变工况诊断），所采用的数据集模拟了真实工业场景中的数据分布差异，提出的端到端方案具有明确的工业应用前景。
七、 其他有价值内容
研究在讨论部分也指出了当前方法的局限性及未来方向：本实验所用数据仍来源于实验室环境，与工业现场数据的概率分布可能存在进一步差异，这可能会影响深度迁移学习模型的最终应用效果。因此，未来的研究工作将聚焦于如何进一步提升模型对工业现场复杂环境的适应能力，继续深化信号自适应提取与深度迁移学习模型的研究，以推动该技术的实际工业化应用。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问