基于2DCNN-VAE-Transformer的异步交流电机故障诊断方法

分享自：
基于2DCNN-VAE-Transformer的异步交流电机故障诊断方法

机械
电气科学与工程
期刊:天津理工大学学报
本文旨在向中文读者介绍一篇发表于《天津理工大学学报》的学术研究论文。这篇题为“基于2dcnn-vae-transformer的异步交流电机故障诊断方法”的论文，由天津理工大学电气工程与自动化学院的毛经坤、秦颖以及未来数据技术（天津）有限公司的李德衡共同完成。该论文已于2024年7月7日收稿，并于2024年11月4日进行了网络首发。
学术背景与研究动机 本研究属于人工智能在工业设备状态监测与故障诊断领域的交叉应用研究。随着自动驾驶技术的快速发展，作为其核心动力部件的驱动电机的可靠性变得至关重要。电机故障可能导致严重的安全事故和经济损失，因此，对异步交流电机进行及时、准确的故障诊断具有重大的现实意义。传统的故障诊断方法依赖于专家经验手动提取特征，过程繁琐且难以应对海量、高维的现代工业数据。尽管深度学习技术，如卷积神经网络（CNN）、自编码器（AE）等，已成功应用于故障诊断，但在处理复杂、多变的故障模式时，仍存在特征提取不充分、难以区分相似故障特征等问题，导致诊断性能受限。为此，本研究旨在开发一种更强大的深度学习模型，以更有效地从电机振动和电压数据中捕获深层、鲁棒的故障特征，从而提高故障诊断的准确性和效率。具体目标是提出一种融合二维卷积神经网络（2DCNN）、变分自编码器（VAE）和Transformer架构的新型诊断模型，并验证其在异步交流电机多种故障类型识别上的优越性能。
详细研究流程 本研究的工作流程严谨且系统，主要包含数据准备、模型构建、模型训练与评估三大阶段，具体步骤如下：
1. 数据准备与预处理 研究对象为异步交流电机在六种不同状态下的运行数据，包括：正常状态、匝间短路、断条、偏心、轴承内圈故障、轴承外圈故障。数据采集自实验台，采样频率为12.8 kHz，采样时长10-11秒。每种状态选取5000个样本，共计30000个样本。随后，将原始的一维振动和电压信号转换为适合二维卷积神经网络（2DCNN）输入的格式（具体转换方式论文未详细说明，但暗示了数据重塑或图像化处理）。转换后的数据使用最小-最大归一化方法进行标准化处理，以消除量纲影响，加速模型训练收敛。最终，将全部30000个样本按7:3的比例随机划分为训练集（21000个样本，每种状态3500个）和测试集（9000个样本，每种状态1500个）。
2. 模型架构设计（2DCNN-VAE-Transformer） 本研究提出的核心创新是一个串联式的深度学习模型，其架构依次为：2DCNN模块、VAE模块、Transformer模块，最后接全连接分类层。 * 2DCNN模块：负责从预处理后的二维数据中自动提取局部空间特征。该模块采用两个卷积层，每个卷积层使用3x1的卷积核，并在层间插入了一个2x1、步长为[2,1]的最大池化层以降低特征维度。每个卷积层后都加入了批归一化层和激活函数层，以加速训练并引入非线性。 * VAE模块：接收2DCNN提取的特征作为输入，其目的是学习数据特征的深层次概率分布表示。VAE由编码器和解码器两部分组成，均采用全连接层和激活层。编码器将输入特征映射为潜在空间中的均值和对数方差向量，并通过重参数化技巧采样得到隐变量；解码器则尝试从该隐变量重构输入特征。VAE的损失函数为证据下界（ELBO）损失，由重构损失（均方误差MSE）和KL散度损失加权求和构成，旨在平衡重构精度与潜在空间的正则化。本研究设置权重α=0.7，β=0.3。 * Transformer模块：处理VAE编码器输出的隐变量序列（或经过VAE处理后的特征）。该模块利用自注意力机制和多头注意力机制（本研究设置为8个头），能够捕捉特征序列中长距离的全局依赖关系，克服了传统循环神经网络可能存在的梯度问题，并支持并行计算。模型层数设置为6，隐藏层维度为256。 * 分类输出层：经过Transformer处理后的特征被送入全连接层，并使用Softmax激活函数输出对应于六种电机状态的概率分布，从而实现故障分类。
3. 模型训练、评估与对比分析 * 模型训练：使用训练集数据对2DCNN-VAE-Transformer模型进行有监督训练。优化算法采用自适应矩估计（Adam），初始学习率设为0.001。损失函数采用交叉熵损失。训练共进行500轮（epoch），每轮迭代164次。训练过程中监控模型收敛情况。 * 模型评估：训练完成后，使用独立的测试集评估模型性能。评价指标包括精确度（Precision）、召回率（Recall）、F1分数（F1-Score）和整体准确率（Accuracy）。 * 对比实验：为验证所提模型的优越性，研究将其与多种经典机器学习及深度学习模型在相同数据集上进行比较，包括：多层感知机（MLP）、一维卷积神经网络（1DCNN）、随机森林（RF）、极限梯度提升（XGBoost）和K-近邻算法（KNN）。 * 消融实验：为进一步剖析模型中各组件的作用，研究设计了消融实验，依次测试了以下简化模型的性能：单独的2DCNN模型、2DCNN-VAE组合模型、2DCNN-Transformer组合模型，最后与完整的2DCNN-VAE-Transformer模型进行对比。
主要研究结果 实验结果表明，本研究提出的方法在异步交流电机故障诊断任务上取得了显著成效。 1. 整体性能：完整的2DCNN-VAE-Transformer模型在测试集上达到了96.05%的准确率，同时精确度、召回率和F1分数均超过96%。混淆矩阵显示，模型对正常状态、匝间短路和断条故障的识别非常准确。虽然偏心、轴承内圈和外圈故障存在一定的混淆，但整体诊断准确性仍然很高，证明了模型的有效性。 2. 对比实验结果：与基线模型相比，所提模型展现出绝对优势。其准确率相较于MLP、1DCNN、KNN、RF和XGBoost分别提高了25.73%、22.10%、18.75%、13.93%和4.69%。其他指标（精确度、召回率、F1分数）也全面领先。这证实了所提模型在复杂故障特征提取和分类方面的强大能力。 3. 消融实验结果：消融实验清晰地展示了各模块的贡献。单独使用2DCNN的准确率为91.44%；加入VAE后（2DCNN-VAE），准确率提升至93.86%；将2DCNN与Transformer结合（2DCNN-Transformer），准确率达到94.71%；而三者结合的完整模型取得了最高的96.06%的准确率。这一结果证明：2DCNN是有效的局部特征提取器；VAE通过概率化编码增强了特征的鲁棒性和深层表示能力；Transformer则通过注意力机制有效建模了特征间的全局依赖关系。三者协同工作，缺一不可，共同提升了模型的诊断性能。
研究结论与价值 本研究成功提出并验证了一种基于2DCNN-VAE-Transformer融合模型的异步交流电机故障诊断新方法。结论表明，该模型能够充分利用2DCNN的局部特征提取能力、VAE的深层概率表征学习能力以及Transformer的全局上下文建模能力，从而更全面、更鲁棒地从振动和电压数据中学习故障特征，最终实现高精度的多类故障诊断。 其科学价值在于为数据驱动的机械故障诊断领域提供了一种新颖且有效的深度学习架构范式，证明了将生成式模型（VAE）与判别式Transformer结合用于特征增强的可行性。应用价值则直接体现在工业场景中，该方法可应用于自动驾驶车辆驱动电机或其他关键旋转机械设备的智能健康管理，通过早期、准确的故障预警，降低维护成本，防止严重事故发生，提升系统安全性与可靠性。
研究亮点 本研究的亮点突出体现在以下几个方面： 1. 方法创新性：首次将2DCNN、VAE和Transformer三种结构进行创造性融合，用于电机故障诊断。这种串联架构设计巧妙地结合了不同模型的优势，形成了强大的特征学习流水线。 2. 特征提取的深度与广度：模型不仅通过2DCNN提取空间局部特征，还利用VAE学习到数据在潜在空间中的平滑、有意义的分布，再通过Transformer捕捉特征间的长程关联，实现了从局部到全局、从确定性到概率性的多层次特征学习。 3. 扎实的实验验证：研究不仅展示了所提模型的最终高性能，还通过系统的对比实验和消融实验，有力证明了其相对于现有方法的优越性以及模型内部各组件不可或缺的作用，使结论非常具有说服力。 4. 明确的工程应用导向：研究基于真实的异步交流电机实验台数据，诊断目标明确（六种常见故障），流程完整（从数据预处理到模型评估），具有良好的工程落地潜力。
其他有价值内容 论文在引言部分对故障诊断技术的发展，特别是从传统方法到浅层神经网络再到深度学习方法的演进，做了清晰的综述，为研究提供了扎实的理论背景。同时，作者也客观指出了当前模型的局限性：由于模型复杂度较高，诊断时间可能较长，不利于实时诊断。并展望了未来的研究方向，包括优化模型以降低计算复杂度，以及利用可视化技术提高诊断模型的可解释性，这对于推动该技术走向实际工业应用具有重要意义。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问