基于多尺度特征融合卷积神经网络的牵引电机转子断条故障诊断方法

分享自：
基于多尺度特征融合卷积神经网络的牵引电机转子断条故障诊断方法

期刊:电工技术学报DOI:10.19595/j.cnki.1000-6753.tces.250208
基于多尺度特征融合卷积神经网络的牵引电机转子断条故障诊断方法研究报告
一、 研究作者、机构与发表信息 本研究由北京交通大学电气工程学院的丁卓、张和生、汤昳琮、洪剑锋共同完成。该研究以《基于多尺度特征融合卷积神经网络的牵引电机转子断条故障诊断方法》为题，发表于《电工技术学报》（Transactions of China Electrotechnical Society）2026年1月出版的第41卷第2期。该研究得到了北京市自然科学基金、中国国家铁路集团有限公司系统性重大项目以及北京交通大学研究生专业核心课程建设项目的资助。
二、 学术背景与研究目的 本研究属于电气工程领域，具体聚焦于高速列车牵引电机的状态监测与故障诊断技术，是故障预测与健康管理（Prognostics and Health Management, PHM）的重要组成部分。牵引电机作为高速列车的核心动力部件，其运行可靠性直接关系到列车安全。其中，转子断条故障约占牵引电机全部故障的10%，且具有渐进性发展的特点，早期故障特征微弱，若不能及时识别，可能导致故障扩大，甚至引发安全事故。
传统的转子断条故障诊断方法主要面临两大挑战：首先，故障特征频率与电源频率非常接近且幅值很小，极易被强大的基频分量所掩盖；其次，高速列车牵引电机由牵引变流器供电，其供电频率随运行工况变化，导致故障频率变化范围大，特征尺度多变，使得有效特征提取困难，诊断准确性难以保证。
基于此，本研究旨在解决上述问题，提出一种能够适应牵引电机复杂运行工况、准确诊断转子断条故障及其严重程度（断条数目）的智能诊断方法。其核心目标是：通过结合信号处理与深度学习的优势，设计一种新型的深度学习模型，实现对牵引电机转子断条故障高精度、强鲁棒性的智能诊断，为列车维修计划的针对性制定提供可靠依据。
三、 详细研究流程与方法 本研究的工作流程系统性地包含了数据预处理、模型构建、实验验证与分析三个主要阶段。
第一阶段：基于希尔伯特变换（Hilbert Transformation, HT）的数据预处理 研究首先对原始电流信号进行预处理，以增强故障特征并适配后续的卷积神经网络（CNN）输入。具体步骤如下： 1. 信号截断与HT包络分析：采集的定子电流信号首先被矩形窗截取固定长度（如1024个点）。随后，利用希尔伯特变换对单相电流信号进行处理。HT能够将实信号转换为解析信号，其模即为原信号的包络。理论分析表明，对于转子断条故障电流，其包络信号中仅包含直流分量和故障频率分量，而强大的电源频率基波分量被有效剔除，从而显著增强了故障特征的可见度。 2. 信号到图像的转换：为充分发挥CNN在图像特征提取方面的优势，将经过HT处理得到的包络信号转换为灰度图像。采用一种无需专家参数的经验性方法：将一维包络信号序列按顺序重新排列成一个二维矩阵（如32×32像素），并将数据归一化到0-255的像素强度范围。这种转换将时序信号的故障特征编码为图像的空间模式，便于CNN处理。研究通过对比图展示了HT处理前后生成图像的差异，处理后的图像中故障细节信息更丰富，不同故障状态的特征更易于区分。
第二阶段：多尺度特征融合卷积神经网络（MSFFCNN）模型设计 为解决故障特征尺度变化大的问题，研究创新性地设计了一个融合了注意力机制的多尺度特征提取网络。 1. 网络整体架构：MSFFCNN以预处理生成的图像作为输入。网络前端使用两层标准卷积层（3×3卷积核）进行初步特征提取，并采用带泄露的修正线性单元（Leaky ReLU）作为激活函数以避免神经元“死亡”。随后，网络的核心部分是两个自定义的“注意力融合的多尺度特征提取模块”。 2. 注意力融合的多尺度特征提取模块：这是本研究的核心创新点。该模块并行使用不同尺寸的卷积核（如1×1, 3×3, 5×5）来提取不同尺度的特征，以适应故障频率变化导致的特征尺度多样性。为了优化多尺度特征的融合效果，研究引入了高效通道注意力（Efficient Channel Attention, ECA）机制。ECA模块通过对每个通道的特征图进行全局平均池化，再通过一个一维卷积来捕捉通道间的依赖关系，并生成各通道的权重。这些权重随后用于对原始多尺度特征进行加权，从而让网络更关注对故障分类贡献更大的特征通道，抑制冗余或干扰通道。最后，加权后的多尺度特征在通道维度上进行拼接，并通过残差连接（Residual Connection）与模块输入相加，以缓解梯度消失并加速训练。模块分为A和B两种类型，B型模块使用更大的卷积核（通过1×7和7×1卷积组合实现7×7感受野）以捕获更全局的特征信息。 3. 分类输出：经过多个多尺度模块和池化层后，网络使用全局平均池化层将特征图转换为特征向量，最后通过全连接层和Softmax函数输出故障类别的概率分布。网络的具体参数配置详见论文表1。
第三阶段：实验验证与对比分析 研究在两个数据集上对所提方法进行了全面验证。 1. 数据集介绍： * 公开数据集：来自巴西圣保罗大学，包含一台感应电机在三种不同负载转矩（0.5, 1.5, 2.5 N·m）和四种转子状态（正常、1根断条、2根断条、3根断条）下的三相电流数据。本研究仅使用A相电流，将连续1024个点作为一个样本，经预处理后生成32×32图像。共构建12个类别（3负载×4状态），每类200个样本，总计2400个样本。 * 实验室数据集：在北京交通大学实验室平台采集，使用一个正常转子和三个故障转子，在三种不同电源频率（15, 30, 45 Hz）下进行实验。同样构建了12个类别（3频率×4状态），每类200个样本，总计2400个样本。 2. 实验设置：为评估模型泛化能力，设置了不同的训练集比例（20%，40%，60%），验证集固定为20%，其余为测试集。使用准确率和宏平均F1分数作为评价指标。所有实验重复10次取平均值。优化器采用Adam，初始学习率为0.0005并动态衰减。 3. 消融实验：为验证HT预处理和ECA模块的有效性，进行了消融实验。结果表明：（1）不使用HT预处理时，模型性能（尤其在训练样本少时）显著下降，准确率最大降幅达13.37%，证明了HT在剔除电源分量、增强故障特征方面的关键作用。（2）移除ECA模块后，模型性能也有下降，且结果稳定性（标准误差）变差，证明了ECA通过动态加权融合多尺度特征，能提升模型精度和泛化能力。（3）对比不同卷积核组合的实验表明，本文采用的1×1, 3×3, 5×5多尺度组合效果最佳。 4. 对比实验：将MSFFCNN与四种主流CNN模型进行对比：深度CNN（DCNN）、残差CNN（ResCNN）、改进的残差CNN（Imp-ResCNN）和残差多尺度特征融合CNN（RMFFCNN）。在两个数据集上的结果均显示，MSFFCNN在不同训练集比例下均取得了最高的平均诊断准确率（公开数据集最高达99.85%，实验室数据集最高达99.82%）。特别是在小样本（20%训练集）和噪声环境下（添加30-40 dB高斯白噪声），MSFFCNN的优势更为明显，表现出更强的特征提取能力、抗噪能力和泛化性能。通过t-SNE可视化技术对网络提取的特征进行降维展示，MSFFCNN所提取的各类故障特征在二维空间中聚类更紧密、类别间界限更清晰，直观证明了其卓越的特征学习与区分能力。
四、 主要研究结果 1. 预处理有效性验证结果：消融实验数据明确显示，HT预处理步骤能大幅提升模型诊断准确率，尤其是在训练数据有限的情况下。这证实了利用故障先验知识（包络分析）指导数据预处理，可以有效降低后续深度学习模型特征提取的难度，是提升诊断性能的关键一步。 2. 模型架构有效性验证结果： * 多尺度与注意力融合的有效性：消融实验表明，ECA模块的引入提升了模型性能与稳定性。对比实验进一步证明，MSFFCNN的性能全面优于仅使用单一尺度卷积的DCNN、ResCNN和Imp-ResCNN，也优于未使用注意力机制进行特征加权的多尺度模型RMFFCNN。这验证了所提出的“多尺度卷积+ECA注意力融合”架构在应对牵引电机变工况、宽频带故障特征提取问题上的优越性。 * 综合性能优势：在两个独立的数据集上，MSFFCNN均达到了接近99.9%的最高诊断准确率，且在不同训练比例下表现稳健。在抗噪实验中，随着信噪比降低，所有模型性能均下降，但MSFFCNN的下降幅度最小，保持了最高的准确率，证明了其良好的鲁棒性。 3. 特征可视化结果：t-SNE可视化图清晰地表明，相较于其他对比模型，MSFFCNN能够将不同类别（不同负载/频率下的不同故障程度）的样本在特征空间中进行更有效的分离，类内聚集度更高，类间距离更远。这从特征学习的角度解释了MSFFCNN为何能取得更高的分类精度。 4. 混淆矩阵分析结果：在实验室数据集的混淆矩阵中，MSFFCNN的误分类样本数远少于其他模型。少数误分类主要发生在“一根转子断条”这类轻微故障上，且在低供电频率时更易发生。这符合工程实际，因为轻微故障特征本身更弱，低频率下采样点数覆盖的周期数少，特征提取本就更为困难。即便如此，MSFFCNN仍表现出最佳的识别能力。
五、 研究结论与价值 本研究成功提出并验证了一种基于多尺度特征融合卷积神经网络（MSFFCNN）的牵引电机转子断条故障诊断方法。主要结论如下： 1. 方法有效性：该方法通过HT预处理有效剔除了电流信号中的强电源频率分量，凸显了故障特征；通过融合ECA注意力的多尺度卷积模块，自适应地提取并融合了不同尺度的故障特征，克服了牵引电机供电频率变化大导致的特征尺度变化问题。 2. 性能优越性：实验表明，该方法在两个转子断条故障数据集上均实现了极高的诊断准确率（超过99.8%），且在小样本、含噪声条件下表现出更强的鲁棒性和泛化能力，性能优于其他相关深度学习方法。 3. 应用价值：该方法仅需单相定子电流信号，无需安装额外传感器，具有非侵入性、易于在线监测的优点。能够准确识别不同负载和供电频率下的转子断条故障及其严重程度，特别适用于工况复杂多变的高速列车牵引电机，可为实施预测性维护、制定精准维修计划、保障列车运行安全、降低运维成本提供有力的技术支撑。
六、 研究亮点 1. 问题导向的创新结合：将传统信号处理（希尔伯特变换）与前沿深度学习（多尺度CNN、注意力机制）有机结合，利用先验知识指导数据预处理，用深度学习模型解决复杂特征提取问题，形成了优势互补的解决方案。 2. 模型架构的创新：设计了注意力融合的多尺度特征提取模块，创新性地将高效通道注意力（ECA）机制引入多尺度卷积特征的后融合过程，实现了对不同尺度特征通道的自适应加权，增强了模型对关键故障特征的聚焦能力和泛化性能。 3. 面向实际应用的验证：研究不仅在公开数据集上验证了方法，还通过实验室采集的、包含不同电源频率的数据集进行了验证，更贴近牵引电机实际变频运行的工况，证明了方法在真实场景下的适用性和有效性。 4. 全面深入的实验分析：通过系统的消融实验、与多种主流模型的对比实验、抗噪实验以及特征可视化分析，从多个维度严谨地验证了所提方法各组成部分的有效性及整体性能的优越性。
七、 其他有价值内容 研究还对牵引电机转子断条故障的机理进行了简要阐述，分析了故障频率（(1±2s)fs）与电源频率（fs）及转差率（s）的关系，为理解HT预处理能够消除基频分量提供了理论依据。此外，论文详细介绍了HT时域滤波器的离散化实现方法以及信号到图像转换的具体数学步骤，增强了方法的可复现性。文中也讨论了相关工作的局限性，如传统陷波滤波器仅适用于固定频率，突出了本方法在变频驱动场景下的优势。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问