本文旨在介绍一项发表于《智能城市》期刊2026年第1期(总第12卷第1期)的原创性研究。该研究由加拿大女王大学(Queen’s University)的肖凯文和加拿大滑铁卢大学(University of Waterloo)的钱欣辰共同完成,题为《基于MobileNetV3的IGBT故障监测方法》。本研究聚焦于电力电子与人工智能交叉领域,针对电力系统中核心功率器件——绝缘栅双极型晶体管(Insulated Gate Bipolar Transistor, IGBT)的实时健康状态监测问题,提出了一种面向嵌入式控制系统的轻量化深度学习解决方案。
学术背景与研究目标 在“双碳”目标驱动下,以新能源为主体的新型电力系统快速发展,电力电子变流器作为新能源发电与直流输电的核心设备,其可靠性至关重要。IGBT是变流器中的主要开关器件,其长期工作于复杂电磁环境、高温、高负荷工况下,失效具有随机性,一旦故障可能导致系统停运,造成重大经济损失。因此,对IGBT进行实时、精准的故障监测是提升电力系统运行可靠性的关键研究热点。 传统的IGBT状态监测方法主要分为机理建模与数据驱动建模两类。机理建模依赖大量老化实验与统计理论,模型构建复杂;数据驱动建模则利用设备退化参数建立预测模型。随着人工智能发展,深度学习在处理复杂非线性问题中展现出显著优势,成为状态监测的重要技术方向。然而,电力设备中的嵌入式控制系统通常计算资源有限,难以部署大型深度学习模型。因此,如何在资源受限的边缘侧实现高精度的智能故障监测,成为亟待解决的实际工程问题。 本研究的目标正在于此:为适应电力设备嵌入式系统的资源约束,探索一种高性能且轻量化的人工智能故障监测方法。研究团队选取了谷歌专为移动和嵌入式设备设计的轻量级神经网络MobileNetV3作为基础架构,旨在对其进行针对性优化,构建一个能够在保持高监测精度的同时,大幅降低计算与存储资源消耗的IGBT故障监测模型,从而为电力设备的智能运维提供一种可行的边缘侧解决方案。
详细研究流程 本研究遵循了从理论分析、模型构建到实验验证的完整科研流程,具体可分为三个核心步骤:IGBT失效机理分析与监测参数确定、MobileNetV3故障监测模型的构建与轻量化优化、以及模型性能的实验验证。
第一步:IGBT失效机理分析与输入参数确定。 研究首先对IGBT的失效机理进行了深入分析。IGBT失效可分为物理失效(如焊接层疲劳、热阻上升)和电气失效(如过压击穿、闩锁效应)。物理失效具有渐进性,而电气失效则突发性强。基于此,研究从工程可测性出发,筛选了三个能够有效表征IGBT退化状态的外部特征参数作为深度学习模型的输入量:1) 热学特性参数:反映封装完整性,器件老化时热阻呈上升趋势;2) 导通压降特性:即集电极-发射极饱和压降(Vce(sat)),随器件老化因载流子迁移率降低而单调上升;3) 关断瞬态特性:关断过程中的电压尖峰,实验表明其随器件退化呈现下降趋势,可能与载流子复合速率变化有关。这三个参数从不同物理维度反映了IGBT的健康状态,为后续的数据驱动模型提供了多维度的特征输入。
第二步:MobileNetV3故障监测模型的构建与优化。 本研究选择MobileNetV3-small版本作为基础模型,因其结构更为精简。该模型的核心创新在于采用了深度可分离卷积、线性瓶颈倒残差结构以及压缩与激励(Squeeze-and-Excitation, SE)注意力模块,在精度与计算开销间取得了良好平衡。 为实现进一步的轻量化以适应更严格的嵌入式环境,研究团队对MobileNetV3进行了关键性的结构优化。其核心改进策略是针对模型中的瓶颈(Bottleneck)模块进行“瘦身”。具体而言,原瓶颈结构中的“扩展层”(Expansion Layer)通过1x1卷积提升通道数以增强特征表达能力,但这带来了额外的参数与计算量。本研究在保证模型主干结构和深层特征提取能力(特别是输出通道数)不变的前提下,系统性地减少了多个瓶颈模块中扩展层的通道数。例如,在由11个相似Block单元构成的瓶颈层中,将Block2的扩展通道从72降至64,Block3从88降至72,Block5和Block6从240降至120等(详见表1)。这种模块化的、有针对性的通道裁剪,旨在削减非核心或冗余的特征维度,从而直接降低模型的可训练参数量(Parameters)和运行时的内存占用(Memory Footprint),实现了模型的进一步轻量化,构建出适用于IGBT故障监测的优化版MobileNetV3模型。
第三步:实验设计与性能验证。 为验证所提方法的有效性,研究团队设计了对比实验。实验硬件平台配置为Windows 11系统,Intel Core i7处理器和NVIDIA GeForce RTX 4060显卡。实验数据采用美国国家航空航天局(NASA)研究中心提供的公开IGBT老化数据集进行模型训练与测试。训练时使用RAdam优化器,设置初始学习率为0.002,批量大小为32,共迭代50个周期。 评估指标包括精确率(Precision)、召回率(Recall)、平均精度(Average Precision, AP)和F1分数,并以准确率(Accuracy)和模型大小作为核心对比指标。研究将优化后的MobileNetV3-small模型与两个基准模型进行对比:代表传统深度网络的VGG16模型,以及未经过轻量化优化的原版MobileNetV3-small模型。
主要研究结果 实验取得了明确且积极的结果,充分验证了所提轻量化故障监测方法的优越性。
在模型性能方面,优化后的MobileNetV3-small模型在测试集上达到了95.98% 的故障监测准确率。虽然略低于原版MobileNetV3-small的97.31%和VGG16的97.42%,但其精度仍然保持在很高的水平,完全满足工程应用的精度要求。
在模型轻量化效果方面,结果尤为突出。优化模型的总参数量从原版的1,232,300个大幅降低至896,676个。更重要的是,其内存占用仅为4.4 MB,相比原版的4.9 MB减少了约10%,而与庞大的VGG16模型(251.2 MB)相比,内存消耗仅为后者的1.75%。这些数据清晰地表明,通过对瓶颈层扩展通道的精心裁剪,研究团队成功地在模型精度与资源消耗之间取得了卓越的平衡。
结果的逻辑关系是连贯的:首先,基于IGBT失效机理选取的多维度特征参数为模型提供了有效的输入信息;其次,对MobileNetV3进行的轻量化改进直接导致了参数量和内存占用的下降;最终,实验验证表明,这种下降是以极小的精度损失为代价的,证明了优化策略的有效性。这些结果共同支撑了研究的核心结论:所提出的方法能够在嵌入式系统资源严重受限的条件下,实现高精度的IGBT故障监测。
结论与研究价值 本研究成功提出并验证了一种基于轻量化改进MobileNetV3的IGBT故障监测方法。其主要结论是:通过分析IGBT失效机理选取关键特征参数,并针对性地对MobileNetV3-small模型的瓶颈结构进行通道数优化,可以构建一个在精度与资源消耗间取得良好平衡的故障监测模型。该模型在保持95.98%高准确率的同时,将内存占用压缩至4.4 MB,显著提升了在电力设备嵌入式控制系统中部署的可行性。 该研究的价值体现在科学与应用两个层面。在科学层面,它展示了将先进的轻量化深度学习架构(MobileNetV3)与具体的工业设备故障监测问题相结合的有效路径,并为如何在边缘计算场景下对通用神经网络进行“瘦身”以适应特定任务提供了可借鉴的技术方案(即针对瓶颈扩展层的结构化裁剪)。在应用层面,本研究为解决电力电子设备,特别是新能源变流器等场景下的IGBT实时智能运维难题,提供了一种切实可行的轻量化解决方案。它推动了人工智能算法从云端向电力系统边缘侧、设备侧的落地应用,有助于实现设备的预测性维护,提升整个电力系统的安全性与稳定性。
研究亮点 本研究的亮点主要体现在以下几个方面: 1. 问题导向明确,贴合工程实际:研究直击电力设备嵌入式系统资源有限与高性能AI算法需求之间的核心矛盾,选题具有鲜明的工程应用价值。 2. 方法创新性强:研究并非简单套用现有MobileNetV3模型,而是针对具体应用场景和模型结构进行了创造性的轻量化改进。通过精细调整瓶颈模块扩展层的通道数这一“微创手术”,实现了模型复杂度的大幅降低,且方法原理清晰,易于复现。 3. 实现了精度与效率的卓越平衡:实验结果表明,优化后的模型以不到0.5个百分点的精度损失,换取了显著的内存占用减少,在轻量化程度上超越了原版MobileNetV3-small,这种权衡对于嵌入式部署至关重要。 4. 研究流程完整严谨:从理论基础(失效机理与特征选取)到模型创新(结构优化),再到实验验证(与主流模型对比、使用公开数据集),形成了逻辑闭环,论证充分。
其他有价值的内容 研究中关于IGBT失效机理的综述(分为物理失效与电气失效,并归纳出四个关键外部特征参数)本身具有很好的参考价值,为不熟悉该领域的读者提供了清晰的背景知识。此外,文章对MobileNetV3网络核心组件(深度可分离卷积、线性瓶颈倒残差结构、SE模块、H-swish激活函数)的介绍简明扼要,有助于读者理解其轻量化设计的精髓。最后,研究明确指出了未来智能运维的发展方向——即基于海量数据训练的深度学习模型向边缘侧演进,呼应了工业物联网和人工智能的发展趋势。