分享自:

机械增量故障诊断的可解释深度特征聚合框架

期刊:Advanced Engineering InformaticsDOI:10.1016/j.aei.2025.103189

这篇文档属于类型a,即报告了一项原创性研究的科学论文。以下是针对该研究的学术报告:


可解释深度特征聚合框架(IDFA)在机械增量故障诊断中的应用研究

一、作者及发表信息

本研究由上海交通大学机械系统与振动国家重点实验室的Kui HuQian ChenJintao YaoQingbo He*(通讯作者)和Zhike Peng合作完成,发表于Advanced Engineering Informatics期刊,2025年2月15日在线发表,卷号65,文章编号103189。

二、学术背景

科学领域:本研究属于机械故障诊断与人工智能交叉领域,聚焦于增量学习(Incremental Learning, IL)模型可解释性(Model Interpretation)的结合。

研究动机
传统数据驱动的智能故障诊断(Intelligent Fault Diagnosis, IFD)模型依赖静态封闭数据集,无法适应机械服役周期中新故障模式的动态出现。此外,现有模型多为“黑箱”,诊断结果缺乏可解释性,降低了工程可信度。因此,本研究旨在解决以下问题:
1. 增量学习能力不足:现有IFD模型难以在不遗忘旧知识的前提下学习新故障模式;
2. 可解释性缺失:模型决策过程不透明,难以定位故障敏感特征。

目标:提出一种可解释深度特征聚合框架(Interpretable Deep Feature Aggregation, IDFA),实现模型增量更新的同时增强诊断结果的可解释性。

三、研究流程与方法

1. 框架设计

IDFA的核心创新在于特征提取器的解耦局部梯度类激活映射(Local Grad-CAM)的开发:
- 特征提取器解耦
- 浅层特征提取模块(ϕₛ):嵌入可解释的小波卷积核(Wavelet Kernel),从振动信号中提取具有物理意义的特征(如冲击成分的周期性)。
- 可扩展深层特征提取模块(ϕₜ):通过增量任务动态扩展,专注于学习新故障模式的特征。
- 分类器:采用可扩展的全连接层,随新故障模式增加而扩展输出维度。

2. 增量学习流程
  1. 初始模型训练:基于历史故障数据(如CWRU轴承数据集)训练初始模型。
  2. 新故障数据监测:实时采集设备振动信号,检测新故障模式。
  3. 模型增量更新
    • 冻结旧模块(ϕₜ₋₁),仅扩展新模块(ϕₜ)和分类器;
    • 使用交叉熵损失函数优化新模块,避免旧知识遗忘。
  4. 故障诊断与解释:通过Local Grad-CAM可视化模型关注的关键特征区域(如故障冲击周期)。
3. 关键技术开发
  • Wav-Residual Block
    将连续小波变换(Continuous Wavelet Transform, CWT)嵌入残差块,通过小波核卷积提取时频特征,增强特征物理意义。
  • Local Grad-CAM
    针对增量模型改进传统Grad-CAM,仅聚焦新扩展模块的特征映射,避免特征稀释问题。其权重计算引入二阶梯度(式20),精准定位故障敏感区域。
4. 实验验证
  • 数据集
    • Case 1:CWRU轴承数据集(10类故障,48 kHz采样频率);
    • Case 2:船舶传动系统模拟台架(20类故障,25.6 kHz);
    • Case 3:变速齿轮箱数据集(8类故障,变工况)。
  • 对比方法:包括Replay、DER、BIC、WA等增量学习方法及AIDM故障诊断模型。
  • 评价指标:平均准确率(Aₜ)、旧类准确率(Aₜₒₗₑ)、新类准确率(Aₜₙₑᵥ)。

四、主要结果

  1. 增量诊断性能
    • CWRU数据集:IDFA平均准确率达99.48%,显著优于对比方法(如AIDM为99.15%);
    • 船舶传动系统:在20类复杂故障下,IDFA仍保持96.89%的准确率,旧类准确率(95.86%)接近新类(99.58%),验证其抗遗忘能力。
  2. 可解释性分析
    Local Grad-CAM成功定位故障特征频率(如内圈故障173.25 Hz对应5.77 ms周期),激活区域与包络谱分析的谐波成分高度一致(图7-8)。
  3. 计算效率
    单次增量更新耗时仅186秒(Case 1),测试阶段单样本推理时间极短,满足工业实时性需求。

五、结论与价值

科学价值
1. 提出首个结合增量学习与可解释性的机械故障诊断框架,为动态数据流下的模型自适应更新提供新范式;
2. 通过小波核卷积和局部梯度映射,建立了从数据特征到故障机制的物理关联。

应用价值
1. 可部署于工业设备长期监测系统,减少因模型重训练导致的停机成本;
2. 可视化诊断依据提升工程师对AI结果的信任度,推动智能诊断落地。

六、研究亮点

  1. 方法创新
    • 特征提取器解耦设计平衡了“特征通用性”与“任务特异性”;
    • Local Grad-CAM首次解决增量模型的特征定位难题。
  2. 工程普适性:在轴承、齿轮箱、传动系统等多场景验证有效性。
  3. 开源贡献:数据与代码可公开申请,促进领域复现与改进。

七、其他价值

  • 跨领域潜力:IDFA框架可扩展至其他时序信号诊断任务(如电力设备、医疗监测);
  • 局限性:边缘设备计算效率、可解释性量化标准仍需进一步研究。

此报告全面覆盖了IDFA研究的背景、方法、结果与意义,可供研究人员快速把握其创新点与应用前景。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com