学术研究报告:基于互补可迁移性度量的深度学习开集多源域自适应方法在机械故障诊断中的应用
本研究由Jinghui Tian、Dongying Han(通讯作者)、Hamid Reza Karimi、Yu Zhang和Peiming Shi合作完成。作者单位包括中国燕山大学车辆与能源学院、意大利米兰理工大学机械工程系以及燕山大学电气工程学院。研究成果发表于期刊《Neural Networks》2023年第162卷(69-82页)。
该研究属于智能故障诊断(Intelligent Fault Diagnosis)与迁移学习(Transfer Learning)交叉领域,聚焦于工业机械设备的健康管理。传统故障诊断方法依赖两个假设:1)训练数据与测试数据分布一致;2)训练数据包含所有可能的故障类别。然而,实际工业场景中,机械工况的复杂性和环境噪声会导致域偏移(Domain Shift),即训练(源域)与测试(目标域)数据分布不一致;此外,目标域可能出现训练阶段未见的未知故障模式(Unknown Fault Modes),导致诊断模型失效。
为解决上述问题,本研究提出一种开集多源域自适应(Open Set Multi-source Domain Adaptation, OSMDA)方法,旨在:
1. 通过多源域知识迁移解决域偏移问题;
2. 设计未知故障检测机制以识别目标域中的新故障类别;
3. 利用多源互监督策略增强模型性能。
OSMDA采用共享-多分支混合网络结构,包含以下模块:
- 共享特征提取器(Shared Feature Extractor):提取跨域通用特征。
- 多源特异性特征提取器(Source-specific Feature Extractors):针对每个源域进一步映射高维特征。
- 多源分类器与判别器(Source-specific Classifiers & Discriminators):通过对抗学习对齐源域与目标域分布。
- 未知故障检测器(Unknown Mode Detector):基于互补可迁移性度量(Complementary Transferability Metric)筛选未知故障样本。
- 多源互监督模块(Mutual-supervised Module):挖掘多源域间的相关性信息。
为解决单一度量(如熵或置信度)的局限性,提出融合三种指标的加权策略:
- 熵(Entropy):衡量预测概率分布的不确定性。
- 置信度(Confidence):最高预测概率值,反映样本与已知类别的相似性。
- 一致性(Consistency):多源分类器预测结果的标准差,校准分类可靠性。
最终权重公式:
[ wt^i = \frac{(1 - w{\text{ent}}^i) + (1 - w{\text{cons}}^i) + w{\text{conf}}^i}{3} ]
低权重样本被标记为未知故障。
在对抗训练中,目标域样本的域损失通过可迁移性权重调整,避免未知故障样本干扰分布对齐:
[ \mathcal{L}_{\text{adv}} = \frac{1}{nj} \sum{i=1}^{n_j} \mathcal{J}(d_j(g_j(f(x_s^j))), d_i) + \frac{1}{nt} \sum{i=1}^{n_t} w_t^i \mathcal{J}(d_j(g_j(f(x_t))), d_i) ]
在三个旋转机械数据集(CWRU、RM、Gearbox)上验证OSMDA性能:
- 数据集:涵盖不同转速、负载条件下的轴承与齿轮故障。
- 对比方法:包括DANN、MSSA、OSVM等传统域自适应与开集方法。
- 评价指标:整体诊断准确率与未知故障检测率。
该方法适用于工业场景中设备状态监测,尤其适合故障模式动态变化的复杂环境(如风电齿轮箱、高铁轴承)。