分享自:

基于知识图谱和多任务学习的工业生产关键设备故障诊断方法

期刊:中国科学 : 信息科学DOI:10.1360/ssi-2022-0060

学术报告:基于知识图谱和多任务学习的工业生产关键设备故障诊断方法

1. 研究团队与发表信息
本研究的通讯作者为南京航空航天大学自动化学院的冒泽慧(Zehui Mao),合作作者包括卞嘉楠、姜斌、马亚杰及北京控制工程研究所的刘文静。研究发表于《中国科学:信息科学》(*Scientia Sinica Informationis*)2023年第53卷第4期,标题为《基于知识图谱和多任务学习的工业生产关键设备故障诊断方法》(*Fault Diagnosis Method of Critical Industrial Equipment Based on Knowledge Graphs and Multi-Task Learning*)。

2. 学术背景与研究目标
科学领域:本研究属于工业智能运维与故障诊断领域,结合知识图谱(Knowledge Graph, KG)与多任务学习(Multi-Task Learning, MTL),解决工业生产关键设备(如航空发动机、电力设备等)的故障诊断问题。
研究动机:工业生产设备长期运行易发生故障,传统方法(如人工查询维修手册或专家系统)依赖人工维护且难以应对数据稀疏性和知识更新快的挑战。知识图谱虽能结构化存储故障知识,但现有图推理技术面临长尾分布(long-tail distribution)和孤立节点问题,导致诊断准确性不足。
研究目标:提出一种新型故障诊断模型MKFD(Multi-task learning for Knowledge graph-enhanced Fault Diagnosis),通过融合知识图谱与多任务学习框架,提升故障根因推断的准确性和泛化能力。

3. 研究方法与流程
3.1 知识图谱构建
- 数据来源:国内某工业企业的5800个三元组(故障现象-根因-关系),涵盖结构化与非结构化运维数据。
- 构建流程:采用自顶向下方法,包括本体定义(故障现象、根因、零部件等实体类型)、实体抽取(深度自注意力网络标注)、分类(循环卷积网络)及存储(Neo4j图数据库)。最终构建两个知识图谱(图谱1:1972实体/5347关系;图谱2:3825实体/7281关系)。

3.2 多任务学习框架设计
MKFD模型包含三个核心模块:
- 改进十字绣单元(Improved Cross-Stitch Unit)
传统十字绣单元(Cross-Stitch Network)使用标量参数建模任务间共享关系,但面对文本特征时表达能力不足。本研究将其改进为向量点积运算,通过特征交互矩阵(公式4-5)和降维投影(公式6-7)实现细粒度信息共享。
- 关联矩阵嵌入模块(Interaction Matrix Embedding, IME)
输入为故障现象-根因关联矩阵(公式1),使用一维卷积神经网络(1D-CNN)提取故障现象特征,改进十字绣单元提取故障根因特征,最终通过多层感知机(MLP)预测根因概率(公式11)。
- 知识图谱嵌入模块(Knowledge Graph Embedding, KGE)
输入为知识图谱三元组(头实体h、关系r、尾实体t),采用改进十字绣单元提取头实体特征,MLP提取关系特征,通过评分函数(公式14)优化尾实体预测。

3.3 训练与优化
- 交替训练策略:固定IME参数训练KGE,再固定KGE参数训练IME,通过损失函数(公式15)联合优化,避免特征负迁移。
- 超参数设置:多层感知机层数l=k=2,交替训练轮次t=2,权重超参数λ=0.1。

4. 主要研究结果
4.1 性能对比实验
在点击率预测(AUC、F1-score)和最优推荐(Precision@k、Recall@k)指标上,MKFD显著优于基线模型:
- 对比模型:包括传统方法FM(Factorization Machine)、BPR(Bayesian Personalized Ranking)及知识图谱方法CFKG(Collaborative Filtering based on KG)、CKE(Collaborative Knowledge Embedding)。
- 结果:MKFD在故障知识图谱1上的AUC达0.852(表2),图谱2上Precision@10提升15%(图9),证明其应对数据稀疏性的优势。

4.2 关键创新验证
- 改进十字绣单元:通过向量交互矩阵(公式4)实现故障根因与头实体的细粒度关联,解决了传统标量参数表达能力不足的问题。
- 多任务协同:IME与KGE的交替训练避免了联合学习中的信息丢失,提升了模型泛化性。

5. 研究结论与价值
科学价值
- 提出首个融合知识图谱与多任务学习的工业故障诊断框架,为数据稀疏场景提供新思路。
- 改进十字绣单元为多任务学习中的特征共享机制提供了通用优化方法。
应用价值
- 可扩展至航空、电力等领域的智能运维系统,降低人工维护成本。
- 知识图谱的动态更新特性支持快速适应新型故障模式。

6. 研究亮点
- 方法创新:改进十字绣单元与交替训练策略的结合是核心创新点。
- 工程落地性:基于真实工业数据验证,模型可直接部署至现有运维平台。
- 跨领域意义:框架可迁移至其他需结合先验知识与数据驱动的诊断场景(如医疗、交通)。

7. 其他价值
研究获“科技创新2030—新一代人工智能”重大项目(2020AAA0109305)支持,体现了国家战略需求导向。未来计划融合更多深度学习模型(如Transformer)以进一步提升泛化性能。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com