本研究的通讯作者为Xiaoxuan Jiao(空军工程大学航空工程学院),合作作者包括Xiangzhen Meng、Bo Jing、Shenglong Wang、Jinxin Pan和Yifeng Huang,均来自同一机构。研究成果发表于Sensors期刊2024年第24卷第231期,DOI号为10.3390/s24010231,出版时间为2023年12月30日。
本研究属于航空器预测与健康管理(Prognostics and Health Management, PHM)领域,针对当前飞机故障诊断中存在的三大核心问题:
1. 过度依赖传统经验
2. 故障排查鲁棒性差
3. 维护人员对故障变化的响应速度慢
传统PHM方法主要基于物理模型(Physical Model)和数据驱动(Data-Driven)两种范式,但前者需要完整的系统物理结构认知,后者受限于飞机传感器部署不足导致的数据匮乏。而航空领域积累的大量半结构化故障案例文本(如飞行控制系统手册、典型故障案例)尚未被有效利用。
研究团队提出采用知识图谱(Knowledge Graph)技术解决上述问题,其优势在于:
- 通过语义关系连接多源异构数据
- 支持符号表示与向量表示的双重知识表达
- 可视化交互便于人机协作
采用自上而下(Top-Down)与自下而上(Bottom-Up)混合方法:
- 模式层(Schema Layer):预先定义9类实体(如部件、故障现象、故障原因)和7类关系
- 数据层(Data Layer):通过实体抽取、关系抽取、知识融合三阶段构建,动态反馈更新模式层
针对故障文本的语义复杂性,开发基于ERNIE(Enhanced Representation through kNowledge IntEgration)的预训练分类模型:
- 输入数据:1000份故障文本(700训练/300测试),包含故障现象、处理过程、原因、影响四类
- 模型对比:ERNIE模型以94.51%的F1值优于BERT系列模型(最高91.22%)
- 创新点:引入文本分类信息作为实体关系抽取的门控机制,降低特殊文本对三元组提取的干扰
提出ERNIE-BiLSTM-CRF-TreeBiLSTM混合模型:
- 架构创新:
- 底层:ERNIE生成上下文语义向量
- 中层:序列BiLSTM捕获上下文特征
- 顶层:基于语法依赖树的TreeBiLSTM解析句法结构
- 性能对比:在自建数据集上取得85.09%的F1值,显著优于CasRel(72.11%)和GPLinker(74.62%)
- 技术突破:
- 通过依存树结构减少语言复杂性
- 联合训练避免传统流水线方法的误差累积
构建包含六大功能模块的管理平台:
1. 文本分类:ERNIE_RCNN模型自动分类
2. 知识抽取:联合模型生成三元组
3. 知识审核:人工校验与修正接口
4. 智能问答:基于Cypher查询的自然语言生成
5. 图谱可视化:Neo4j+Neovis.js动态展示
6. 数据管理:多源异构数据统一存储
平台采用Vue+FastAPI技术栈,硬件环境为Intel Core i7-10750H处理器与NVIDIA GTX 1660Ti显卡。
本研究得到陕西省自然科学基金(2022JQ-586)支持,相关技术已申请多项发明专利。平台代码与部分数据集计划开源以促进领域发展。