这篇文档属于类型a,是一篇关于复杂设备故障诊断的原创性研究论文。以下为针对该研究的学术报告:
大型语言模型在复杂设备故障诊断中的应用:FD-LLM方法研究
作者与机构
本研究由哈尔滨工业大学机电工程学院的Lin Lin、Sihao Zhang*、Song Fu*和Yikun Liu合作完成,发表于期刊Advanced Engineering Informatics 2025年第65卷,文章编号103208。
科学领域与问题背景
研究聚焦于复杂机械装备故障诊断领域,核心挑战在于传统深度学习模型存在两大局限:
1. 场景依赖性:需针对不同故障场景单独设计模型(”one model for one scenario”),导致泛化性差;
2. 特征混淆:不同故障类别的特征空间重叠严重,易引发误诊。
研究动机
多模态大语言模型(Multimodal Large Language Model, MM-LLM)在跨模态理解与逻辑推理方面展现出强大能力,但现有MM-LLM缺乏针对工程时间序列数据的领域知识和对齐训练。本研究提出FD-LLM方法,通过模态对齐、模糊语义嵌入等技术,实现航空发动机等复杂设备的高精度故障诊断。
目标
- 激活LLM对工程时间序列数据的理解能力
- 解决特征空间模式混淆导致的分类难题
- 开发可迁移至不同设备的通用诊断框架
研究对象
- 数据来源:航空发动机传感器采集的4维时间序列数据(degt, egtm, dn2, dff),包含正常状态与3类故障(EGT指示故障、TAT指示故障、HPT叶片烧蚀故障),每类200个样本(80%训练/20%测试)。
- 文本生成:采用组合提示模板生成结构化描述文本(如”This {bearing} has…{inner race fault}“),形成数据-文本对。
关键技术
- 数据编码器:基于LSTM网络,将时间序列映射为与LLM文本嵌入同维的特征向量(维度rd)。
- 对比学习对齐:冻结LLM文本编码器(Vicuna-7b),通过余弦相似度计算正负样本对损失(公式3-6),最小化跨模态特征距离。
创新方法
针对特征空间重叠问题:
1. 计算测试样本与所有已知故障文本嵌入的相似度(公式7)
2. 通过Softmax归一化得到模糊权重α(公式8)
3. 加权融合生成模糊语义嵌入tq(公式9),保留类别间关联性
优势:利用LLM的语义推理能力,缓解硬分类边界导致的误判。
混合提示设计
- 连续提示:可学习的参数矩阵,通过梯度下降优化
- 离散提示:结构化自然语言模板(如”### human: …### assistant:“)
高效微调
采用LoRA(Low-Rank Adaptation)方法,仅调整低秩矩阵(秩r=32),显著降低计算开销。
在航空发动机数据集上:
- 准确率94.38%,较最优基线(Attention-GRU)提升10%
- 精确率95.35%,F1分数93.85%
关键突破:对特征重叠样本的分类准确率提升12.6%。
科学价值
1. 首次实现LLM对工程时间序列的端到端理解,突破传统MM-LLM的模态限制
2. 提出模糊语义嵌入理论,为特征不确定性问题提供新解法
应用价值
- 可迁移性:方法已成功应用于航空发动机、轴承、液压系统等多类设备
- 工程实用性:推理单次耗时<0.5秒(RTX 4090),满足实时诊断需求
其他贡献
- 开源航空发动机故障数据集(含800个样本)
- 提出滑动窗口采样法(窗口长度L=10,步长S=10)优化时间序列处理
该研究为智能诊断领域提供了LLM落地的完整技术路径,相关方法已被应用于国内某航空公司的预测性维护系统。