FD-LLM：用于复杂设备故障诊断的大语言模型

分享自：
FD-LLM：用于复杂设备故障诊断的大语言模型

生物医学工程
工程学
期刊:Advanced Engineering InformaticsDOI:10.1016/j.aei.2025.103208
【点击此处】阅读全文、收藏及针对性提问
关于FD-LLM：用于复杂设备故障诊断的大语言模型的学术研究报告
一、 研究团队与发表信息
本研究的主要作者为 Lin Lin, Sihao Zhang, Song Fu, Yikun Liu。根据文末的致谢部分，该研究获得了中国国家自然科学基金重点项目（No. U2133202）、国家自然科学基金（No. 52305570）等多个国家级及省级项目的支持，表明研究团队很可能来自中国的高校或研究机构，并与航空航天或复杂机械装备健康管理领域密切相关。该项原创性研究成果以题为“FD-LLM: Large Language Model for Fault Diagnosis of Complex Equipment”的全长文章形式，发表于国际学术期刊《Advanced Engineering Informatics》2025年5月出版的第65卷（Part A），文章识别码为103208。
二、 研究学术背景
本研究的主要科学领域为复杂机械装备的智能故障诊断（Intelligent Fault Diagnosis）与预测与健康管理（Prognostics and Health Management, PHM），并交叉融合了人工智能领域的前沿方向——多模态大语言模型（Multimodal Large Language Model, MM-LLM）。
研究团队开展此项工作的背景与动机源于当前智能故障诊断领域面临的双重挑战。一方面，传统的基于深度学习的故障诊断方法（如TCN、GRU、Informer等）通常遵循“一个场景一个模型”的范式，需要针对不同应用场景进行专门的模型设计与训练，算法和参数选择敏感，调优工作繁重，难以适应动态的生产环境，且不符合通用人工智能（AGI）的愿景。更重要的是，复杂设备不同故障类别的特征在特征空间中往往存在严重重叠（模式混叠），极易导致误诊。
另一方面，以GPT、GLM为代表的大语言模型（LLM）及其多模态扩展（MM-LLM）展现出了强大的多模态理解与逻辑推理能力，为故障诊断提供了新的可能性。然而，现有的MM-LLM主要基于互联网规模的图像、文本等通用模态数据进行预训练，缺乏针对工程领域特定模态——尤其是来自复杂机械装备传感器的时间序列数据——的领域知识以及模态对齐训练。这导致现有MM-LLM无法直接有效理解和处理工程时间序列数据，限制了其在工业故障诊断任务中的应用潜力。
因此，本研究旨在解决上述核心矛盾。其目标是将MM-LLM的强大能力引入复杂装备故障诊断领域，具体而言：以航空发动机故障诊断为应用背景，提出一种基于MM-LLM的新型故障诊断方法（FD-LLM），通过创新的技术手段，使LLM能够理解并基于工程时间序列数据进行故障诊断，从而获得更高的诊断精度，并探索AGI在工业领域的应用路径。
三、 研究详细工作流程
本研究提出FD-LLM方法，其核心工作流程主要包含两个关键阶段：数据-文本模态对齐训练 和 基于大模型的故障诊断微调。整个研究并非传统的“数据采集-特征工程-模型训练”流水线，而是围绕如何将非结构化的工程时间序列数据“翻译”成大语言模型能够理解并进行推理的“语言”这一核心问题展开。
第一阶段：数据-文本模态对齐训练 此阶段的核心目标是训练一个能够将时间序列工程数据映射到LLM文本特征空间的编码器，从而“激活”LLM理解时间序列模态的能力。 1. 研究对象与数据准备：研究使用了来自航空发动机传感器的工程时间序列数据（如振动、声音等）及其对应的设备运行状态描述文本。这些数据是典型的多维、高频、可能含有噪声的工业传感器数据，可读性差。研究面临数据稀缺的挑战，因为对于航空发动机等复杂装备，收集大量故障样本极为困难。 2. 处理方法与实验设计： * 数据编码器训练：研究首先需要训练一个专门的数据编码器（Data Encoder），用于将原始的时间序列工程数据向量化。这个过程并非简单特征提取，而是通过对比学习（Contrastive Learning） 进行训练。 * 模态对齐机制：具体而言，研究采用了一种“数据-文本对齐方法”。他们将描述设备状态的文本通过冻结的（Frozen）LLM文本编码器转换为文本嵌入（Text Embedding）。同时，将对应的时间序列数据通过待训练的数据编码器转换为数据嵌入（Data Embedding）。训练的目标是，让描述同一设备状态（如“正常”、“轴承故障”）的文本嵌入和数据嵌入在特征空间中的距离尽可能接近，而不同状态的嵌入距离尽可能远离。这个过程实现了工程数据模态与文本模态在LLM特征空间中的对齐。 * 模糊语义嵌入方法：针对工程数据中因模式相似导致特征空间混叠的难题，本研究提出了一项创新方法——模糊语义嵌入（Fuzzy Semantic Embedding）。该方法并非追求在特征空间中对数据进行精确的、非此即彼的划分，而是将工程数据映射到一个具有模糊语义的嵌入表示。这种表示保留了数据的核心模式信息，但容忍了一定的不确定性和重叠性，为后续利用LLM的语义推理能力进行精细判别奠定了基础。
第二阶段：基于大模型的故障诊断微调 此阶段的目标是将对齐后的多模态信息与领域知识注入LLM，并对其进行微调，使其能够执行故障诊断任务。 1. 研究框架构建：构建FD-LLM模型框架。该框架以预训练的多模态大语言模型（MM-LLM）为基础，集成了第一阶段训练好的数据编码器（用于将新输入的时间序列转换为对齐后的嵌入）。 2. 领域知识注入：为了解决MM-LLM缺乏特定领域知识的问题，研究引入了一种可学习的提示嵌入（Learnable Prompt Embedding）。具体做法是，在将工程数据（已转换为嵌入）输入LLM之后，额外添加一组可训练的提示向量。这些提示向量在微调过程中学习编码与故障诊断相关的背景知识（例如，特定故障模式的特征、设备运行约束条件等），从而将补充性的故障诊断知识引入LLM。 3. 模型微调策略：考虑到直接对庞大的LLM进行全参数微调计算成本高，且在小样本场景下易过拟合，本研究采用LoRA（Low-Rank Adaptation）方法对LLM进行微调。LoRA通过为模型中的权重矩阵添加低秩分解的适配器，仅训练这些新增的、参数量极小的适配器，而冻结原始LLM的大部分参数。这极大地降低了计算复杂度和内存需求，使在有限数据上高效微调大模型成为可能。 4. 工作流程总结：FD-LLM的最终工作流程为：对于新的工程时间序列数据，先使用训练好的数据编码器将其转换为模糊语义嵌入；将该嵌入与可学习的提示嵌入组合后，输入到经过LoRA微调的多模态大语言模型中；LLM基于其强大的语义理解和推理能力，对输入的嵌入进行分析，最终输出故障诊断结论或维护指导。
四、 研究主要结果
研究通过在多个数据集上的实验验证了FD-LLM方法的有效性和泛化性。 1. 模态对齐训练结果：实验结果表明，通过对比学习训练的数据编码器成功地将时间序列数据映射到了与文本语义对齐的特征空间。这通过定性或定量的方式（如可视化嵌入分布、计算对齐损失等）得到了验证。这意味着LLM能够“理解”工程数据嵌入所代表的设备状态语义，为后续推理提供了基础。此结果是后续所有诊断任务的前提，其成功直接关系到整个方法的可行性。 2. 故障诊断性能结果：研究在航空发动机数据集、CWRU轴承故障诊断数据集和一种凿岩台车数据集上进行了实验。 * 案例一（航空发动机）：在此核心数据集上进行了对比实验和消融实验。对比实验结果显示，FD-LLM在故障分类准确率上超越了传统的深度学习诊断方法（如TCN、GRU等），也优于直接使用现有MM-LLM或简单微调LLM的方法。这直接证明了所提出方法在提升诊断精度方面的有效性。消融实验则系统评估了各个组件的贡献：移除非模态对齐训练、移除模糊语义嵌入、移除可学习提示嵌入或改用全参数微调代替LoRA，均会导致模型性能出现不同程度的下降。这有力地支持了研究中提出的每个关键技术环节（模态对齐、模糊语义嵌入、提示知识注入、高效微调）的必要性和合理性。 * 案例二（跨数据集泛化）：在CWRU和凿岩台车数据集上的实验进一步证明了FD-LLM的优秀泛化能力（Portability）。这表明，经过特定领域（航空发动机）对齐和微调的FD-LLM，其数据编码器和LLM的推理能力能够迁移到其他类型的复杂机械装备故障诊断任务中，初步解决了机器学习中“一个模型对应一种数据”的普遍适用性问题。这一结果逻辑上承接了方法设计的目标——利用LLM的通用能力，而不仅仅是针对单一数据集的拟合。 3. 对模式混叠问题的解决效果：研究特别指出，在工程数据模式相似、特征空间混叠严重的情况下，FD-LLM通过推理模糊语义嵌入，仍然能够得出准确的语义结论。这证实了所提出的模糊语义嵌入方法结合LLM强大语义推理能力的优势，即不强行在数据特征空间进行艰难划分，而是将难题“上推”到LLM的语义推理层面来解决，从而克服了数据空间中的识别困难。这一结果是本研究核心创新点的重要实证。
五、 研究结论与价值意义
本研究得出结论：提出的FD-LLM是一种有效的、用于解决复杂机械装备（如航空发动机）故障诊断中因时间序列数据混叠导致分类困难的新方法。该方法通过数据-文本模态对齐、模糊语义嵌入、可学习提示知识注入和LoRA高效微调等一系列技术创新，成功地将大语言模型的多模态理解和逻辑推理能力应用于工业故障诊断领域。
其科学价值在于：第一，开创性地将多模态大语言模型与工程时间序列故障诊断深度结合，为智能故障诊断研究提供了一个全新的、基于AGI范式的研究方向。第二，提出的模糊语义嵌入方法，为处理特征空间混叠问题提供了新思路，即利用高层语义推理来弥补低层特征分辨的不足。第三，构建了一套完整的、包含模态对齐、知识注入和高效微调的工业大模型应用技术框架。
其应用价值在于：第一，能够获得比传统方法更高的故障诊断精度，有助于提升复杂装备的运行安全性和维护效率。第二，模型具备良好的泛化能力和可移植性，有望减少针对不同场景重复建模的成本，更适应动态工业环境。第三，以对话或交互形式工作的FD-LLM，可能为运维人员提供更直观、更丰富的诊断信息和维护指导，提升人机协作水平。
六、 研究亮点
研究范式新颖：首次系统地将多模态大语言模型（MM-LLM）引入复杂装备故障诊断这一垂直工业领域，打破了传统“一场景一模型”的局限，探索了AGI在工业中的应用路径。
核心技术创新： 针对性的模态对齐：设计了专门针对工程时间序列数据与文本的模态对齐训练方法，解决了LLM无法直接理解工业数据模态的核心障碍。
模糊语义嵌入：创造性地提出模糊语义嵌入概念来处理模式混叠问题，巧妙地将特征空间的分类难题转化为语义空间的推理问题，充分发挥了LLM的长处。
领域知识注入方式：采用可学习的提示嵌入，为LLM灵活、高效地注入特定领域知识，弥补了通用大模型领域知识不足的缺陷。
工程实践性：充分考虑工业场景中数据稀缺、计算资源有限的现实，采用LoRA进行高效微调，大幅降低了应用大模型的技术门槛和成本，使方法更具实用价值。
验证充分：不仅在本领域核心的航空发动机数据集上进行了深入的对比和消融分析，还通过跨数据集实验验证了方法的泛化能力，论证扎实。
七、 其他有价值内容
文中提到，研究团队长期专注于航空发动机等复杂机械装备的PHM研究，在故障诊断和剩余使用寿命预测方面已有大量前期成果和特定研究基础。这表明本研究的提出并非偶然，而是建立在深厚的领域知识积累之上。同时，文章也客观指出了当前智能故障诊断方法（如TCN、GRU、Informer）各自的局限性，为本研究工作的必要性提供了清晰的论证背景。此外，研究明确将航空发动机这一对安全性和可靠性要求极高的装备作为应用背景，凸显了该研究潜在的重大经济与社会价值。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问