分享自:

分布式光伏系统中经济高效数据驱动故障检测与诊断的方法论综述

期刊:applied energyDOI:10.1016/j.apenergy.2025.126636

分布式光伏系统中经济高效的数据驱动故障检测与诊断方法综述

作者及机构
本综述由Yinyan Liu(悉尼大学综合可持续性分析学院)、Earl Duran(Diagno Energy Pty Ltd)、Anna Bruce(新南威尔士大学光伏与可再生能源工程学院)等来自澳大利亚多所高校及企业的学者合作完成,发表于2025年的《Applied Energy》期刊(卷401,文章编号126636)。

研究背景与目标
随着光伏(PV, Photovoltaic)技术的快速发展和分布式光伏系统的广泛应用,如何通过经济高效的数据驱动方法实现可靠的故障检测与诊断(FDD, Fault Detection and Diagnosis)成为关键挑战。传统方法依赖高成本的图像数据(如红外热成像)或实验室环境的小规模数据集,难以适用于中小型分布式光伏系统。本文旨在提出一种基于时间序列电气参数(如电流、电压、功率)和气象数据的系统性方法论框架,填补工业实践与学术研究间的鸿沟,并为不同数据可用性场景下的算法选择提供指导。

主要内容与观点

  1. 光伏系统故障分类方法
    作者提出两种故障分类策略:

    • 按位置分类:分为直流侧(DC-side)与交流侧(AC-side)故障。直流侧故障包括模块退化(degradation)、局部阴影(partial shading, PS)、开路(open circuit, OC)、短路(short circuit, SC)等;交流侧故障则涉及逆变器故障、电网电压频率异常等。
    • 按严重性分类:分为软故障(soft faults,如积尘、轻微老化)和硬故障(hard faults,如完全开路、火灾风险高的线路故障)。
      支持依据:通过分析澳大利亚商业光伏系统的真实数据集,作者构建了包含故障严重性等级和维修成本的故障库(fault library),例如直流侧LL(line-to-line)故障的修复成本显著高于交流侧逆变器限幅(clipping)故障。
  2. 数据可用性与处理方法
    强调低成本时间序列数据的核心地位,包括:

    • 电气参数:直流侧(如阵列电流(I_A)、电压(VA))、交流侧(如逆变器输出功率(P{AC}))。
    • 气象数据:辐照度(GHI, Global Horizontal Irradiance)、环境温度((T_{amb}))。
      公开数据集短板:目前仅有少数数据集(如PVDAQ、NIST PV数据集)包含标记故障,且故障类型有限。作者推荐使用PVLib、PVsyst等软件模拟理论I-V曲线(电流-电压曲线),作为故障诊断的基准。
  3. 传统统计与机器学习算法对比

    • 统计方法:基于性能指标(如性能比PR, Performance Ratio)或I-V曲线偏差分析,适合数据标签稀缺的场景。例如,通过比较相邻光伏系统的发电量(P2P算法)可检测异常。
    • 机器学习方法
      • 监督学习:支持向量机(SVM)、随机森林(RF)在标记数据充足时表现优异(如诊断SC和OC故障的准确率>90%)。
      • 半监督学习:结合少量标记数据与聚类(如K-means)或自编码器(autoencoder),解决实际中标记数据稀缺问题。
      • 边缘计算:部署轻量化模型(如轻量级CNN)至树莓派等边缘设备,实现实时故障诊断,降低云计算依赖。
  4. 关键挑战与未来方向

    • 数据局限性:现有算法多基于仿真或实验室数据,真实场景噪声(如气象波动)影响泛化能力。
    • 算法可解释性:黑箱模型(如深度学习)需结合特征工程提升诊断逻辑透明度。
    • 标准化数据集:呼吁建立包含多元故障类型的公开数据集,以支持算法横向对比。

学术价值与应用意义
本综述为工业界提供了按数据可用性选择算法的决策框架(如无标签数据时采用聚类,少量标签时采用半监督学习),并推动学术界关注低成本数据驱动的FDD研究。提出的故障库和边缘计算方案可直接指导光伏运维(O&M, Operation and Maintenance)实践,降低系统停机时间和维护成本。

亮点与创新
- 方法论创新:首次将算法分类与数据可用性(如标记数据量、电气参数类型)直接关联,形成层次化框架。
- 工业视角故障库:基于真实运维数据量化故障的经济影响,填补了学术研究中故障严重性分析的空白。
- 跨领域融合:结合传统统计方法与前沿机器学习,平衡算法成本与精度,适配分布式光伏的多样化需求。

其他有价值内容
文中对比了12种公开数据集(表1)和20余种算法的适用场景(表4-5),并开源了用于I-V曲线分析的代码库,可作为后续研究的基准工具。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com