《数据科学与管理》(*Data Science and Management*)期刊2022年第5期刊载了题为《New Developments in Wind Energy Forecasting with Artificial Intelligence and Big Data: A Scientometric Insight》的综述论文。该研究由西安交通大学管理学院Erlong Zhao、Shaolong Sun(通讯作者)及中国科学院数学与系统科学研究院Shouyang Wang合作完成,旨在系统梳理人工智能(Artificial Intelligence, AI)与大数据(Big Data)技术在风电预测领域的研究进展。以下为论文核心内容的学术报告:
作者团队来自中国顶尖研究机构:西安交通大学管理学院与中国科学院数学与系统科学研究院。论文发表于2022年6月,隶属于能源管理与数据科学的交叉领域。研究动机源于风电预测对提升能源效率的关键作用,而现有文献缺乏对AI与大数据技术在该领域应用的系统综述。研究目标包括:
1. 分类过去20年风电预测中的数据类型、分析技术与方法;
2. 结合文献计量与内容分析,揭示研究热点与前沿趋势;
3. 总结技术挑战与未来方向。
论文指出,风电数据可分为内部数据(如风机转速、故障记录)和外部数据(如气象卫星数据、环境湿度)。数据形态涵盖结构化时间序列与非结构化文本、图像(如卫星云图)。开放数据集(如美国NREL、欧洲Eurostat)为研究提供了基准。
- 论据:表格列举了6个主流开放数据集的地理位置、数据类型及更新频率(如Elia比利时电网的每小时风速数据)。
- 意义:多源异构数据的整合是提升预测精度的基础,但非结构化数据的应用仍待探索。
研究通过文献计量工具(CiteSpace、VOSviewer)分析了2001–2021年的210篇文献,发现技术发展分为三个阶段:
- 早期(2007–2017):以统计方法(如ARMA模型)和物理模型为主,依赖历史风速时间序列。
- 爆发期(2018–2021):机器学习(如SVM、随机森林)与深度学习(如LSTM、CNN)成为主流,结合分解技术(如小波变换、EMD)处理非平稳信号。
- 前沿方向:混合模型(如VMD-GA-LSTM)通过集成多方法优势显著提升精度。
- 数据支持:图2显示2018年后年发文量呈指数增长(R²=0.9749),中国贡献了31%的论文(99篇),但国际合作较弱(图5)。
关键词聚类分析(图7)显示核心热点包括:
- 数据预处理:缺失值插补、降噪(如小波去噪)、归一化(表5)。
- 特征工程:分解技术(如EMD将风速分解为IMF分量)与特征降维(如PCA、自动编码器)。
- 预测方法:四类模型对比(表7-10):
- 统计方法(如SARIMA)适合短期预测;
- 物理方法依赖气象模拟;
- 智能方法(如LSTM)擅长捕捉非线性关系;
- 混合方法(如EEMD-GA-LSTM)通过分解-优化-集成框架降低误差(MAE改进20–30%)。
论文提出三大挑战:
1. 多模态数据融合:如何有效整合卫星图像与SCADA系统数据;
2. 模型可解释性:深度学习黑箱问题制约工业应用;
3. 计算效率:Hadoop/Spark等分布式技术需进一步适配实时预测。
- 建议方向:开发轻量化AI模型、增强不确定性量化、结合边缘计算。
本文填补了风电预测领域系统性综述的空白,揭示了数据驱动与AI技术的融合潜力,同时指出未来需突破多模态数据处理与模型可解释性瓶颈。研究结果为学术界与工业界提供了技术路线图,尤其对高比例可再生能源电网的稳定性管理具有重要参考价值。