本研究由昆明理工大学的Longfei Guo(第一作者及通讯作者)、Yunwei Pu和Wenxiang Zhao合作完成,论文《CNN-BiLSTM Daily Precipitation Prediction Based on Attention Mechanism》于2025年3月15日发表在期刊Atmosphere(2025年第16卷,第333页),论文开放获取,遵循CC BY 4.0许可协议。
研究领域与动机
日降水量预测是气象学和水文学的核心课题,对防洪减灾、农业灌溉和城市规划至关重要。然而,降水数据的非线性和非平稳性特征导致传统深度学习模型(如LSTM、CNN)的预测可靠性不足,尤其在极端天气事件中表现不佳。为解决这一问题,本研究提出了一种融合主成分分析(PCA, Principal Component Analysis)、卷积神经网络(CNN, Convolutional Neural Network)、双向长短期记忆网络(BiLSTM, Bidirectional Long Short-Term Memory)和注意力机制(Attention Mechanism)的新型模型(PCA-CNN-BiLSTM-Attention),旨在提升降水预测的精度与鲁棒性。
科学目标
1. 通过PCA降低高维气象数据的冗余性,提取关键主成分;
2. 结合CNN的空间特征提取能力与BiLSTM的时间依赖性建模优势;
3. 引入注意力机制动态加权关键时间步特征,优化极端降水事件的预测性能;
4. 以中国昆明为案例验证模型的有效性。
研究对象与数据来源
使用中国气象数据网发布的昆明站(站点编号56778)1953年1月1日至2019年12月31日的日尺度气象数据,共24,472天,包括气温(tem)、相对湿度(rhu)、风速(win)、蒸发量(evp)、降水量(pre)、日照时数(ssd)和气压(prs)。缺失数据通过线性插值补充。
PCA降维流程
1. 标准化:按公式 ( x^*{ij} = \frac{x{ij} - \bar{x}_j}{\sqrt{\text{Var}(x_j)}} ) 归一化数据;
2. 计算相关系数矩阵:( R = \frac{X^{T}X^}{n-1} );
3. 特征提取:求解特征值 ( \lambda_i ) 和特征向量 ( \mu_i ),按方差贡献率(85%、90%、95%阈值)选择主成分。
PCA-CNN-BiLSTM-Attention模型架构
1. CNN层:一维卷积核(输入维度6,序列长度10)提取局部时空特征,ReLU激活函数,最大池化降维;
2. BiLSTM层:双向LSTM单元(遗忘门、输入门、输出门结构)捕获前后向时间依赖关系;
3. 注意力机制层:计算隐藏状态权重 ( a{ti} = \frac{\exp(s{ti})}{\sumk \exp(s{tk})} ),聚焦关键时间步;
4. 全连接层:线性回归输出降水量预测值。
参数设置
- 训练集:验证集:测试集=7:2:1;
- 批次大小(batch_size)=64,学习率=0.001,迭代次数(epochs)=200;
- 随机失活(dropout)=0.3以防止过拟合。
对比模型
- 基准模型:LSTM、CNN-LSTM、CNN-BiLSTM、CNN-BiLSTM-Attention;
- 鲁棒性测试:添加高斯噪声(标准差0.1~1.0)评估抗干扰能力。
评价指标
- Nash效率系数(NSE)、均方根误差(RMSE)、平均绝对误差(MAE);
- 相关系数(R)、均值偏差(α)、标准差比率(β)。
注意力机制有效提升了极端降水事件的捕捉能力。如图5所示,模型在2018-2019年730天的测试周期内,对暴雨事件的预测与实际观测高度一致。
随着高斯噪声强度增加(标准差0.1→1.0),模型NSE平滑下降(95%阈值下仍保持>0.85),表明PCA降维显著提升了抗数据扰动能力。
科学意义
1. 首次将PCA与CNN-BiLSTM-Attention融合,解决了降水数据的高维非线性问题;
2. 注意力机制的动态加权策略优化了时间步特征选择,提升了极端值预测精度;
3. 为短时降水预测提供了可解释的深度学习框架。
应用价值
- 防灾减灾:24小时暴雨预警可辅助昆明市应急部门启动防洪预案;
- 农业与生态:优化高原湖泊(如滇池)生态补水决策;
- 城市规划:支持排水系统设计以减少内涝风险。
(全文约1,800字)