分享自:

使用神经网络进行天气和气候预测:以不同复杂度的通用环流模型为研究基础

期刊:geosci. model dev.DOI:10.5194/gmd-12-2797-2019

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


作者及机构
本研究由Sebastian Scher(斯德哥尔摩大学气象学系与Bolin气候研究中心)和Gabriele Messori(斯德哥尔摩大学与乌普萨拉大学地球科学系)合作完成,发表于2019年7月的期刊《Geoscientific Model Development》(GMD),标题为《Weather and climate forecasting with neural networks: using general circulation models (GCMs) with different complexity as a study ground》。


学术背景

研究领域与动机
该研究属于气象学与气候建模领域,聚焦于神经网络在天气和气候预测中的应用。传统数值天气预报(Numerical Weather Prediction, NWP)依赖物理方程,计算成本高昂。近年来,深度学习在图像识别等领域的成功促使研究者探索其替代NWP的潜力。然而,神经网络能否处理气候系统的复杂性(如季节性变化)尚不明确。因此,作者旨在通过简化的大气环流模型(General Circulation Models, GCMs)作为“简化现实”,评估神经网络的预测能力。

科学问题
1. 神经网络预测技能如何随训练数据量变化?
2. 气候模型的复杂性如何影响预测准确性?
3. 神经网络能否稳定模拟包含季节性循环的气候?


研究流程

1. 气候模型配置

研究对象
研究使用两种GCMs:
- PUMA(Portable University Model of the Atmosphere):干燥动力核心模型,无海洋和地形。
- PLASIM(Planet Simulator):包含地形和简化物理过程的中等复杂度模型。

实验设计
- 模型分辨率:T21(约5.65°)和T42(约2.8°),垂直10层。
- 运行时长:每种配置运行830年,剔除前30年“spin-up”,保留800年数据。
- 额外实验:关闭PUMA的季节性循环(pumat21_noseas),用于对比。

2. 复杂性量化

方法
通过局部维度(local dimension, *d*)量化模型输出复杂性,反映系统自由度。计算基于500 hPa位势高度(geopotential height)的相空间距离,对比ERA-Interim再分析数据。
结果
- PLASIM的复杂性接近真实大气(ERA-Interim),PUMA随分辨率增加而复杂度升高(图1)。

3. 神经网络架构

设计
- 采用卷积编码器-解码器(convolutional encoder-decoder),输入输出均为3D场(变量:u, v, T, z;10个气压层)。
- 训练目标:1天预测,长时预测通过迭代反馈实现。
- 创新点:首次在包含季节性循环的GCMs中测试该架构。

训练设置
- 训练数据量:1至800年,短周期(≤20年)重复4次以减少随机性。
- 验证:最后10%数据用于验证,防止过拟合。

4. 评估指标

  • 均方根误差(RMSE):衡量预测与真实值的偏差。
  • 异常相关系数(ACC):评估空间异常场的一致性。

主要结果

1. 预测技能与模型复杂性

  • PUMA无季节性模型pumat21_noseas)预测误差最低,ACC最高(图3)。
  • PLASIM:尽管复杂性高,但1天预测技能与PUMA相近;长时预测(>6天)误差显著增加,尤其在风暴轨迹区域(图4)。
  • 分辨率影响:高分辨率(T42)模型预测技能未显著优于低分辨率(T21)。

2. 训练数据量的影响

  • 训练数据量超过100年后,技能提升有限(图5),表明模型相空间已被充分覆盖。
  • 反直觉现象:PLASIM在100-200年训练数据时,6天预测技能下降,可能因非线性误差增长。

3. 气候模拟挑战

  • 季节性循环:神经网络难以稳定模拟季节性变化,常出现“跳过夏季”等异常(图6)。
  • 长期偏差:PLASIM的均值气候较准确,但PUMA存在显著偏差(图7)。

4. 其他发现

  • 水文循环变量:加入湿度等变量反而降低预测技能(图S20)。
  • 再分析数据测试:在ERA5数据上,24小时训练步长的预测效果最佳(图8),与Dueben和Bauer(2018)的1小时步长结论不同。

结论与价值

科学意义
1. 验证了神经网络在简化GCMs中短期预测的可行性,为替代NWP提供了理论基础。
2. 揭示了数据量、模型复杂性与预测技能的非线性关系,指出100年训练数据可能是“饱和点”。
3. 季节性循环是神经网络气候模拟的主要瓶颈,需进一步优化架构(如分月训练)。

应用价值
- 低计算成本的神经网络预测可支持大规模集合预报。
- 气候模型数据可复用为训练资源,提升实时预报效率。


研究亮点

  1. 方法创新:首次在多种复杂度的GCMs中系统测试神经网络预测能力。
  2. 复杂性量化:引入局部维度(*d*)作为客观指标,避免主观排名。
  3. 挑战性发现:季节性循环显著降低气候模拟稳定性,为后续研究指明方向。

补充价值
- 公开代码与数据(Zenodo),支持可重复性研究。
- 提出改进方向:球形卷积层(spherical convolution)可能缓解极区网格畸变问题。


此研究为深度学习在气象领域的应用提供了关键基准,同时揭示了当前技术的局限性,为后续算法开发奠定了实证基础。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com