这篇文档属于类型a(单篇原创研究论文)的报告,以下是详细的学术报告内容:
本文由Martin Andrae(瑞典林雪平大学)、Tomas Landelius(瑞典气象水文研究所)、Joel Oskarsson和Fredrik Lindsten(林雪平大学)合作完成,发表于ICLR 2025(国际学习表征会议)。代码已开源在GitHub(martinandrae/continuous-ensemble-forecasting)。
科学领域:
研究属于机器学习天气预测(Machine Learning Weather Prediction, MLWP)领域,旨在通过数据驱动模型替代传统的数值模拟(Numerical Weather Prediction, NWP)。
研究动机:
传统NWP依赖物理模型和超算,计算成本高;而现有MLWP模型(如扩散模型)虽能生成概率性集合预报(ensemble forecasts),但仍存在两大缺陷:(1) 需通过自回归(autoregressive)逐步生成预报,计算量大;(2) 高时间分辨率下误差累积严重(如12小时步长限制)。
目标:
提出连续集合预报(Continuous Ensemble Forecasting)框架,支持并行生成时间连续的集合轨迹,无需自回归步骤,并允许任意时间分辨率的预报。
(1)问题建模
研究针对全球天气预报任务,定义为初始值问题:给定历史天气状态( x(\omega) ),预测未来轨迹( x(t) )的条件分布( p(x(t) | x(\omega)) )。
(2)扩散模型设计
- 基础架构:采用U-Net结构的条件扩散模型,输入噪声水平( \sigma )和预报时间( t ),通过概率流常微分方程(Probability Flow ODE,公式2)生成样本。
- 创新点:
- 时间连续生成:通过固定噪声( z )或关联噪声过程(如Ornstein-Uhlenbeck过程,算法2)确保不同时间步的预报在轨迹上连续。
- 混合预测模式:结合自回归(24小时大步长)与连续预报(1小时小步长),提出ARCI(Autoregressive Rollouts with Continuous Interpolation)方法(算法3),兼顾长时预报稳定性和高分辨率需求。
(3)实验设置
- 数据:使用ERA5再分析数据集(5.625°分辨率,1小时时间步),变量包括500 hPa位势高度(z500)、850 hPa温度(t850)、地面温度(t2m)和风速(u10/v10)。
- 对比模型:
- 确定性模型(单步6小时预报)
- 自回归扩散模型(AR-6h/AR-24h)
- 潜变量模型(Graph-EFM)
- 动态扩散模型(Dyffusion)
- 评估指标:RMSE(均方根误差)、CRPS(连续分级概率评分)、SSR(扩展技能比)。
(1)预报性能
- 高时间分辨率:ARCI-24/6h在1小时分辨率下,10天预报的RMSE与24小时步长自回归模型相当,显著优于线性插值(图8)和Dyffusion(图10)。
- 例如,t850的CRPS在10天时为1.63,优于AR-6h的1.69和Graph-EFM的1.77(表7)。
- 概率性质量:SSR接近1,显示集合预报的离散度与误差匹配良好,但扩散模型略欠分散(SSR < 1)。
(2)时间连续性验证
通过时间差(∆x)衡量预报轨迹的连续性(图5):固定噪声(ρ=0)时,∆x与真实数据接近;而随机噪声(ρ→∞)导致轨迹突变。
(3)计算效率
ARCI-24/6h的并行采样使单成员10天预报耗时从32秒(AR-6h)降至8秒。
科学价值:
- 首次在扩散模型中实现非自回归的连续集合预报,解决了高时间分辨率与误差累积的矛盾。
- 提出噪声关联机制,为时空生成模型的连续性提供了理论框架(附录E证明)。
应用价值:
- 支持1小时分辨率的10天全球预报,适用于极端天气监测和可再生能源调度。
- 框架可扩展至其他时空预测任务(如湍流模拟、气候建模)。
全文通过理论推导、算法设计、实验验证三部分,为MLWP领域提供了高效且可解释的概率预报新范式。