ChaosBench:面向次季节至季节气候预测的多通道物理基准框架
作者及机构
本研究的核心团队来自哥伦比亚大学(Columbia University)、加州大学洛杉矶分校(UCLA)、加州大学欧文分校(UCI)、拉蒙特-多尔蒂地球观测所(LDEO)及英特尔实验室(Intel Labs),主要作者包括Juan Nathaniel、Yongquan Qu、Tung Nguyen等。研究成果发表于第38届神经信息处理系统会议(NeurIPS 2024)的数据集与基准赛道。
学术背景
次季节至季节(subseasonal-to-seasonal, S2S)气候预测是灾害防控与经济规划的关键工具,但其发展滞后于短期天气或长期气候预测。传统数值天气预报(Numerical Weather Prediction, NWP)依赖高分辨率物理模型,计算成本高昂且难以普及。数据驱动模型虽在短中期预测中表现优异,但S2S尺度因同时受初始条件(Initial Condition, IC)和边界条件(Boundary Condition, BC)的敏感性影响,预测难度显著增加。现有基准(如WeatherBench)的预测范围仅限15天,且缺乏物理约束与多样化基线模型。为此,研究团队提出ChaosBench,首个覆盖全球多地球系统(大气、海洋、冰层、陆地)、整合45年再分析数据与物理约束的S2S预测基准。
研究流程与方法
1. 数据构建
- 观测数据:整合ERA5(大气)、ORAS5(海洋)、LRA5(陆地)再分析产品,时间跨度为1979年至今,空间分辨率1.5°。包含124个变量(如温度、湿度、风速等),覆盖大气垂直10层压力面。
- 物理模型基线:提供四国气象机构(ECMWF、UKMO、NCEP、CMA)2016年以来的44天确定性及集合预报,共48个变量,用于对比数据驱动模型(如PanguWeather、GraphCast)。
- 辅助数据:包括气候态(climatology)和持续性(persistence)基准,用于评估模型技能。
基准指标设计
模型评估与策略验证
主要结果
1. 预测技能崩溃现象:所有模型在超过15天后预测性能接近无技能气候态(图4-5)。例如,ECMWF确定性预报的ACC在44天时降至0.2,与气候态无显著差异。
2. 集合预报优势:ECMWF的50成员集合将RMSE降低20%(图7),MS-SSIM提升10%,验证了IC不确定性建模的必要性。
3. 数据驱动模型的局限性:GraphCast等模型在S2S尺度出现显著谱散度(图6b),高频信号丢失导致预测模糊化(图3a),无法捕捉极端事件细节。
4. 当前预测极限:ECMWF高分辨率集合的CRPSS显示有效预测范围仅15-20天(图8),凸显S2S预测的挑战性。
结论与价值
ChaosBench为S2S预测提供了首个全耦合地球系统基准,其核心贡献包括:
1. 科学价值:揭示了数据驱动模型在长期预测中的物理不一致性,提出谱域指标作为可微分约束的优化方向。
2. 应用价值:支持灾害预警(如干旱、洪水)的决策优化,推动数据-物理融合模型(如FNO)的发展。
3. 方法论创新:通过直接预测、集合扰动等策略,将现有天气模型的预测范围扩展至S2S尺度。
研究亮点
- 多系统耦合:首次整合大气-海洋-陆地-冰层变量,覆盖45年时空跨度。
- 物理可解释性:提出SpecDiv与SpecRes指标,将物理一致性量化并嵌入机器学习流程。
- 开源生态:提供0.25°高分辨率数据处理脚本(附录B.4)及四国机构基线数据,促进社区协作。
未来方向
团队计划纳入多源再分析产品(如MERRA-2)及更高分辨率数据,进一步探索初始条件同化(Data Assimilation)与混合建模(Hybrid Modeling)的潜力。