分享自:

基于物理引导机器学习的河南“21·7”极端降雨事件改进预报

期刊:Science China Earth SciencesDOI:10.1007/s11430-022-1302-1

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


一、研究作者与发表信息

本研究由Qi Zhong(中国气象局培训中心/中国气象科学研究院灾害天气国家重点实验室)、Zhicha Zhang(浙江省气象台)、Xiuping Yao(中国气象局培训中心)、Shaoyu Hou(河北省人工影响天气中心)、Shenming Fu(中国科学院大气物理研究所)、Yong Cao(国家气象中心)和Linguo Jing(成都信息工程大学计算机学院)合作完成,发表于Science China Earth Sciences期刊2024年5月第67卷第5期(页码1652–1674),DOI号为10.1007/s11430-022-1302-1。

二、学术背景与研究目标

科学领域:本研究属于极端降水(extreme precipitation, EP)预测领域,结合了物理引导的机器学习(physics-guided machine learning, PGML)方法。

研究背景
1. 极端降水的破坏性与预测挑战:EP事件(如河南“21·7”特大暴雨)具有低概率、高强度、高影响的特点,传统数值模型在预测其强度、位置和演变时存在显著偏差。
2. 现有模型的局限性:全球和区域模式(如ECMWF、CMA-SH9、CMA-3km)对EP的预报常出现位置偏移和强度低估,尤其是地形与对流活动复杂区域。
3. 机器学习应用的机遇与挑战:虽然机器学习(ML)在气象领域有潜力,但EP样本稀缺、事件独特性导致小样本学习困难,需结合物理机制提升泛化能力。

研究目标
通过PGML方法改进EP预测,具体包括:
- 利用异常物理特征(如环流、水汽通量)作为输入;
- 融合多模式预报优势;
- 设计基于专业知识的损失函数(loss function)。

三、研究流程与方法

1. 数据与模型

  • 观测数据:采用中国气象局多源融合降水数据集(CMPA)和ERA5再分析数据(水平分辨率0.25°×0.25°)。
  • 数值模式:选取ECMWF(9 km)、CMA-SH9(9 km)和CMA-3km(3 km)的24小时预报。

2. 异常物理特征分析

  • 标准化异常(standardized anomaly, DS):计算环流、水汽通量散度(moisture flux divergence)、对流有效位能(CAPE)等相对于气候态的偏差。
  • 关键特征提取:发现水汽异常与降水的相关性最高(相关系数1.69),其次为纬向风异常(-1.67)。

3. 机器学习模型设计

  • 网络架构:轻量级卷积神经网络(CNN)“EvolutionNet”,含单隐藏层(8个卷积核)和输出层(1个卷积核),使用ReLU激活函数。
  • 损失函数优化:以降水威胁评分(threat score, TS)替代均方误差,结合免疫进化算法(immune evolutionary algorithm, IEA)调整参数,避免过拟合。

4. 实验设计

  • 历史样本训练:使用2021年6–7月降水数据,分训练集、验证集和测试集(含“21·7”事件)。
  • 近期样本训练:针对“21·7”事件(7月20–21日),采用滚动训练策略,融合多模式预报和异常特征。

四、主要研究结果

1. 多模式融合改进降水位置预测

  • 模型偏差:ECMWF预报降水中心偏北,CMA-SH9在山区高估强度,CMA-3km对城市降水低估。
  • ML校正效果:融合后,郑州暴雨中心强度从300 mm提升至450 mm,位置误差减少50%(图11b)。

2. 异常特征提升强度预测

  • 添加水汽通量散度异常特征后,降水强度校正幅度达200–250 mm(图14c),但无法修正位置偏差(因大尺度特征与模式逻辑一致)。

3. 小样本学习的局限性

  • 历史样本训练对>200 mm的EP改进有限(TS从0.321降至0.048),近期训练显著提升极端阈值预报能力(图13)。

五、结论与价值

科学价值
1. PGML框架的可行性:首次将物理特征与ML结合用于EP精细化预报,为“物理+AI”深度融合提供范例。
2. 多模式融合策略:验证了“好而不同(good and different)”模型组合的优势,如CMA-SH9(大尺度)与CMA-3km(对流尺度)互补。

应用价值
- 为气象业务部门提供EP客观订正工具,尤其在短临预报中减少漏报(如郑州“21·7”事件)。

六、研究亮点

  1. 方法创新:提出基于TS损失函数的IEA优化算法,平衡强度改进与空报抑制。
  2. 跨尺度分析:揭示大尺度环流异常与对流活动的多尺度相互作用对EP的影响。
  3. 业务导向:针对中国北方复杂地形EP事件(如河南“75·8”“21·7”),提供可推广的解决方案。

七、其他有价值内容

  • 敏感性分析:发现模式地形误差是位置偏差主因(如太行山虚假降水中心),需结合高分辨率地形数据进一步优化。
  • 未来方向:探索雷达/卫星等多源数据融合,以及更复杂的物理约束网络架构。

(注:实际报告中可补充具体图表数据引用,如“图11b显示ML校正后降水中心强度提升至450 mm”。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com