分享自:

利用机器学习和集合预报改进中国PM2.5和能见度预测

期刊:Journal of Geophysical Research: Machine Learning and ComputationDOI:10.1029/2025jh000640

关于《利用机器学习和集合预报改善中国PM2.5和能见度预测》研究的学术报告

本研究由来自中国气象局城市气象研究所的张紫寅、徐婧、赵秀娟、程思宇四位研究人员共同完成。他们的研究成果以《Improving PM2.5 and visibility predictions in China using machine learning and ensemble forecasting》为题,于2025年发表在《Journal of Geophysical Research: Machine Learning and Computation》期刊上。

一、 学术背景

本研究主要属于大气环境科学、空气质量预报与人工智能交叉应用领域。近年来,尽管中国通过强有力的污染控制措施使得空气质量整体改善,但以PM2.5浓度升高和能见度降低为特征的雾霾污染在华北等地依然周期性发生,对公众健康和经济社会活动构成持续威胁。准确预报PM2.5和能见度,对于有效的空气质量管理、污染事件预警以及科学决策至关重要。

当前业务化的空气质量和能见度预报主要依赖于基于物理和化学过程的数值模拟模型,如WRF-Chem模型。虽然这些模型考虑了气象与化学过程的双向耦合,但高分辨率模拟需要巨大的计算资源,且在模拟局地和短期过程时存在局限,预报准确度有待提升。与此同时,人工智能(AI)技术在天气预报领域展现出巨大潜力,诸如FourCastNet、Pangu-Weather等数据驱动模型正在发展。然而,这些大型AI模型训练阶段同样需要大量GPU资源,且目前主要处于实验阶段。另一方面,传统的机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)方法在改进PM2.5和能见度预报方面已显示出前景,但受限于缺乏用于训练的长时间序列、高分辨率气象-化学耦合数值预报数据,其预报精度的提升程度受限。

针对上述挑战,本研究旨在探索一种相对低成本的改进方案。其核心目标是:通过集成机器学习技术与现有的业务化区域空气质量数值预报系统(RMAPS-Chem),显著提升对中国大陆309个城市未来1-10天逐小时PM2.5浓度和能见度的预报准确率,为更早、更精准的雾霾污染预测提供有力工具,从而支持更高效的空气污染控制决策。

二、 详细工作流程

本研究包含数据准备、模型构建、集成算法开发和全面评估四个主要流程,工作流程严谨而系统。

流程一:数据准备与预处理 研究使用的数据主要包括观测数据和RMAPS-Chem系统的预报数据。 1. 观测数据:从中国气象局CIMISS数据库获取全国超过2400个地面气象站的逐小时能见度数据;从中国环境监测总站(CNEMC)获取超过1700个地面环境监测站的逐小时PM2.5浓度数据。经过严格的数据质量控制,最终保留了自2014年以来连续性和完整性较好的309个城市的数据。城市级的平均值通过计算位于每个城市城区范围内的站点观测值得出,以确保数据代表城市状况。 2. 预报数据:源自业务化的RMAPS-Chem系统。该系统基于WRF-Chem模型,空间分辨率为9公里,提供中国及邻近地区1-10天的中期预报。其中,1-4天的气象驱动场由RMAPS-ST系统(含3D-Var同化)提供,5-10天的则由ECMWF HRES或CMA GRAPES全球模式提供。RMAPS-Chem系统直接输出PM2.5浓度,而能见度则采用经过修改的Chen等人(2012)的参数化方案,通过PM2.5浓度和相对湿度计算得出(公式1)。为确保机器学习训练数据的稳定性,本研究采用了2021年8月至2023年12月期间升级后的RMAPS-Chem业务数据。其中,2021年8月至2023年7月的数据用作训练集(随机分为80%训练子集和20%验证子集),而2023年9月至12月的数据作为完全独立于训练集的测试集,用于最终评估模型在真实业务场景下的表现。 3. 特征向量构建:为提高机器学习模型的性能,研究精心选取了13个解释因子(特征向量),包括6种污染物(PM2.5, PM10, SO2, NO2, O3, CO)和7个气象变量(2米相对湿度RH2、2米温度T2、10米纬向风U10和经向风V10、行星边界层高度PBLH、云量CLDFRA),以及模型预报的能见度本身。为了捕捉时间依赖性和滞后效应,对每个解释因子引入了时间滞后变量(t, t-3, t-6, t-9, t-12, t-18, t-24小时),使得总特征变量数达到91个。

流程二:机器学习模型构建与训练 本研究采用了七种常见的机器学习和深度学习方法:随机森林(Random Forest, RF)、XGBoost(XGB)、支持向量机(Support Vector Machine, SVM)、逻辑回归(Logistic Regression, LR)、反向传播神经网络(Back-Propagation Neural Network, BP)、卷积神经网络(Convolutional Neural Networks, CNN)和长短期记忆网络(Long Short-Term Memory, LSTM)。这些模型通过调整超参数(详细信息见附表S1)以达到最优性能。 一个关键的建模策略是,为了缓解观测和模拟中PM2.5和能见度分布的偏态特性对机器学习的不利影响,本研究将机器学习的目标变量设定为“预报偏差”(即模型预报值与观测值之差)。这样可以使目标变量更接近正态分布。每个机器学习模型被训练来预测这个偏差,然后将预测出的偏差加到原始的RMAPS-Chem直接输出上,从而生成七个机器学习成员预报(MLs)。 值得注意的是,所有模型在训练时均使用均方误差作为损失函数。为了平衡不同模型在不同城市的计算成本,训练迭代次数有所不同(如CNN和LSTM迭代较少,而计算需求低的模型迭代较多)。更重要的是,模型是针对每个城市单独训练的,即每个城市都有自己专属的PM2.5和能见度机器学习模型,这确保了模型能够捕获每个城市独特的气象条件、排放源和地形特征。

流程三:集合预报算法RChem-AI的开发 为了集成各模型的优势,本研究提出了一种名为RChem-AI的新型动态集合预报算法。该算法的核心思想是动态地、客观地为每个预报成员分配权重。 1. 成员构成:集合成员包括原始的RMAPS-Chem预报和上述七个机器学习成员预报,共计八个成员。 2. 动态权重机制:权重基于各成员在过去两周(14天)的预报表现动态计算。使用的评价指标是均方根误差(Root Mean Square Error, RMSE)和时间相关系数(Temporal Correlation Coefficient, TCC)。权重计算公式(公式2,3)的设计原则是:RMSE越小、TCC越大的成员应获得更大的权重。具体地,综合权重wi通过各成员的RMSE、TCC与全体成员平均RMSE、平均TCC的差异,并经过以自然常数e为底的指数函数放大后计算得出。这种设计能有效放大表现优异成员的贡献。 3. 每日更新:该权重方案是动态的,每天都会根据最近14天的表现重新计算,确保集合预报能够适应各成员模型预测能力的变化。 最终,RChem-AI的确定性预报结果是各成员预报值按其动态权重进行加权平均得到的。

流程四:全面评估与分析 研究在独立的测试期(2023年9-12月)对RMAPS-Chem、所有七个机器学习成员以及RChem-AI集合预报的性能进行了全面评估。 1. 评估指标:主要使用均方根误差(RMSE)、空间异常相关系数(Spatial Anomaly Correlation Coefficient, ACC)和时间相关系数(TCC)进行定量评估。ACC衡量预报场与观测场空间格局的相似性,TCC则评估单个城市的时间序列预报技巧。 2. 评估维度: * 整体性能对比:计算所有309个城市、整个测试期内的平均统计指标,并进行模型间对比。 * 空间性能分析:绘制各城市平均预报偏差的空间分布图,对比RMAPS-Chem和RChem-AI的差异。 * 时间序列分析:以北京为例,详细展示并对比观测值与两种预报模型的逐小时演变序列。 * 极端污染过程评估:针对特定重污染个例(如2023年12月29-30日),分析模型对PM2.5峰值浓度和能见度最低值的预报能力,并计算污染主要时段各城市RMSE的变化率。 * 不同预报时效性能:系统评估预报时效从1天延长至10天时,所有模型的RMSE和TCC变化趋势。 * 不同污染水平性能:评估模型在不同PM2.5浓度和能见度范围内的表现差异(详细结果见支持信息)。

三、 主要结果

本研究取得了系统性且显著的改进效果,主要结果如下:

结果一:机器学习模型显著提升单点预报准确率。 在24小时预报时效下,相比原始的RMAPS-Chem预报,所有七种机器学习模型平均将PM2.5预报的RMSE降低了19.0%(降低幅度从LSTM的7.6%到XGB的25.3%不等),将能见度预报的RMSE平均降低了30.2%(降低幅度从LSTM的23.6%到RF的38.2%不等)。在相关性方面,机器学习模型将PM2.5预报的TCC平均提高了4.2%,将能见度预报的TCC平均大幅提高了22.1%。泰勒图清晰显示,无论是PM2.5还是能见度预报,所有机器学习成员的表现点都比RMAPS-Chem更接近代表观测的参考点,其中树模型(RF、XGB)和部分传统模型(SVM、LR)表现尤为突出。预报偏差的概率密度分布图进一步表明,机器学习模型有效纠正了RMAPS-Chem对PM2.5(普遍高估)和能见度(在0-1公里区间偏差显著)的系统性偏差,使偏差分布更接近正态分布。

结果二:集合预报算法RChem-AI实现最佳性能。 动态集合算法RChem-AI综合了各成员优势,表现超越所有单个模型(包括表现最好的单个机器学习模型)。在24小时预报时效下,RChem-AI将PM2.5预报的平均RMSE进一步降低至15.8 μg/m³,比RMAPS-Chem降低了33.3%;将能见度预报的平均RMSE降低至5.4 km,降幅达39.3%。同时,RChem-AI将PM2.5和能见度预报的平均TCC分别提升至0.71和0.74,提升幅度分别为16.4%和39.6%。在泰勒图上,RChem-AI的位置最接近参考点,显示出最优的综合预报技巧。

结果三:RChem-AI有效改善空间预报偏差分布。 空间分析表明,RMAPS-Chem对PM2.5的预报偏差存在明显的空间分异,正偏差(高估)主要集中在四川盆地、汾渭平原至华北平原南部等地。而RChem-AI显著削弱了这种空间不均匀性,大范围的正偏差(>6 μg/m³)几乎消失,取而代之的是更小、更均匀的偏差分布。对于能见度,RChem-AI也大幅修正了RMAPS-Chem在京津冀南部等地严重低估低能见度的偏差。绝大多数城市的RMSE和TCC都得到了改善,这种改善在PM2.5浓度较高或能见度较低的地区尤为明显。

结果四:在典型污染过程中展现出优越的预报能力。 以北京2023年秋季至冬季的时序为例,RChem-AI比RMAPS-Chem更准确地捕捉了PM2.5浓度的峰值和变化动态,显著减少了RMAPS-Chem对污染峰值的过度高估(例如在个别过程中高估达50-100 μg/m³)。对于能见度,RChem-AI也能更好地预报雾霾期间的低能见度事件。在2023年12月29-30日的区域性重污染过程中,RChem-AI相比RMAPS-Chem,在东部289个城市的PM2.5和能见度预报RMSE平均分别降低了30.7%和42.1%,对PM2.5峰值浓度和能见度最低值的预报也更接近实况,为污染过程的精准预报和预警提供了关键支持。

结果五:预报技巧随时效延长而衰减,但RChem-AI相对优势持续保持。 随着预报时效从1天延长至10天,所有模型的预报准确率(RMSE升高,TCC下降)都呈现下降趋势,这是数值预报和统计预报的普遍规律。然而,RChem-AI在所有预报时效上均保持了对RMAPS-Chem和单个机器学习模型的优势。一个非常突出的发现是:RChem-AI在7天甚至10天预报时效的RMSE和TCC水平,可以与RMAPS-Chem在1天预报时效的水平相媲美。这意味着RChem-AI能够将可靠的空气污染和雾霾事件预报能力显著提前,这对于需要提前部署污染控制措施的决策者具有极高价值。

四、 结论与研究意义

本研究得出明确结论:通过将多种机器学习技术与业务化区域空气质量数值预报系统(RMAPS-Chem)相集成,并开发基于动态RMSE和TCC权重的集合预报算法(RChem-AI),能够系统性、显著地提升中国城市级PM2.5和能见度预报的准确率和鲁棒性。

该研究的科学价值在于:成功验证了在计算资源受限条件下,利用“物理化学模型+机器学习偏差订正+动态集合”的技术路线,是弥补复杂数值模型缺陷、提升业务预报能力的有效途径。它为解决气象与环境预报中普遍存在的模型系统误差问题提供了一个可操作的框架。

其应用价值和社会意义尤为突出:RChem-AI系统能够提供更早(可提前至7-10天)、更准(误差降低30-40%)的雾霾污染预报信息。这极大地增强了空气污染早期预警的能力,使政府环保部门、城市规划管理者以及公众能够提前获知污染风险,从而为实施更精准、更主动的污染控制措施(如企业减排调度、交通管制、公众健康防护提示)提供了关键的科学决策依据,最终有助于更有效地保护公众健康,推动受影响区域创建更清洁、更安全的环境。

五、 研究亮点

本研究的亮点主要体现在以下几个方面: 1. 显著的预报改进幅度:在309个城市的大范围业务化测试中,实现了PM2.5和能见度预报误差平均降低约三分之一至五分之二的显著改进,提升效果具有统计显著性和空间广泛性。 2. 创新的动态集合算法:提出的RChem-AI算法创新性地采用基于近期表现(RMSE和TCC)的动态权重分配机制,能够自适应地择优融合物理模型与多种数据驱动模型的预报结果,方法简单有效且易于业务化实现。 3. 前瞻性的预报能力延伸:研究不仅关注短期预报,更系统评估了1-10天的中期预报性能,并发现集合预报可将可靠的预报能力等效提前数天,这对延长决策响应窗口具有重要现实意义。 4. 针对性的建模策略:采用“预测预报偏差”而非直接预测绝对值的机器学习建模思路,有效处理了目标变量的非正态分布问题,提高了模型训练的稳定性和效果。 5. 务实且可推广的技术路线:研究立足于现有业务系统(RMAPS-Chem),通过集成相对成熟的机器学习方法进行增效,而非完全依赖计算昂贵的巨型AI模型或超高分辨率模拟,提供了一条成本效益高、易于业务移植的技术路径。

六、 其他有价值的内容

研究还指出了一些有价值的发现和未来方向:例如,不同的机器学习模型表现存在差异,树模型(RF、XGB)在整个预报时效内表现稳健,而神经网络模型(CNN、LSTM)在更长的预报时效上表现有所下降,可能与训练数据量有限及输入数据空间结构利用不足有关。这提示未来随着高质量数据集的积累,神经网络的潜力可能进一步释放。此外,在极高污染(PM2.5 > 75 μg/m³)或极低能见度( km)条件下,机器学习及集合预报的改进幅度有所下降,表明模型在极端和复杂污染场景下的鲁棒性仍有提升空间,未来可通过纳入更多预测因子或采用更先进的深度学习架构进行改进。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com