基于序列卷积长短期记忆网络框架的区域气象过程与臭氧变率映射研究

分享自：
基于序列卷积长短期记忆网络框架的区域气象过程与臭氧变率映射研究

工程学
公共卫生
期刊:Environ. Sci. Technol.DOI:10.1021/acs.est.4c11988
【点击此处】阅读全文、收藏及针对性提问
关于“Mapping regional meteorological processes to ozone variability in the North China Plain and the Yangtze River Delta, China”一文的学术研究报告
近日，由 Feng Hu, Pinhua Xie, Jin Xu, Xin Tian, Zhidong Zhang, Yansheng Lv, Qiang Zhang, Youtao Li 以及 Wen-Qing Liu 共同完成的研究论文《Mapping regional meteorological processes to ozone variability in the North China Plain and the Yangtze River Delta, China》在环境科学领域的顶级期刊 Environmental Science & Technology 上正式发表（发表日期：2025年5月8日；卷59，页9632–9643）。这项研究由中国科学技术大学、中国科学院合肥物质科学研究院安徽光学精密机械研究所、中国科学院大学以及合肥综合性国家科学中心等机构的研究人员合作进行。本研究聚焦于中国大气污染治理的关键科学问题——近地面臭氧污染预报及其气象驱动机制，提出并验证了一种创新的机器学习框架，显著提升了臭氧浓度预测的准确性，并首次系统量化了区域气象场时空演变（Spatiotemporal evolution of regional meteorological fields, STRMFs）对臭氧日际变化的关键贡献。
研究的学术背景与目标 对流层臭氧作为一种有害的二次污染物，由氮氧化物（NOx）和挥发性有机物（VOCs）在阳光下发生光化学反应生成，对人体健康、农作物产量及生态系统构成严重威胁。在中国人口密集、经济发达的华北平原（North China Plain, NCP）和长江三角洲（Yangtze River Delta, YRD）地区，高浓度臭氧污染事件频发，实施有效的应急响应措施（如削减前体物排放、发布污染预警）高度依赖于精准的臭氧预测。然而，臭氧污染的形成不仅受前体物排放影响，更受到从局地到区域、从小时到数天等多尺度、动态气象过程的复杂调制。例如，局地的高温、强太阳辐射、低湿度和静风条件利于臭氧生成积累；而在区域尺度上，副热带高压、台风及其外围环流的下沉气流等天气系统，对臭氧的区域性生成、传输与汇聚起着决定性作用。
现有的臭氧预测方法主要包括基于化学传输模型的数值模拟和基于数据驱动的机器学习方法。数值模拟虽能刻画详细的物理化学过程，但计算成本高昂，且其精度受排放清单、化学机理参数化方案及驱动气象场准确性的限制。而主流机器学习方法（如随机森林、支持向量回归、卷积神经网络CNN、长短期记忆网络LSTM等）在臭氧预测中虽展现出高效性，但大多仅利用城市站点或单点的气象时序数据，未能有效纳入区域气象场的空间结构及其随时间演变的动态信息，这限制了模型对气象驱动因子的解释能力，尤其在捕捉由区域天气系统触发的突发性、高浓度臭氧污染事件方面存在不足。因此，本研究旨在弥补这一空白，核心科学目标是：开发一种能够有效利用区域气象场时空演变信息来预测臭氧浓度的机器学习框架，从而更准确地预报城市及区域尺度的臭氧污染，并定量阐明多尺度气象过程对臭氧变异性的贡献。
详细的研究工作流程 本研究的工作流程系统而严谨，主要包含以下几个关键步骤：
第一，数据收集与预处理。 研究团队收集了2016年1月1日至2024年12月31日期间中国国家环境空气质量监测站的地面臭氧浓度数据，并计算了各城市的日最大8小时滑动平均（MDA8）臭氧浓度作为预测目标。研究区域选定为NCP和YRD这两个关键区域。气象数据方面，主要采用了美国国家环境预报中心（NCEP）的全球预报系统（Global Forecast System, GFS）历史再分析数据集（空间分辨率0.25°×0.25°，时间分辨率3小时），提取了与臭氧形成密切相关的六个关键气象变量：2米气温（T2）、地表相对湿度（RH）、地表太阳向下辐射（SSRD）、总降水量（TP）以及10米风矢量的U和V分量（U10, V10）。此外，为评估气象数据本身准确性对预测的影响，还并行使用了欧洲中期天气预报中心（ECMWF）的ERA5再分析数据集进行对比。所有数据均经过严格的质量控制与归一化处理。
第二，创新性模型框架设计：序列式CNN-LSTM。 本研究最核心的贡献是设计了一个序列式卷积长短期记忆网络（Sequential CNN-LSTM）框架，用以建立“气象视频”到多城市臭氧浓度的映射关系。这里的“气象视频”是一个核心操作定义：它将连续N天（时间尺度）内、覆盖特定地理区域（空间尺度）的六个气象变量的空间分布（每个变量构成一个二维场）组合成一个四维张量（时间×变量通道×纬度×经度）。形象地说，每一天的六个气象变量场构成一幅“天气图像”（多个通道），连续N天的图像则构成一段“天气视频”。CNN部分负责从单日的“天气图像”中自动提取空间特征（如温度梯度、风场辐合形态等），而LSTM部分则负责捕捉这些空间特征在连续多日间的时序演变规律（如天气系统的移动、强度的变化）。这种架构巧妙地将CNN强大的空间模式识别能力与LSTM优异的时序依赖建模能力相结合，使其能够学习区域气象过程的动态演变如何影响下游城市的臭氧浓度。
第三，多情景模型训练与评估方案。 为了系统探究气象数据时空尺度对预测性能的影响，研究构建了多维度的模型训练情景。具体而言，设定了7个不同的空间尺度（从11°×11°到23°×23°的矩形区域）和7个不同的时间尺度（输入气象数据的天数从1天到7天），对NCP和YRD两个区域分别进行组合，共计训练了2（区域）× 7（空间）× 7（时间）= 98个不同的CNN-LSTM模型。所有数据按约75%（训练）、12.5%（验证）、12.5%（测试）的比例划分，测试集为独立的2023年全年数据。为了凸显新框架的优势，研究还设置了两个基线模型进行对比：一个是传统的多元线性回归（Multiple Linear Regression, MLR）模型，仅使用城市所在1°×1°范围内的气象变量日均值作为输入；另一个是“1D CNN-LSTM”模型，其输入与MLR相同（即单点时序数据），但使用相同的CNN-LSTM非线性架构，用以分离模型非线性拟合能力与STRMFs信息各自的贡献。
第四，多维度模型性能评估。 模型评估采用了两大类指标：一是臭氧浓度预测精度（Accuracy of Ozone Concentration Prediction, AOCP），包括决定系数（R²）、平均偏差（Bias）和均方根误差（RMSE）；二是高臭氧污染事件预报精度（Precision in forecasting High-ozone pollution Events, PHOE），定义为模型预测值与观测值同时超过160 μg/m³阈值的次数占观测值超过该阈值总次数的比例（频率）。为了综合比较不同时空尺度下模型的整体表现，研究将上述四个指标进行归一化处理，并通过加权（AOCP与PHOE各占50%权重）计算出一个综合评分。
第五，机理分析与案例应用。 在模型性能评估的基础上，研究进一步利用训练好的最优模型，深入分析了区域气象场对臭氧日际变化的解释贡献度。特别地，研究选取了台风这一对中国东部臭氧污染有重要影响的天气系统作为案例，通过关联2016-2023年间西北太平洋台风路径数据与区域平均臭氧浓度，直观展示了CNN-LSTM模型如何成功解析台风中心位置（近海vs内陆）对NCP和YRD区域臭氧浓度的差异化影响，并与基线模型的失效表现形成对比。
主要研究结果 本研究通过上述系统的工作流程，得出了以下一系列重要且层层递进的结果：
首先，关于气象数据时空尺度的影响。 研究发现，适当扩大输入气象数据的时空尺度能有效提升CNN-LSTM模型的预测性能，特别是对高臭氧污染事件的预报能力（PHOE）。以NCP地区2023年测试集结果为例，使用最小尺度（11°×11°, 1天）气象数据的模型，其综合评分最低（0.42）。当空间尺度扩大至17°×17°、时间尺度扩展至4天时，模型达到最优性能（综合评分0.80）。虽然最优模型在AOCP指标上（R²=0.813， Bias=0.75 μg/m³， RMSE=22.54 μg/m³）与最小尺度模型（R²=0.817， Bias=1.71 μg/m³， RMSE=22.34 μg/m³）相差不大，但其PHOE指标（频率）从72%显著提升至83%，提高了11个百分点。这意味着纳入多日、区域尺度的气象演变信息，使模型对污染事件的捕捉能力大幅增强。对于YRD地区，扩大时空尺度对AOCP和PHOE均有改善。然而，当时空尺度继续扩大超过一定范围后，模型性能均出现下降，表明存在一个“最优尺度”，过大的尺度会引入冗余信息或增加模型过拟合风险。这一结果直接证实了臭氧变异对多尺度气象过程存在依赖性。
其次，关于气象数据准确性的影响。 通过对比使用GFS预报数据和ERA5再分析数据训练的模型，研究发现，使用更能反映真实大气状况的ERA5数据，能在NCP和YRD地区带来AOCP指标的轻微提升（例如NCP的R²从0.81提升至0.83），NCP的PHOE也从0.83微升至0.86。这说明提高输入气象场的精度，有助于获得更准确的臭氧预测。尽管业务预报中无法使用ERA5（因其同化了观测数据，非纯预报），但这一比较指明了提升气象预报精度对于改善臭氧预测质量的潜在价值。
第三，也是最具科学洞见的结果：STRMFs的关键贡献。 通过对比MLR、1D CNN-LSTM和完整CNN-LSTM三个模型的性能，研究定量剥离了非线性拟合能力和STRMFs信息各自的贡献。在训练验证集（2016-2022）上，仅使用单点气象数据的MLR模型对NCP和YRD臭氧日际变化的解释力（R²）分别为73%和59%，且严重低估高浓度臭氧（偏差较大）。1D CNN-LSTM模型凭借其非线性能力，将解释力略微提升至75%（NCP）和62%（YRD），但对高浓度臭氧的低估改善有限。而完整利用了STRMFs信息的CNN-LSTM模型，其解释力大幅跃升至86%（NCP）和85%（YRD），并且对高浓度臭氧的预测偏差显著降低。在独立测试集（2023）上，最优CNN-LSTM模型对NCP和YRD区域平均臭氧浓度演变的模拟也极为出色（R²分别达0.93和0.90），并能成功预报出92%（NCP）和89%（YRD）的区域性高污染事件。这清晰地表明，区域气象场的时空演变信息（STRMFs）是解释臭氧日际变化，尤其是高污染事件的核心因素，其贡献远超过模型非线性能力带来的提升。
第四，在具体天气系统影响解析上的成功应用。 研究利用CNN-LSTM模型成功量化并可视化了台风位置对区域臭氧的影响。结果显示，当台风位于中国近海时，其外围下沉气流控制NCP和YRD，导致区域平均臭氧浓度显著高于台风位于内陆时的情况（NCP：近海165.02±30.51 μg/m³ vs 内陆149.52±28.94 μg/m³；YRD：近海136.72±25.99 μg/m³ vs 内陆113.09±30.44 μg/m³）。CNN-LSTM模型准确地再现了这一空间分布模式，而MLR和1D CNN-LSTM模型则完全无法分辨台风位置不同带来的臭氧浓度差异。这证明，所提出的框架不仅是一个预测工具，更成为一个强大的“解码器”，能够解析特定天气系统（如台风）的空间配置如何通过复杂的区域气象过程最终影响地面臭氧浓度。
研究的结论与价值 本研究的核心结论是：区域气象场的时空演变（STRMFs）是驱动中国关键区域（NCP和YRD）近地面臭氧日际变异的主导因素，能够解释超过85%的臭氧浓度变化。基于此认知所开发的序列式CNN-LSTM框架，通过有效整合STRMFs信息，实现了对城市及区域尺度臭氧浓度，特别是高污染事件的快速、精准预报。
研究的价值体现在科学与应用两个层面： 科学价值： 1) 范式创新： 首次系统地将“气象视频”的概念和序列式CNN-LSTM架构引入区域臭氧预测研究，为理解气象-污染的复杂非线性关系提供了强有力的新工具。2) 机理深化： 定量揭示了STRMFs相对于传统局地气象因子在解释臭氧变异中的压倒性重要性，改变了以往过于关注单点、静态气象关联的研究范式，强调未来研究必须重视气象场的动态空间演变。3) 解析能力： 展示了该框架在解析具体天气系统（如台风）影响臭氧污染的物理机制方面的潜力，架起了机器学习“黑箱”预测与大气物理过程理解之间的桥梁。
应用价值： 1) 业务预报： 所建立的模型基于公开的GFS预报数据，具备构建实时、高效臭氧业务预报预警系统的可行性，可为环境管理部门提供更可靠的决策支持。2) 预警提升： 模型对高臭氧事件（PHOE）预测能力的显著提升，有助于更早、更准地发布污染警报，从而更有效地实施应急减排措施，保障公众健康。3) 情景模拟： 该框架可快速生成基于不同气象预报成员（集合预报）的臭氧预测范围，提高预测结果的可信度。
研究的亮点与创新 本研究的亮点与创新之处主要体现在：1) 方法论的原创性： 创造性提出并实现了“天气视频”到臭氧浓度的映射，设计的序列式CNN-LSTM框架是针对区域气象-污染耦合问题的一项方法学创新。2) 系统性的尺度分析： 首次在机器学习臭氧预测研究中，系统、定量地评估了输入气象数据在空间和时间两个维度上的尺度效应，并找到了性能最优的尺度配置。3) 卓越的解释力： 模型实现了对臭氧日际变化超过85%的解释力，这是将气象驱动因子对臭氧变异的影响提升到了一个前所未有的高度。4) 成功的机理关联： 不仅追求预测精度，更成功利用模型解析了台风位置这一具体气象强迫对区域臭氧的影响，证明了数据驱动模型具备揭示物理过程的能力。5) 坚实的验证： 通过严格的基线模型对比（MLR, 1D CNN-LSTM），清晰剥离并证明了STRMFs信息的关键贡献，论证坚实有力。
其他有价值的内容 研究也坦诚指出了当前工作的局限性与未来方向：首先，尽管STRMFs解释了85%的臭氧变异，但仍有约15%的变化可能源于局地化学过程、排放变化及气候变率等因素，未来需要融合多源数据（如排放清单）进行更全面的建模。其次，本研究仅聚焦于台风位置的影响，未来可进一步探究台风强度及其他天气系统（如高压系统、锋面）的复合影响。最后，维持模型的长期预测性能需要持续收集新数据并进行迭代训练更新。这些思考为后续研究指明了清晰的路径。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问