利用卷积神经网络探究超大城市臭氧时间变异性的过程理解

分享自：
利用卷积神经网络探究超大城市臭氧时间变异性的过程理解

工程学
化学
期刊:Environ. Sci. Technol.DOI:10.1021/acs.est.3c07907
【点击此处】阅读全文、收藏及针对性提问
《环境科学与技术》2024年研究成果深度解析：利用卷积神经网络揭示特大城市臭氧时间变异性的气象驱动过程
一、 研究团队与发表信息
本研究由中国南方科技大学、剑桥大学、新加坡国立大学、北京大学深圳研究生院、广东省深圳生态环境监测中心站等多个机构的科研人员共同完成。主要作者包括麦泽林、沈汇中*、张敖兴、孙海童哲等，通讯作者为南方科技大学的沈汇中教授。该研究成果于2024年3月15日正式发表在环境科学领域的知名期刊《环境科学与技术》（Environmental Science & Technology, 2024, 58, 15691-15701）上。
二、 学术背景与研究目的
本研究属于大气环境科学领域，核心关注点是地表臭氧污染的成因与控制。地面臭氧是一种危害人体健康的重要污染物。近年来，尽管中国在治理颗粒物（如PM2.5）方面成效显著，但以臭氧为代表的光化学污染问题日益凸显，其浓度持续上升。臭氧浓度的短期（日变化）与长期（季节、年际变化）波动受到两大类因素的复杂驱动：一是人为排放的前体物（如氮氧化物NOx和挥发性有机物VOCs），二是气象条件（如温度、湿度、风场、气压）。
以往大量研究通过经验模型（如多元回归、随机森林等）来量化气象对臭氧的影响。然而，这些研究大多存在两个关键局限：第一，通常只关注单一监测站点的本地气象条件，忽视了区域性、大尺度（数百至上千公里）气象格局对局地臭氧的影响，例如通过跨区域传输和垂直输送；第二，难以有效捕捉气象变量之间复杂的非线性相互作用，导致归因分析可能存在偏差。
与此同时，卷积神经网络（Convolutional Neural Networks, CNNs）作为一种深度学习技术，在图像识别领域表现出色，擅长从空间数据中提取特征和模式。近年来，CNN被越来越多地应用于地球科学领域，以理解复杂的过程。本研究正是基于这一背景，旨在利用CNN技术的优势，克服传统方法的局限。其主要研究目标是：构建一个基于CNN的模型，系统性地、定量地揭示三维空间（地面和高空）气象场的变化如何影响中国典型沿海特大城市（深圳）臭氧浓度的日、季节和年际动态，从而为理解臭氧污染的形成机制和制定精准控制策略提供基于过程的科学见解。
三、 详细研究流程与方法
本研究的工作流程严谨、系统，主要包含以下几个核心环节：
1. 数据准备与处理： * 研究目标与对象： 核心研究对象为深圳市2014年5月13日至2022年12月31日的臭氧日最大8小时滑动平均（MDA8h O3）浓度数据。为保持年际变化的连贯性，后续分析主要聚焦于2015年至2022年。数据来源于中国环境监测总站的全国城市空气质量实时发布平台，涵盖了深圳15个国控监测站点。研究选择城市平均臭氧浓度作为代表，分析证实各站点臭氧变化趋势同步性良好。 * 数据标准化： 由于2018年9月中国环境空气质量标准修订，监测数据报告状态从标准状态改为参比状态，研究团队对历史数据进行了状态统一换算，确保了数据时间序列的一致性。 * 气象与协变量数据收集： 研究采用了美国国家环境预报中心（NCEP）的全球分析数据，空间分辨率为1.0° × 1.0°。基于气象学知识，选取了18个关键气象指标，涵盖地表（2米）、925百帕、850百帕和500百帕等多个高度层，包括温度、相对湿度、可降水、气压、纬向风、经向风和位势高度。这些指标经过日最大或白天平均处理，以更好地表征对臭氧光化学过程的影响。 * 额外协变量： 为了反映排放、政策等长期因素的影响，模型还纳入了其他污染物（PM2.5, SO2, NO2, CO）的长期趋势项，以及本地时间和坐标信息等时间序列协变量。
2. CNN模型构建与优化： * 模型结构： 本研究构建了一个以CNN为核心的耦合模型。其创新之处在于采用了“两阶段”架构。第一阶段为卷积模块，包含三个独立的二维卷积层，专门用于处理18个气象变量形成的三维空间场（每个变量是一个13×13的二维网格，堆叠起来形成三维数据结构），以提取区域气象场的多维空间特征。第二阶段为全连接层，将第一阶段提取的特征与时间序列协变量（11个）的特征进行拼接，最终预测深圳的MDA8h O3浓度。这种结构使得模型能够同时利用空间气象格局和时序变化信息。 * 空间尺度优化： 为了确定最优的气象数据输入空间范围，研究团队测试了从1°×1°到47°×47°共25种不同尺度的模型。通过10折交叉验证，最终确定以深圳为中心、13°纬度×13°经度（约1340公里×1230公里）的范围为最佳输入域。该尺度能够有效捕捉中-α尺度（200-1000公里）的气象系统（如锋面、热带气旋），同时避免过大的区域引入噪声导致过拟合。值得注意的是，仅使用本地（1°×1°）气象数据的模型表现最差（R²=0.675），这直接证明了区域气象信息对臭氧预测至关重要。 * 模型性能评估： 模型性能通过10折交叉验证进行评估，主要指标包括决定系数（R²）、均方误差（MSE）和平均绝对误差（MAE）。同时，本研究将CNN模型与线性回归、随机森林回归等多种传统经验模型进行了对比。
3. 变量贡献定量评估方法： 为了解释模型并量化各气象变量对臭氧变化的贡献，本研究并用了两种先进的归因方法，以相互验证，增强结果的可信度。 * 沙普利加性解释（Shapley Additive Explanations, SHAP）方法： 这是一种基于博弈论的解释方法。对于模型的每一次预测，SHAP可以为每个输入变量计算一个“沙普利值”（单位：微克/立方米），该值反映了在给定其他变量组合下，该变量对预测结果（臭氧浓度偏离基线）的边际贡献。该方法能够处理变量间的非线性交互作用。 * 暴力法（Brute Force Method）： 该方法首先使用Kolmogorov-Zurbenko (KZ)滤波器将臭氧时间序列分解为长期基线分量和短期/天气尺度分量。然后，它以历史同期平均气象条件为参考基准，通过逐个替换变量的实际值为其平均值，计算臭氧预测值的变化，从而估算单一变量的贡献。这种方法直观，但在非线性模型中可能因忽略变量交互而产生偏差。 研究团队对比了两种方法的结果，发现它们得出的各变量重要性排序高度相关，但SHAP方法能更好地揭示变量间的相互作用，因此最终选择以SHAP结果作为主要分析依据。
4. 模型拓展与应用： 为了验证所开发CNN框架的普适性，研究将其应用于中国其他三个具有不同地理和气候特征的特大城市：北京（华北平原）、上海（东部沿海三角洲）和成都（内陆盆地）。分别为这些城市训练了CNN模型，并同样使用SHAP方法量化了影响其臭氧变异的主要气象驱动因子。
四、 主要研究结果
1. 模型性能卓越，优于传统方法： * 基于最优13°×13°空间域的CNN模型，在解释深圳每日臭氧变异方面表现出色，其10折交叉验证的平均R²超过0.70，即能够解释超过70%的日变化方差。 * 与线性回归、随机森林、梯度提升回归等多种经验模型相比，CNN模型的平均R²高出7%至62%，展现出其在捕捉区域气象空间格局和非线性关系方面的绝对优势。
2. 揭示日尺度臭氧波动的关键气象驱动： * SHAP分析表明，气象波动（18个变量）总共解释了深圳71%的日臭氧变异。其中，2米气温（T2m）和相对湿度（RH）是首要驱动因子，分别贡献了16%和15%的方差。高温和低湿条件显著加剧臭氧污染。 * 区域风场是第二大贡献者，总共贡献了高达48%的日变化。模型清晰地识别出：北风（负的经向风V）和西风（正的纬向风U，特别是850百帕和500百帕高度）会导致深圳臭氧浓度升高。这证实了来自内陆地区的污染物跨区域输送是深圳臭氧污染的重要来源。高空风场（贡献31%）的影响比近地面风场（贡献17%）更为显著。 * 在由副热带高压或台风外围下沉气流主导的典型臭氧污染事件期间，风场的贡献尤为突出，可解释高达40%的日臭氧波动（相当于使MDA8h O3升高约35微克/立方米）。
3. 解析独特的季节性臭氧双峰模式： 与许多北方城市夏季单峰不同，深圳臭氧呈现“双峰”型季节变化：主峰在秋季（9-10月），次峰在春末夏初（4-5月），而6月浓度最低。 * 秋季峰值： 主要与副热带高压和台风活动频繁有关。此期间气象条件平均使MDA8h O3升高约52微克/立方米，其中T2m、RH和风场分别贡献16、13和15微克/立方米。高温、低湿和偏北风共同作用。 * 春季次峰： 模型归因于气温升高（贡献+8微克/立方米）和850百帕北风（贡献+7微克/立方米）等因素，可能与冬季污染物累积后的光化学反应、平流层臭氧输送以及生物质燃烧有关。 * 6月谷值： 正值华南前汛期，高湿度（贡献-7微克/立方米）和偏南风（与西南季风相关，贡献-16微克/立方米）共同抑制了臭氧生成。
4. 量化气候异常对年际臭氧趋势的影响： * CNN模型成功复现了深圳2015-2022年臭氧浓度的年际波动趋势：2015-2019年显著上升，2020年骤降，2021-2022年回升。 * 模型定量分离了气象异常和排放控制对年际趋势的贡献。分析显示，气象异常是驱动臭氧年际波动的主要力量，可导致年际变化达-5至+6微克/立方米。 * 具体而言： * 2019年臭氧高值： 主要归因于当年异常高温、干燥和盛行北风，这些条件与厄尔尼诺（ENSO）事件的影响相符。与2018年相比，气象条件导致臭氧升高约1.8微克/立方米。 * 2022年臭氧回升： 尽管排放持续控制，臭氧浓度再度上升。模型揭示，这主要（约40%）由高温和主导性北风等气象异常驱动，气象贡献使年浓度较研究期均值升高3.2微克/立方米。 * 排放变化的贡献相对较小且方向变化： 模型间接估算的排放影响（通过污染物趋势项体现）在-1至+1.4微克/立方米之间。研究表明，在2019年左右，深圳的臭氧生成机制可能经历了一个转折点，从前期的氮氧化物饱和区转向后期的氮氧化物限制区。这意味着2022年后，继续减排NOx将有利于降低深圳的臭氧浓度。
5. 模型框架在其他城市的应用与比较： * CNN框架在北京、上海、成都同样取得了成功（R²分别为0.87， 0.79， 0.85），但其最优空间输入尺度各不相同（北京9°×9°，上海19°×19°，成都21°×21°），反映了不同城市受区域影响的半径差异。 * 2米气温是三个城市的共同首要影响因子，但次要因子各异：北京是500百帕位势高度（GH500），上海是可降水量（PWat）和相对湿度，成都是925百帕气温（T925）和可降水量。这凸显了不同地理位置和气候背景下，臭氧污染气象驱动机制的差异性。
五、 研究结论与意义
本研究成功地开发并应用了一个可解释的CNN深度学习框架，系统、定量地揭示了三维区域气象场对中国特大城市（以深圳为例）臭氧浓度多时间尺度（日、季节、年际）变异的影响。主要结论包括： 1. 气象主导日变化： 气象波动解释了深圳超过70%的日臭氧变异，其中近地面温湿度和区域风场是关键。 2. 区域传输至关重要： 高空和地面的北风、西风是导致深圳高臭氧事件的重要机制，证实了区域传输的核心作用。 3. 气候异常驱动年际波动： 年际臭氧趋势很大程度上由ENSO等大尺度气候异常通过改变局地温湿度和环流场来驱动，其影响可能超过同期排放控制的效应。 4. 臭氧生成机制转变： 深圳的臭氧化学敏感性可能在研究期间发生了从氮氧化物饱和区向限制区的转变，这对未来的精准减排策略具有重要指导意义。
研究的价值体现在： * 科学价值： 提供了一种融合深度学习与可解释性分析的新范式，用于解耦复杂环境系统中的驱动因子。它将气象影响的分析从单点扩展到三维区域尺度，并实现了非线性作用的定量归因，深化了对臭氧污染形成物理过程的理解。 * 应用价值： 所开发的模型已被深圳市政府采纳，用于评估特定污染事件的气象贡献，辅助短期预报和应急决策。该方法可快速模拟不同气象情景下的臭氧浓度，为“臭氧攻坚战”提供高效的决策支持工具，并能推广至其他城市和污染物研究。
六、 研究亮点
方法创新： 首次将主要用于图像识别的CNN深度学习方法，创造性地应用于解析三维气象场对臭氧污染的影响，并成功结合SHAP等可解释性技术，打开了深度学习模型在环境过程机理研究中的“黑箱”。
视角新颖： 突破了传统经验模型局限于本地气象的框架，系统地强调了区域性、高空气象格局通过水平和垂直输送对局地臭氧的决定性作用，并量化了其贡献。
系统性分析： 不仅关注日变化，还系统揭示了气象对独特季节性双峰模式和复杂年际趋势的塑造作用，提供了从天气尺度到气候尺度连贯的认知。
发现重要： 明确量化了在深圳等南方沿海城市，气象异常（尤其是高温和北风）是近年臭氧浓度反弹的主要推手，而排放控制的效果可能被气象变化所掩盖或凸显。这为客观评估减排成效和预测未来臭氧变化提供了关键科学依据。
普适性强： 建立的框架具有可移植性，在北京、上海、成都等其他大城市的成功应用证明了其方法论的广泛适用潜力。
七、 其他有价值内容
研究也坦率地指出了当前工作的局限性，为未来研究指明了方向：首先，虽然CNN能够捕捉变量间的复杂交互，但当前归因分析仍侧重于单个变量的分离贡献，对交互作用的深入解析有待加强。其次，模型虽然通过三维气象场部分反映了臭氧的远距离输送过程，但尚无法精确区分背景臭氧（来自区域或平流层）和本地化学生成的臭氧。未来，结合更全面的观测数据（如卫星、飞机）和更深入的过程理解，将能进一步释放机器学习在大气环境时空预测与归因中的潜力。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问