这项研究的主要作者包括Siwei Li、Ge Song、Jia Xing、Jiaxin Dong、Maolin Zhang、Chunying Fan、Shiyao Meng、Jie Yang、Lechao Dong和Wei Gong。作者单位主要来自武汉大学(遥感信息工程学院、测绘遥感信息工程国家重点实验室、罗家实验室、碳中和研究院)、美国田纳西大学、中国气象局(地球系统数值预报中心、中国气象科学研究院)等机构。该研究成果于2025年发表在《自然通讯》(Nature Communications)期刊上(卷16,文章号3364)。
此项研究属于大气环境科学与卫星遥感交叉领域,聚焦于地面臭氧污染监测及其健康影响评估。研究背景是:地面臭氧是一种重要的光化学污染物,短期和长期暴露均会显著增加过早死亡风险。2019年,全球估计有约42.3万人死于臭氧相关疾病,中国是臭氧相关死亡人数第二多的国家。为了有效防控臭氧污染、保护公众健康,需要准确、全面地监测地面臭氧浓度。中国虽然已建立了国家环境监测网络,但监测站点主要集中在城市区域,难以覆盖广大乡村和下风区域,形成空间监测空白。传统上,人们依赖极轨卫星(如TROPOMI)来反演大范围连续的地面臭氧浓度。然而,极轨卫星通常每天仅有一次过境观测,无法捕捉臭氧显著的昼夜变化规律,而臭氧浓度的日变化受其前体物(如氮氧化物NO2、挥发性有机物VOCs)和紫外辐射驱动的光化学反应控制,因此单次观测会带来很大的估算误差,进而影响基于此的每日最大8小时平均浓度(MDA8-O3,评估健康暴露的关键指标)的准确性以及后续的健康风险评估。近年来,新一代静止轨道卫星的发射为解决这一难题提供了契机。例如,韩国于2020年发射的静止轨道环境监测光谱仪(GEMS, Geostationary Environment Monitoring Spectrometer)是首颗具备紫外-可见光谱探测能力的静止卫星,能够提供东亚区域每小时的高分辨率观测数据,包括NO2、甲醛(HCHO,作为VOCs的示踪物)柱浓度和紫外辐射指数。这为利用更详细的光化学信息(前体物和辐射的逐时变化)来精确反演每小时地面臭氧浓度、从而更准确地计算MDA8-O3创造了条件。本研究的核心目标是:利用GEMS卫星提供的逐时前体物和紫外辐射数据,开发一种新的机器学习模型来反演高精度的中国区域逐时地面臭氧浓度;评估新方法相较于传统极轨卫星方法在MDA8-O3估算精度上的提升;并量化由此带来的臭氧相关健康风险(过早死亡率)估算的变化,揭示以往基于极轨卫星的评估可能存在的偏差。
研究的工作流程包含几个主要步骤:数据收集与预处理、机器学习模型构建与臭氧浓度反演、模型验证与精度评估、新旧方法(GEMS vs. TROPOMI)结果对比分析、健康风险评估、以及敏感性实验分析。
第一步:数据收集与预处理。 研究收集了从2022年11月到2023年12月期间的数据。核心卫星数据包括:1)来自GEMS的逐时L2级产品:NO2柱浓度、HCHO柱浓度和紫外辐射指数(UVI)。2)作为对比的极轨卫星数据:来自哨兵-5P(Sentinel-5P)上TROPOMI传感器的每日NO2和HCHO柱浓度产品,以及来自Sodankylä数据中心的TROPOMI紫外数据。气象数据来自欧洲中期天气预报中心(ECMWF)的ERA5-Land再分析产品,包括地表温度、露点温度、地表气压、风速风向、降水、蒸发、相对湿度等,空间分辨率为0.1度。辅助变量包括:来自SRTM的地形高程、来自MODIS的月度归一化植被指数(NDVI)、一天中的小时(HH)和一年中的天数(DOY)。社会经济变量包括来自WorldPop的人口数据和来自OpenStreetMap的道路密度数据,用于表征人为排放分布。地面真实值来自中国国家环境监测中心(CNEMC)的1672个地面监测站点的逐时臭氧浓度观测数据。所有数据均通过反距离加权(IDW)插值方法统一重采样至0.05度×0.05度的空间网格,并与卫星观测时间(世界时+8转换为北京时间)进行匹配,构成具有一致时空分辨率的训练和验证数据集。此外,研究基于MODIS土地覆盖数据将网格划分为“城市”(>75%面积为城市用地)、“半城市”(城市缓冲区50公里内,且不符合城市或乡村定义)和“乡村”(<15%城市用地)三类区域,以分析不同区域的差异。
第二步:机器学习模型构建与臭氧反演。 研究选择了LightGBM(Light Gradient Boosting Machine)梯度提升决策树模型来建立地面臭氧浓度与多种预测因子之间的非线性关系。选择LightGBM是因其在处理大规模、复杂数据集时的高效率和良好性能。模型构建分为两种模式:1)反演模式(Lgbm1):用于卫星可观测时段(主要是09:00-16:00)的臭氧浓度估算。模型输入特征包括:时空特征(DOY, HH)、地理特征(高程、NDVI)、社会经济特征(人口、道路密度)、气象特征(温度、湿度、气压、风、降水等)、以及GEMS提供的核心光化学特征——对应小时的NO2柱浓度、HCHO柱浓度和UVI。模型输出为对应小时的网格化地面臭氧浓度。2)预报模式(Lgbm2):用于估算卫星不可观测时段(如17:00-20:00)的臭氧浓度。其输入特征使用了当天上午卫星可用时段(t时刻)观测到的前体物和紫外数据,基于臭氧浓度对其前体物变化存在滞后响应的假设,来预测后续小时的浓度。此外,为了与基于TROPOMI的传统方法对比,研究还建立了一个基准模型(Lgbm3),该模型仅使用TROPOMI在每日约14:00(过境时间)的单次观测数据(NO2, HCHO, UV)以及同日的日均气象数据来直接估算当日的MDA8-O3。所有模型的超参数均通过网格搜索策略进行优化。
第三步:模型验证与精度评估。 研究采用了多种交叉验证方案来全面评估模型性能,包括:1)基于样本的10折交叉验证:随机划分训练和测试集。2)基于站点的交叉验证:将特定网格的所有样本作为测试集,评估模型的空间泛化能力。3)基于小时的交叉验证:将特定小时的所有样本作为测试集,评估模型对不同时间的适应性。评估指标为决定系数(R²)和均方根误差(RMSE)。验证结果显示,基于GEMS的逐时反演模型在观测时段(09:00-16:00)表现出极高的精度,R²在0.84到0.94之间,其中13:00和14:00精度最高(R²达0.94),RMSE在10.64至13.44 μg/m³之间。预报时段(17:00-20:00)的精度有所下降,但依然较好(R² 0.86-0.92, RMSE 13.06-15.22 μg/m³)。这证明了GEMS数据在反演和预测逐时臭氧浓度方面的强大能力。基于逐时浓度结果,可以计算得到每日的MDA8-O3。敏感性分析表明,直接使用GEMS数据预测MDA8-O3的精度低于先预测逐时浓度再计算MDA8-O3的方法,强调了逐时约束的重要性。同时,使用GEMS全天的逐时特征比仅使用其14:00的单次特征预测MDA8-O3的精度更高,凸显了GEMS昼夜数据集的价值。此外,即使同样使用14:00的数据,GEMS的特征(包含UVI)也比TROPOMI的特征能带来更好的模型精度,证明了GEMS紫外测量的独特作用。
第四步:新旧方法结果对比分析。 这是研究的核心发现部分。对比基于GEMS的新估算和基于TROPOMI的旧估算,主要结果如下: 1. MDA8-O3估算精度显著提升:在所有站点上,GEMS估算的MDA8-O3相比TROPOMI估算值,R²平均提升超过0.10,绝对误差减少超过7 μg/m³。提升在全年各月份和不同小时均存在。 2. 区域差异明显:提升在半城市区域最为显著(R²提升>0.15,绝对误差减少6.94 μg/m³),这是因为半城市区域的前体物(尤其是NO2)昼夜变化幅度最大(相对标准偏差比城市和乡村分别高23%和10%),GEMS的逐时数据能有效捕捉这种变化。在中国西部和南部等地面监测稀疏的偏远地区,超过70%的站点R²提升大于0.05,超过20%的站点提升大于0.30,说明GEMS数据对缺乏地面测量的区域预测能力改善巨大。 3. 臭氧浓度水平估算的系统性偏差:GEMS估算的全国大部分区域(尤其是中北部高污染区)的MDA8-O3水平比TROPOMI估算值平均低约10 μg/m³。这种降低在乡村区域(平均低4 μg/m³)和暖季的半城市区域(平均低2 μg/m³)尤为明显,表明传统的TROPOMI估算可能在这些区域显著高估了臭氧水平。而在城市区域,两者差异很小( μg/m³),因为地面监测站点主要位于城市,对模型约束强。同时,研究也发现GEMS估算在东南、西北和东北部分地区的臭氧水平高于TROPOMI估算,特别是在春秋季,表明TROPOMI可能在偏远地区和冷季低估了臭氧水平。 4. 偏差原因分析:新旧估算的差异主要源于对臭氧昼夜变化的表征能力不同。TROPOMI用单次观测(约14:00)来近似代表全天,在臭氧日变化剧烈的区域会产生较大误差。研究通过计算“偏离比”(GEMS与TROPOMI估算的MDA8-O3差值占比)发现,日变化越强的省份(如香港和澳门、福建、广东),偏离比越大(可达8%,全国平均5%),这直接证明了GEMS逐时数据集在日变化显著区域改进估算的有效性。
第五步:健康风险评估。 研究采用经典的暴露-反应函数估算了因短期(基于每日MDA8)和长期(基于年均MDA8)臭氧暴露导致的过早死亡人数。基线浓度设为65 μg/m³,人口和基线死亡率数据来自中国相关统计。对比结果表明: 1. 健康风险显著降低:基于新的GEMS估算,全国臭氧相关的过早死亡人数相比基于TROPOMI的旧估算大幅减少。短期暴露风险下降29.1%,长期暴露风险下降33.0%。这意味着以往基于极轨卫星的传统评估可能高估了总计约30%的臭氧相关健康风险。 2. 风险分布变化:风险下降在人口密集的中东部地区(如山东、河南、河北)最为显著,这些省份原本也是臭氧健康影响最严重的区域。在估算偏差较大的西北和南方地区(如四川),死亡率下降比例可达55.1%。 3. 城乡溢出效应减弱:由于GEMS估算在乡村和半城市区域的臭氧浓度降低幅度大于城市区域,导致这些区域的臭氧相关死亡率下降更明显(26-39%),而城市区域下降较少(22-23%)。这使得从城市到乡村的臭氧污染“溢出效应”看起来比之前基于TROPOMI的评估要小。
第六步:敏感性实验与深入分析。 为了排除其他干扰因素,确保结论稳健,研究进行了一系列敏感性实验:1)验证了逐时反演对于优化MDA8估算的必要性。2)证实了GEMS昼夜特征(而不只是单次观测)对于提升精度至关重要。3)证明了GEMS的紫外测量相比以往研究使用的可见光波段辐射,与臭氧的关联性更强,贡献了模型精度的提升。4)通过蒙特卡洛扰动方法评估了卫星数据本身的不确定性对最终臭氧估算的影响,结果显示影响很小(浓度变化%),说明机器学习模型能有效处理原始数据的不确定性。5)分析了GEMS数据在区分城乡模式上的优势:其逐时NO2观测能有效捕捉城乡差异的日变化,而TROPOMI在14:00过境时,城乡NO2比值较低,削弱了其区分能力。这也使得在GEMS模型中,人口、道路密度等社会经济特征的重要性降低,因为卫星光化学数据本身已蕴含了这些信息。
本研究的结论是:利用新一代静止轨道卫星GEMS提供的逐时光化学前体物和紫外辐射数据,能够以前所未有的精度反演中国区域的逐时地面臭氧浓度,并显著改进每日最大8小时平均浓度的估算。这一技术进步揭示,基于传统极轨卫星单次观测的臭氧浓度及健康风险评估可能存在系统性高估,尤其是在地面监测稀疏的半城市和乡村地区,以及臭氧日变化剧烈的区域。新的估算表明,臭氧相关的健康风险及城乡溢出效应可能低于以往的认知。
这项研究的科学价值和应用价值体现在多个层面:科学上,它首次系统展示了静止轨道卫星紫外光谱观测在捕捉地面臭氧光化学昼夜变化、进而提升浓度反演精度方面的巨大潜力,为大气环境遥感领域指明了新的技术方向。方法论上,它发展了一套融合静止卫星逐时数据与机器学习的高精度臭氧反演框架,该框架具有可推广性,未来可应用于北美(TEMPO卫星)、欧洲等有类似静止卫星覆盖的地区。应用上,研究结果为我国臭氧污染的精准防控提供了更科学的观测依据。更准确的臭氧浓度图谱有助于识别真实的污染热点和传输路径,支撑更有效的减排策略制定。健康风险评估方面,研究校正了以往可能被高估的健康负担,为公共卫生决策提供了更可靠的数据基础。同时,研究揭示的城乡臭氧暴露差异细节,也为环境公平性研究提供了新视角。
本研究的亮点在于:1)重要的发现:首次量化了基于新旧卫星技术的臭氧健康风险评估差异(约30%的高估),揭示了传统极轨卫星监测在评估臭氧暴露风险方面的局限性。2)方法的创新性:充分利用了全球首颗静止轨道紫外光谱仪GEMS的逐时数据优势,创新性地将NO2、HCHO、UVI这三个关键光化学参数的昼夜动态同时引入机器学习模型,实现了对臭氧光化学过程更精细的刻画。3)研究对象的特殊性:聚焦于中国这一臭氧污染严重且健康负担重的区域,并深入分析了城市、半城市、乡村不同下垫面的差异,结论具有明确的现实针对性。4)系统性验证:通过多角度的交叉验证、与广泛使用的TROPOMI产品的全面对比、以及详尽的敏感性分析,确保了研究结论的稳健可靠。