关于“借助Himawari-8短波辐射产品实现小时级近地面臭氧浓度的空间连续制图”研究的学术报告
本研究由来自中南大学地球科学与信息物理学院以及中南大学地质灾害感知认知与预测实验室的张逸潇、王伟、何俊辰、金芷利和王楠共同完成。该研究于2023年2月21日在线发表于学术期刊 “giscience & remote sensing”,文章标题为 “spatially continuous mapping of hourly ground ozone levels assisted by himawari-8 short wave radiation products”,刊发于该刊第60卷第1期,文献编号为2174280。
一、研究的学术背景
本研究的核心科学领域属于大气环境遥感与空间信息科学(Geographic Information Science)的交叉领域,具体聚焦于利用遥感技术监测与评估近地面臭氧污染。近地面臭氧是一种对大气化学、气候变化和空气污染均有显著影响的有害氧化剂与温室气体,也是城市光化学烟雾的典型组分。过去20年间,中国东部地区的近地面臭氧浓度呈现显著上升趋势,已成为京津冀、长三角、珠三角和成渝等主要城市群面临的突出区域性环境问题。与已得到初步控制的PM2.5不同,地面臭氧污染持续恶化,成为环境管理部门下一步治理的重点。
准确监测近地面臭氧污染的时空分布,对于支持流行病学研究、制定有效的污染防控政策至关重要。然而,传统的站点监测方法因站点空间分布不均且稀疏,无法获取区域连续浓度场。化学传输模型虽然能实现空间连续模拟,但存在较大不确定性且通常缺乏小时分辨率。极轨卫星虽能提供区域序列观测,但重访周期长,难以满足分析臭氧日变化的时频需求。静止气象卫星凭借其高时间分辨率(如10分钟)成为弥补上述局限的潜力途径,但其观测(如气溶胶)常受云层影响,导致反演结果空间不连续。
在此背景下,本研究创新性地引入日本葵花八号静止气象卫星的短波辐射(Short Wave Radiation, SWR)产品作为关键输入变量,旨在构建一个能够生成高时空分辨率(小时、5公里)、空间连续的中国大部分地区近地面臭氧浓度估算模型。研究的核心目标在于:1)验证Himawari-8 SWR数据在估算小时级地面臭氧方面的潜力;2)开发一种基于集成学习算法(袋装决策树)的稳健估算模型;3)揭示中国区域地面臭氧浓度在小时、日、周、季节尺度上的详细时空分布格局;4)探讨臭氧污染的“周末效应”及其生成机制。
二、研究的详细工作流程
研究覆盖了2018年3月1日至2019年2月28日整整一年的时间段,研究区域为中国大部分地区(葵花八号卫星完整圆盘覆盖范围,约东经80°以东)。整个研究工作流程严谨而系统,主要包含以下几个核心步骤:
步骤一:多源数据集的收集与预处理 研究集成了极其丰富的多源异构数据集,作为模型的输入特征,旨在全面刻画影响臭氧生成、扩散和消耗的物理化学过程。所有数据均进行了时空一致性处理,重采样或插值至与Himawari-8 SWR数据一致的5公里空间分辨率。 1. 响应变量:从中国环境监测总站(CNEMC)的1501个地面监测站点获取小时级臭氧浓度实测数据。 2. 核心辐射数据(Himawari-8 SWR产品):这是本研究的核心创新输入。产品提供三种辐射通量数据:紫外辐射A、紫外辐射B和总短波辐射。其最大的优势在于基于平面平行辐射传输理论,能够将晴空大气和云层的影响解耦处理,从而几乎不受云层遮挡影响,提供了覆盖全中国的、无数据缺失的24小时地表太阳辐射数据。 3. 大气散射因子:使用Himawari-8同化的气溶胶光学厚度和PM10浓度数据,以表征气溶胶对太阳辐射的消减作用及其对光解速率的影响。 4. 气象因子:从欧洲中期天气预报中心的第五代再分析数据集中提取,包括边界层高度、气温、总蒸发量、相对湿度、地表气压、风速和向下的表面热辐射,这些是影响臭氧光化学反应速率及扩散、沉降的关键环境变量。 5. 背景臭氧:结合臭氧监测仪的总柱臭氧和微波临边探测仪的平流层柱臭氧产品,估算区域背景臭氧浓度。 6. 臭氧前体物:利用OMI传感器获取的二氧化氮和甲醛柱浓度数据,分别作为氮氧化物和挥发性有机化合物的代理指标。同时引入对流层污染测量仪的CO柱浓度产品。 7. 土地利用与植被因子:使用MODIS的土地覆盖类型产品和归一化差值植被指数,以表征下垫面类型和植被覆盖情况。 8. 地形因子:来自美国地质调查局的90米分辨率数字高程模型数据。
步骤二:时空匹配与样本构建 为确保模型训练的准确性,建立了严格的时空匹配准则。对于每个臭氧监测站点在每个小时的数据点,提取以其为中心、5公里半径范围内的所有输入因子栅格平均值。时间匹配上,小时分辨率数据的时间差需小于1小时;日分辨率数据的时间差需小于24小时,并选取时间序列上最接近的观测值。通过此过程,将站点臭氧观测值与对应时刻、对应位置的多种环境变量进行匹配,形成了庞大的、可用于模型训练和验证的匹配样本集。
步骤三:模型构建与优化 本研究选用袋装决策树模型作为估算工具。相比于随机森林,袋装决策树允许所有输入特征都参与每次分裂过程,而不是随机选取子集,这在本研究希望充分利用所有预测因子的背景下更为合适。该模型通过自助采样法构建多个决策树,并通过平均它们的预测结果来提高精度和防止过拟合。 研究者采用了网格搜索方法进行超参数优化,针对集成树的数量、每片叶子的最小观测数、学习周期数等参数进行调优,目标是最大化验证集(占总样本10%)的决定系数。这种模型选择和处理方法旨在构建一个兼具高精度和强泛化能力的估算框架。
步骤四:模型验证与评估策略 为全面评估模型的性能、稳健性和空间外推能力,研究采用了多种严格的交叉验证策略: 1. 直接拟合:将所有匹配样本用于训练模型,并用同一模型预测所有样本,用于评估模型的整体拟合能力。 2. 样本交叉验证:随机将所有样本分为10份,轮流使用其中9份训练、1份验证,重复10次。 3. 站点交叉验证:随机将所有监测站点分为10组,轮流使用其中90%的站点数据训练模型,并用剩余的10%站点数据进行预测验证。这种方法模拟了现实中部分站点数据缺失时,利用周边站点信息进行插补的场景。 4. 聚类交叉验证:使用K-means空间聚类方法,将所有监测站点划分为20个空间聚类。在每次验证中,将一个完整聚类的所有站点数据作为验证集,其余聚类数据作为训练集。这是最严格的验证方式,用于测试模型在完全未采样区域(远离所有监测站点)的预测能力。
评估指标包括决定系数、平均绝对误差、均方根误差和相对均方根误差。
步骤五:时空制图与分析 利用训练好的最优袋装决策树模型,结合完整的、空间连续的输入因子数据集(特别是无缺失的SWR数据),逐小时生成覆盖中国大部分地区的5公里分辨率臭氧浓度空间分布图。基于此,进一步分析了臭氧浓度的季节平均、日变化、典型污染日过程以及工作日与周末的差异,以揭示其时空演变规律和潜在驱动机制。
三、研究的主要结果
1. 模型估算性能卓越且稳健 验证结果表明,所构建的模型具有优异的精度和泛化能力。 * 总体性能:直接拟合的决定系数高达0.95,显示出模型极强的学习能力。更重要的是,10折站点交叉验证的决定系数达到0.87,MAE和RMSE分别为13.3 μg/m³和18.3 μg/m³,表明模型在模拟未参与训练站点的臭氧浓度时仍保持高精度。10折样本交叉验证的R²为0.89。 * 空间外推能力:最具挑战性的20折空间聚类交叉验证的R²仍能达到0.69,尽管精度有所下降(RMSE升至约25 μg/m³),且存在轻微的系统性低估,但这证明了模型具备相当的空间可扩展性,能够对远离监测网络的区域进行有一定可信度的估算。 * 时间普适性: * 季节尺度:模型在秋季表现最佳(站点CV R² = 0.86),冬季相对最弱(R² = 0.78)。冬季性能稍弱可能与太阳辐射减弱、光化学反应主导地位下降,以及气象条件与臭氧变化的滞后关系更复杂有关。 * 日变化尺度:模型在全天各小时(09:00至16:00,北京时间)均表现良好,站点CV R²在0.73(09:00)至0.86(13:00-16:00)之间。日间估算偏差的小时平均值绝对值仅为2.62 μg/m³。
2. 揭示了近地面臭氧显著的时空异质性 基于模型生成的连续浓度场,研究清晰地刻画了中国区域地面臭氧污染的多尺度时空格局: * 季节分布:夏季污染最严重,全国平均浓度达87.1 ± 28.2 μg/m³,且空间差异大;春季平均浓度与夏季相近(86.3 μg/m³),但空间变异性较小;秋季和冬季浓度依次降低。这种分布与夏季强太阳辐射、高温促进光化学反应,以及春季可能的平流层臭氧入侵和植物源VOCs排放增加等因素有关。南方沿海地区夏季浓度相对较低,可能与夏季风带来的稀释作用和频繁降水有关。 * 日变化:臭氧浓度呈现明显的单峰型日变化。午后(14:00)浓度最高(87.4 μg/m³),这与太阳辐射最强的时间相吻合。上午(09:00)浓度最低(59.1 μg/m³),归因于夜间的滴定反应和干沉降过程。研究还观察到,由于太阳位置西移,臭氧高值区呈现自东向西迁移的现象。 * 典型污染事件刻画:研究以2018年6月30日为例,展示了模型捕捉特定日严重臭氧污染事件的能力。该日京津冀及山东等地出现大范围高浓度臭氧污染,模型成功再现了其空间范围和日变化过程,与站点观测高度一致。 * “周末效应”的空间分异:通过对比工作日和周末的平均臭氧浓度,研究发现了显著的“臭氧周末效应”,且其表现形式存在区域差异。在氮氧化物浓度较高的河北东北部,周末臭氧浓度反而高于工作日。这可能是因为周末机动车尾气排放减少,削弱了高浓度一氧化氮对臭氧的“滴定消耗”效应,导致臭氧净浓度上升。而在四川盆地和长江河谷地区,周末臭氧浓度低于工作日,这可能与周末前体物排放整体减少直接相关。这一发现为不同区域制定差异化的臭氧前体物协同管控策略提供了重要参考。
3. 明确了Himawari-8 SWR产品的独特价值 敏感性分析表明,虽然加入SWR数据对模型整体精度的直接提升幅度不大(*R指标提升约0.03),但这主要是因为部分气象因子(如边界层高度、气温)已包含了与之相关的信息。然而,SWR数据的核心价值在于其提供了高时空分辨率且空间连续的太阳辐射信息。这使得模型能够摆脱传统卫星反演中云层导致的数据缺失限制,从而首次实现了小时级、5公里分辨率、空间连续的地面臭氧浓度制图。这是本研究相比以往依赖热红外波段或云下存在数据缺失的研究(如文中对比的SGLBoost方法)的关键创新和优势所在。
四、研究的结论与价值
本研究成功建立并验证了一个基于Himawari-8短波辐射产品和袋装决策树模型的、能够生成小时级高分辨率空间连续地面臭氧浓度场的方法体系。该方法在精度、时空普适性和空间外推能力上均表现出色。
科学价值: 1. 方法论创新:首次系统性将具有全天候、无缺失特性的静止卫星短波辐射产品作为核心驱动因子,用于近地面臭氧遥感估算,为解决遥感反演中云层遮挡导致的空间不连续难题提供了新思路。 2. 数据产品贡献:生成了2018-2019年中国区域高时空分辨率(小时、5公里)的臭氧浓度连续数据集,弥补了现有观测和模型数据在时空分辨率与连续性上的不足,为深入理解中国臭氧污染的精细化时空动态提供了宝贵的数据基础。 3. 机理解析贡献:通过对生成浓度场的多尺度分析,不仅定量描述了臭氧污染的时空格局,还诊断了“周末效应”的区域分异,增进了对中国不同区域臭氧生成化学机制(受VOCs控制或受NOx控制)的认识。
应用价值: 1. 环境管理支撑:高时空分辨率的污染分布图有助于精准识别污染热点区域和关键时段,为环境部门实施精细化、动态化的臭氧污染管控提供科学依据。 2. 健康影响研究:连续的人口暴露水平估算数据,能够更准确地评估臭氧污染对公众健康的短期和长期影响,支持相关的流行病学研究。 3. 模型验证与数据同化:生成的数据集可用于验证和校准化学传输模型,或作为数据同化系统中的观测约束,提升模型的模拟性能。
五、研究的亮点
六、其他有价值内容
研究还探讨了模型在估算最大8小时滑动平均臭氧浓度方面的潜力。尽管由于缺少夜间SWR数据,估算的MDA8 O3并非完整的24小时最大值,但其与现有的高质量MDA8数据集相比仍表现出有竞争力的精度。这预示着未来若能融合夜间观测或模型数据,该方法在生成高分辨率MDA8产品上具有巨大潜力。此外,文章也坦诚讨论了模型在东南沿海地区误差相对较大、对冬季臭氧模拟精度稍弱等局限性,并分析了可能原因(如地形阻滞效应、气象滞后响应等),为后续研究指明了改进方向,体现了科学的严谨性。