该文档属于类型a,即报告了一项单一原创研究。以下是针对该研究的学术报告:
研究作者及机构
本研究由Lei Kong、Xiao Tang、Jiang Zhu等来自中国科学院大气物理研究所(IAP, CAS)、中国环境监测总站(CNEMC)、北京大学、北京师范大学、上海环境监测中心、广东省环境监测中心、安徽光学精密机械研究所、华南理工大学、南开大学等机构的学者共同完成。研究于2021年发表在期刊《Earth System Science Data》上。
学术背景
空气污染是影响人类健康的重要环境问题,尤其在中国,随着经济的快速发展,空气污染物排放量显著增加,导致严重的空气污染问题。自2013年以来,中国政府实施了一系列严格的空气污染控制措施,空气质量发生了显著变化。为了全面评估这些变化及其对健康和环境的影响,亟需一个高精度、高时空分辨率的长期空气质量数据集。然而,现有的空气质量数据集在时间分辨率和空间覆盖范围上存在局限性,难以满足精细化的研究需求。因此,本研究旨在通过数据同化技术,结合地面观测数据,开发一个高分辨率的中国空气质量再分析数据集(CAQRA),以提供2013-2018年间中国六种常规空气污染物(PM2.5、PM10、SO2、NO2、CO和O3)的高精度时空分布信息。
研究流程
1. 数据同化系统的构建
本研究采用化学数据同化系统(ChemDAS),该系统由三部分组成:嵌套空气质量预测模型系统(NAQPMS)、集合卡尔曼滤波(EnKF)算法和来自中国环境监测总站(CNEMC)的地面观测数据。NAQPMS模型用于模拟大气化学过程,EnKF算法用于将观测数据同化到模型中,地面观测数据则提供了高精度的污染物浓度信息。为了处理观测数据中的异常值,研究团队开发了自动异常值检测方法,确保数据的可靠性。
集合模拟的生成
为了表征模型预测的不确定性,研究团队通过扰动排放量生成50个集合成员。排放量的不确定性基于其误差概率分布函数(PDF)进行扰动,并假设其服从高斯分布。研究还考虑了排放误差的空间相关性,采用各向同性相关模型来描述排放误差的协方差结构。
观测数据的处理
本研究使用了CNEMC提供的PM2.5、PM10、SO2、NO2、CO和O3的每小时地面观测数据。观测数据经过自动异常值检测方法处理,去除了由于仪器故障或环境因素导致的异常值。观测误差包括测量误差和代表性误差,测量误差由仪器精度决定,代表性误差则通过公式计算。
数据同化算法的应用
研究采用局部集合变换卡尔曼滤波(LETKF)算法进行数据同化。LETKF算法通过局部化分析,减少了由于集合成员数量有限导致的虚假长距离相关性。研究还引入了膨胀因子,以补偿背景误差协方差的低估问题。
数据集的验证与评估
研究采用五折交叉验证(CV)方法评估再分析数据集的质量。通过随机将观测站点分为五组,每次同化时省略一组数据,并将分析结果与未参与同化的观测数据进行比较。此外,研究还使用美国国务院空气质量监测项目提供的独立PM2.5观测数据对再分析数据集进行了验证,并与卫星估算的PM2.5浓度进行了比较。
主要结果
1. 再分析数据集的质量
交叉验证结果表明,CAQRA数据集在重现中国地面空气污染物浓度方面表现出色。PM2.5和PM10的交叉验证R²值分别为0.81和0.72,CO的交叉验证均方根误差(RMSE)为0.54 mg/m³,其他污染物的RMSE为16.4-39.3 µg/m³。与欧洲中期天气预报中心(ECMWF)的CAMSRA数据集相比,CAQRA数据集在表征中国地面气态空气污染物方面具有更高的精度。
PM2.5再分析数据的验证
与美国国务院空气质量监测项目的独立观测数据相比,CAQRA数据集的PM2.5再分析数据表现出良好的一致性,不同城市的R²值为0.74-0.86,RMSE为16.8-33.6 µg/m³。与卫星估算的PM2.5浓度相比,CAQRA数据集的精度高于大多数卫星估算结果。
空气污染物的时空分布
CAQRA数据集提供了2013-2018年间中国六种常规空气污染物的高分辨率时空分布信息。PM2.5和PM10的浓度在华北平原和东南地区最高,SO2和CO的浓度在山东、山西和河北等煤炭消耗大省最高,NO2和O3的浓度则在大城市群和华北平原地区较高。
空气污染物的年际变化
CAQRA数据集还捕捉到了中国空气质量的年际变化趋势。PM2.5和PM10的浓度在2013-2018年间显著下降,其中华北和东北地区的下降趋势最为明显。这一趋势主要归因于排放量的减少,而气象条件的变化仅解释了小部分下降趋势。
结论
CAQRA数据集是中国首个同时提供六种常规空气污染物地面浓度的高分辨率空气质量再分析数据集,具有重要的科学和应用价值。该数据集可用于空气污染的健康影响评估、中国空气质量变化的调查、模型评估和卫星校准、监测站点优化以及基于统计或人工智能(AI)的预测模型的训练数据。所有数据集均可通过指定链接免费获取。
研究亮点
1. 高精度和高分辨率:CAQRA数据集提供了2013-2018年间中国六种常规空气污染物的高精度、高时空分辨率信息,填补了现有数据集的空白。 2. 数据同化技术的创新应用:研究采用集合卡尔曼滤波(EnKF)算法和局部集合变换卡尔曼滤波(LETKF)算法,显著提高了数据同化的精度和效率。 3. 多源数据的综合验证:研究通过交叉验证、独立观测数据验证和卫星数据对比,全面评估了再分析数据集的质量,确保了数据的可靠性。 4. 长期趋势的捕捉:CAQRA数据集成功捕捉到了中国空气质量的年际变化趋势,为评估空气污染控制措施的效果提供了重要依据。
其他有价值的内容
研究还探讨了不同地区空气污染物浓度的空间异质性及其与排放源和气象条件的关系,为进一步研究中国空气污染的成因和机制提供了重要参考。