分享自:

基于机器学习的高分辨率中国月气温数据集(1951–2020)

期刊:earth syst. sci. dataDOI:10.5194/essd-14-3273-2022

本文档属于类型a,即报告了一项单一原创研究的科学论文。以下是针对该研究的学术报告:

该研究由Qian He、Ming Wang、Kai Liu、Kaiwen Li和Ziyu Jiang等作者共同完成,他们分别来自北京师范大学的灾害与应急管理学院、地理科学学院以及国家安全与应急管理学院。该研究于2022年7月15日发表在《Earth System Science Data》期刊上,标题为“GPRChinaTemp1km: A High-Resolution Monthly Air Temperature Data Set for China (1951–2020) Based on Machine Learning”。

学术背景

空气温度是环境与生态科学中多个应用领域的关键变量。然而,现有的空间插值方法精度较低,且中国现有的长期网格化气温数据分辨率较粗。气象站的点观测数据虽然能提供长期的气温数据序列,但无法反映空间连续信息。为了解决这一问题,研究者开发了一种基于机器学习工具的气温数据空间插值方法,旨在生成高精度的中国气温数据集。

研究的主要目标是利用机器学习方法,从1951年至2020年期间的气象站数据中生成高分辨率(1公里)的月均气温、月最高气温和月最低气温数据集。该数据集被命名为GPRChinaTemp1km,并公开发布以供科研使用。

研究流程

研究流程包括以下几个主要步骤:

  1. 数据准备
    研究者从中国气象数据服务中心获取了1951年至2020年期间中国613个气象站的月最高气温、月最低气温和月均气温数据。这些数据被随机分为训练集(70%)和测试集(30%)。此外,研究还使用了NASA的SRTM数字高程模型(DEM)数据,并将其重采样为1公里分辨率。

  2. 模型选择与训练
    研究者采用了三种机器学习模型进行气温插值:随机森林(Random Forest, RF)、支持向量机(Support Vector Machine, SVM)和高斯过程回归(Gaussian Process Regression, GPR)。这些模型分别用于插值月最高气温、月最低气温和月均气温。通过比较平均绝对误差(MAE)、均方根误差(RMSE)、决定系数(R²)和残差,研究者发现GPR模型在插值精度上明显优于其他两种模型。

  3. 与传统插值方法的比较
    为了进一步验证机器学习方法的优越性,研究者还将GPR模型与三种传统插值方法进行了比较:反距离加权(Inverse Distance Weighting, IDW)、普通克里金法(Ordinary Kriging, OK)和ANUSPLIN(澳大利亚国立大学样条插值法)。结果显示,GPR模型在插值精度和鲁棒性上均优于传统方法。

  4. 与其他数据集的比较
    研究者还将GPRChinaTemp1km数据集与TerraClimate、FLDAS和ERA5等现有气温数据集进行了比较。结果表明,GPR模型生成的气温数据在精度上显著高于这些现有数据集。

  5. 数据集生成与分析
    最终,研究者利用GPR模型生成了1951年至2020年期间中国1公里分辨率的月均气温、月最高气温和月最低气温数据集。研究者还使用Theil-Sen中值趋势分析和Mann-Kendall检验分析了气温的时空变化趋势,发现中国的月均气温和月最低气温在每个月均呈现显著上升趋势,而月最高气温则表现出更明显的空间异质性。

主要结果

  1. 模型性能评估
    GPR模型在插值月均气温、月最高气温和月最低气温时均表现出最高的精度,其平均MAE和RMSE分别为0.79°C和0.79°C,R²值为0.97。相比之下,RF和SVM模型的误差较大,尤其是RF模型在早期年份的表现较差。

  2. 与传统方法的比较结果
    GPR模型在插值精度上显著优于IDW、OK和ANUSPLIN等传统方法,尤其是在夏季和冬季的插值误差较小。

  3. 与其他数据集的比较结果
    GPRChinaTemp1km数据集在精度上显著高于TerraClimate、FLDAS和ERA5等现有数据集,尤其是在反映中国复杂地形和空间异质性方面表现更优。

  4. 气温趋势分析结果
    中国的月均气温和月最低气温在每个月均呈现显著上升趋势,而月最高气温则表现出更明显的空间异质性,部分地区呈现显著上升、非显著上升或非显著下降的趋势。

结论

该研究成功开发了一种基于机器学习的高精度气温插值方法,并生成了1951年至2020年期间中国1公里分辨率的月均气温、月最高气温和月最低气温数据集。该数据集在精度和鲁棒性上均优于现有数据集,能够更好地反映中国复杂地形和空间异质性。该研究为全球变暖和气候变化研究提供了重要的数据支持,具有较高的科学价值和应用价值。

研究亮点

  1. 高精度气温数据集
    该研究生成了中国1951年至2020年期间1公里分辨率的高精度气温数据集,填补了现有数据集的空白。

  2. 机器学习方法的优越性
    研究表明,GPR模型在气温插值精度上显著优于传统方法和现有数据集,尤其是在处理复杂地形和空间异质性方面表现更优。

  3. 公开数据集
    该数据集已公开发布,供科研人员免费使用,有助于推动相关领域的研究进展。

其他有价值的内容

研究者还通过实验验证了GPR模型在不同区域的鲁棒性,结果表明该模型在稀疏气象站区域的插值精度依然较高。此外,研究者还提供了详细的模型参数设置和数据处理流程,为其他研究者提供了参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com