分享自:

全球历史气候数据库HCLIM的构建与验证

期刊:scientific dataDOI:10.1038/s41597-022-01919-w

这篇文档属于类型a,即报告了一项原创性研究的学术论文。以下是针对该研究的详细学术报告:


主要作者与发表信息

本研究由Elin Lundstad(瑞士伯尔尼大学地理研究所及Oeschger气候变化研究中心)领衔,联合来自全球28个机构的30余位学者共同完成,包括Yuri BrugnaraStefan Brönnimann等。论文题为《The Global Historical Climate Database HCLIM》,发表于Nature旗下期刊Scientific Data(2023年,卷10,文章编号44),DOI号为10.1038/s41597-022-01919-w。


学术背景

研究领域与动机

研究聚焦于历史气候数据重建(historical climate reconstruction),旨在填补工业革命前(preindustrial period)全球气象观测数据的空白。早期仪器观测数据(instrumental observations)对理解气候变率(climate variability)、极端事件及人类活动影响至关重要,但现有数据库(如GHCN、ISTI)存在覆盖不全、重复率高、未数字化等问题。

研究目标

  1. 整合全球范围内1890年之前开始的月度气象数据(温度、气压、降水等);
  2. 通过数据抢救(data rescue)新增1525条未数字化记录;
  3. 构建迄今最全面的工业革命前月度气候数据库(HCLIM)。

研究流程与方法

1. 数据收集与抢救

  • 数据来源:整合28个现有数据库(如GHCN、ISTI、Berkeley Earth)及16个小规模数据集(表2-4),覆盖118个国家。
  • 数据抢救:从手写日志(如18世纪巴黎皇家医学会记录)数字化1235个站点的13822站年(station-years)数据,采用学生人工录入与元数据校对。
  • 特殊处理:对早期非标准化仪器(如Hauksbee温度计)进行单位转换,剔除1770年前无温度标定记录的不可靠数据。

2. 数据处理与质量控制

  • 时间分辨率统一化:将亚日数据(subdaily)转换为月度均值,采用ERA5-Land再分析数据校正日循环偏差(diurnal cycle correction)。
  • 质量控制(QC)
    • 范围检查:剔除物理不合理值(如负降水);
    • 气候学离群值检测:5倍标准差阈值筛选异常值(表6);
    • 人工复核:标记可疑数据(如巴黎1726-1747年气压缺失段)。

3. 去重与合并

  • 算法开发:基于地理距离(<50 km)和皮尔逊相关系数(>0.98)识别重复记录(图3)。
  • 优先级规则:优先保留最早起始记录或均一化(homogenized)数据(如HISTALP数据集)。

4. 断点检测(Breakpoint Detection)

  • 统计方法:Welch’s t检验结合5年滑动窗口识别非均一性(图4a),标记10年以上数据缺口为断点。
  • 结果:76%温度序列、41%气压序列存在显著非均一性。

5. 数据格式化与发布

  • 格式标准:采用SEF(Station Exchange Format)存储,包含元数据(如观测时间、仪器类型)和质控标记(图5)。
  • 平台:数据公开于PANGAEA(DOI:10.1594/pangaea.940724)。

主要结果

  1. 数据库规模

    • 总量:12452条月度序列(表8),含3632条温度、4943条降水记录(表9)。
    • 时间跨度:最早记录为1586年德国降水日数(Resterhafe-osteel站),温度记录始于1658年巴黎(图6)。
  2. 地理覆盖

    • 欧洲主导:75%的早期记录集中于欧洲(图7),但新增数据扩展了非洲(如南非1747年)、亚洲(北京1757年)等区域。
    • 长序列案例:巴黎温度(360年)、布拉格降水日数(291年)等(表11)。
  3. 数据质量

    • QC通过率:温度序列仅0.0066%标记异常(表12),全球数据库(如GHCN)错误率更低。
    • 非均一性:温度序列平均均一周期33年,需用户进一步均一化处理。

结论与价值

科学意义

  1. 填补空白:HCLIM是目前最全面的工业革命前月度气候数据集,支持气候重建(如火山事件影响分析)与模型验证(如Paleo-RA)。
  2. 多学科应用:为极端事件研究(如1783年Laki火山冬季)、长期气候变率(如北大西洋振荡)提供数据基础。

应用价值

  • 政策参考:为IPCC评估报告提供1720-1800年基准期数据(Hawkins et al., 2017);
  • 数据抢救示范:推动全球数据共享(如Copernicus Climate Service)。

研究亮点

  1. 方法创新
    • 开发去重算法与断点检测流程,解决多源数据冗余问题;
    • 结合ERA5-Land校正历史观测时间偏差。
  2. 数据规模:新增1525条抢救记录,占总量12%。
  3. 开放科学:所有代码(R/Python)与数据公开,符合FAIR原则。

其他价值

  • 历史气候事件分析:如1815年坦博拉火山“无夏之年”的月度分辨率重建;
  • 教育价值:学生参与数据数字化,培养气候数据科学人才。

(报告完)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com