基于ICESat-2的横断山区NASA DEM高程精度评价与误差校正研究学术报告
作者与发表信息
本研究由周鹏飞、王艳霞、周汝良(西南林业大学地理与生态旅游学院)合作完成,发表于《西南林业大学学报(自然科学)》2024年第44卷第5期(页码136–146),DOI: 10.11929/j.swfu.202308033。
学术背景
研究领域与科学问题
本研究属于数字高程模型(Digital Elevation Model, DEM)精度评价与校正领域,聚焦于全球DEM产品在复杂地形区的适用性问题。NASA DEM作为2020年发布的新型全球30米分辨率DEM,融合了SRTM、ASTER GDEM和ICESat/GLAS数据,但其在横断山区等高落差复杂地貌的精度表现尚未充分验证。
研究动机与目标
横断山区地形复杂、植被覆盖多样,传统DEM(如SRTM、ASTER GDEM)在此类区域存在高程被高估或低估的系统误差。本研究以星载激光雷达ICESat-2(Ice, Cloud, and land Elevation Satellite–2)的ATL08数据为参考,旨在:
1. 定量评价NASA DEM在横断山区的高程误差特征;
2. 分析坡度、坡向、植被覆盖度等地表变量对误差的影响规律;
3. 对比四种机器学习模型(随机森林RF、反向传播神经网络BPNN、XGBoost、LightGBM)的误差校正效果,为DEM应用提供方法论支持。
研究流程与方法
1. 数据准备与预处理
- 数据来源:
- 参考数据:ICESat-2/ATL08陆地高程数据(精度0.1米),从NSIDC(美国国家冰雪数据中心)获取;
- 实验数据:NASA DEM(30米分辨率);
- 辅助数据:Globeland30地表覆盖数据(2020版)、青藏高原植被覆盖度数据(FVC)。
- 数据清洗:
- 剔除云量标记(cloud_flag_atm>1)、白天数据(night_flag=0)及坡度异常点(terrain_slope>0.01);
- 通过拉依达准则剔除高程差大于阈值(100米)的粗差点,最终保留25,930个有效ICESat-2高程点。
- 基准统一:将NASA DEM的正高基准转换为WGS84椭球高,与ICESat-2基准对齐。
2. 精度评价与误差分析
- 评价指标:平均误差(ME)、平均绝对误差(MAE)、均方根误差(RMSE)、决定系数(R²);
- 误差分布统计:NASA DEM误差呈正态分布,整体ME=−3.5米,MAE=8.2米,RMSE=11.7米;
- 地表变量关联分析:
- 坡度:MAE随坡度增大而升高,>40°时误差显著增加(如48°~56°区间MAE达21.8米);
- 坡向:北坡误差最小(ME=−2.9米),西南坡误差最大(ME=−4.7米);
- 植被覆盖度:FVC>80%时ME显著增大(−7.4米),因植被导致高程被高估;
- 土地利用类型:森林区误差最大(MAE=9.3米),人造地表误差最小(MAE=4.2米)。
3. 机器学习模型构建与校正
- 输入变量:坡度、坡向、起伏度、FVC、土地利用类型;
- 模型选择与参数优化:
- RF:决策树数量500,节点特征数通过网格搜索确定;
- BPNN:3层隐含层,激活函数为ReLU,学习率0.001;
- XGBoost:最大深度6,学习率0.1,正则化项λ=1;
- LightGBM:Leaf-wise生长策略,最大叶子数31。
- 训练与验证:数据集按7:3划分,采用交叉验证优化超参数。
4. 校正结果验证
- 整体精度提升:
- BPNN表现最优,校正后MAE降至6.9米(降低16%),RMSE=10.6米,R²=0.999828;
- XGBoost与BPNN的RMSE相当(10.6米),但BPNN在不同地类中稳定性更佳;
- RF与LightGBM校正后ME均为0米,但MAE改善有限(7.5米)。
- 土地利用类型差异:
- 森林区:BPNN校正后MAE降低2.1米(至7.2米);
- 水体:所有模型改进不显著(MAE降幅<0.5米);
- 冰川区:仅BPNN降低RMSE(12.9米→12.6米)。
主要结果与结论
- NASA DEM误差特征:在横断山区存在系统性低估(ME=−3.5米),误差与地形复杂度、植被覆盖度呈强相关性;
- 机器学习校正有效性:BPNN模型综合表现最佳,尤其适用于森林等高植被覆盖区;
- 方法论贡献:首次将LightGBM等新型算法引入DEM校正,为全球DEM产品优化提供技术参考。
研究价值与亮点
- 科学价值:揭示了NASA DEM在复杂地形的误差机制,填补了该数据在横断山区的精度评价空白;
- 应用价值:为地质灾害评估、水文建模等需高精度DEM的研究提供了数据校正方案;
- 创新性:
- 多模型对比验证,明确BPNN在DEM校正中的优势;
- 首次结合ICESat-2与NASA DEM,构建了横断山区高精度高程基准。
其他发现
- 误差空间分布:高程误差在河谷区表现为低估,在山脊区表现为高估,与地形遮蔽效应相关;
- 模型局限性:XGBoost虽计算效率高,但对小样本地类(如冰川)过拟合风险较高。
本研究为地学领域DEM数据选择与误差处理提供了实证依据,后续可扩展至其他全球DEM产品(如AW3D30、Copernicus DEM)的对比研究。