学术研究报告:基于可解释XGBoost模型的四川省城镇化对滑坡敏感性的动态影响研究
一、作者与发表信息
本研究由西南交通大学地质科学与工程学院的何宇峰、丁明涛(通讯作者)、段宇、郑浩、吴建波(兼属四川省地质环境调查研究中心和四川华地建设工程有限公司)及冯丽共同完成,发表于《Engineering Geology》期刊2025年第357卷,文章编号108372。
二、研究背景与目标
科学领域与背景:
滑坡是山区最致命的地质灾害之一,而城镇化(urbanization)通过人类工程活动、植被破坏和降水模式改变等因素加剧了滑坡风险。然而,城镇化如何定量影响滑坡敏感性(landslide susceptibility)的动态变化尚未明确。四川省作为中国滑坡高发区,2000–2020年间城镇化率显著提升(不透水地表面积增长137%),为研究这一关联提供了理想案例。
研究目标:
1. 量化2000–2020年四川省滑坡敏感性指数(LSI)的空间分布与变化;
2. 利用可解释机器学习(interpretable machine learning)揭示城镇化对LSI的驱动机制;
3. 提出滑坡风险管理的理论框架与实践建议。
三、研究方法与流程
城镇化类型划分
- 数据来源:使用中国30米年度土地覆盖数据集(CLCD30)将2000年与2020年土地类型重新分类为四类城镇化区域(UTs):
- 城市区(U):持续为不透水地表;
- 非城市区(NU):持续为非城市用地;
- 动态城市化区(DU):由非城市转为城市;
- 动态非城市区(DNU):由城市转为非城市。
- 样本量:覆盖四川省全域,面积达4.87×10⁶ km²。
滑坡敏感性评估模型
- 输入变量:9个滑坡条件因子,包括静态因子(高程、坡度、地形起伏等)和动态因子(年降水量AP、归一化植被指数NDVI、道路距离DTR)。
- 模型构建:基于XGBoost算法,通过二阶梯度优化和正则化防止过拟合,利用70%滑坡事件(9992起)训练模型,30%验证。
- 可解释性分析:采用SHAP(Shapley Additive Explanations)值量化各因子对LSI的贡献,揭示非线性关系。
数据获取与处理
- 滑坡数据:来自成都区域气象中心地质灾害预报系统(CRMCGHFS),包含9992起滑坡事件的时间、位置、体积和触发因素(降雨、地震、工程活动)。
- 环境数据:
- 降水数据来自GPM卫星;
- 地形数据源于90米分辨率DEM;
- NDVI数据空间分辨率为250米。
模型验证
- 使用受试者工作特征曲线(ROC)与曲线下面积(AUC)评估模型性能,2000年和2020年的AUC分别为0.835和0.86,表明预测能力优异。
四、主要结果
滑坡敏感性变化
- 2000–2020年间,四川省18.56%的区域LSI显著增加(平均增幅14%),高风险区(LSI>0.74)面积增长31.49%,集中分布于川西和川北河谷地带。
- 城镇化类型差异:
- 城市区(U)和动态城市化区(DU)的极高风险区面积分别增加2791 km²和2316 km²;
- 动态非城市区(DNU)因地震后植被恢复滞后,LSI增幅达17.64%。
关键驱动因子
- 全局分析:高程(ele)和地形起伏(TR)是主导因子,SHAP值显示两者分别通过坡度稳定性和微地貌影响滑坡。
- 城镇化区域差异:
- 城市区(U):道路建设(DTR)和降水(AP)是主要驱动,距道路250米内滑坡风险显著升高;
- 动态城市化区(DU):人类活动与植被退化(NDVI<6000)协同加剧敏感性;
- 非城市区(NU):2008年汶川地震后植被破坏导致NDVI贡献度上升。
五、结论与价值
科学价值:
- 首次通过可解释机器学习量化了城镇化对滑坡敏感性的动态影响,揭示了不同城镇化阶段的驱动机制差异。
- 提出“城镇化—因子耦合—滑坡风险”分析框架,为山区地质灾害研究提供新范式。
应用价值:
- 建议城市规划中加强道路工程的地质风险评估;
- 在动态城市化区优先实施植被恢复工程;
- 针对地震高风险区(如DNU),需制定长期滑坡监测策略。
六、研究亮点
- 方法论创新:结合XGBoost与SHAP方法,解决了传统机器学习模型可解释性不足的问题。
- 动态视角:通过2000–2020年时序数据,捕捉了城镇化进程与滑坡风险的长期关联。
- 区域特异性:揭示了四川省不同城镇化类型的风险驱动机制,为差异化治理提供依据。
七、其他发现
- 城镇化可能通过改变局地气候(如延长降雨持续时间)间接提升滑坡风险,这一机制在U区尤为显著。
- 研究还发现,植被覆盖阈值(NDVI=6000)是抑制滑坡的关键临界值,尤其在DU区需更高植被覆盖以抵消工程活动影响。
该研究为发展中国家的山地城镇化与地质灾害防控提供了重要案例,其方法论框架可推广至其他高风险地区。