分享自:

滑坡易发性关键问题综述及其基于半监督非对称理论的解决方案

期刊:岩石力学与工程学报DOI:10.3724/1000-6915.jrme.2024.1003

《岩石力学与工程学报》网络首发论文学术报告

作者及机构
本研究的通讯作者为南昌大学建筑工程学院的黄发明副教授(第一作者)与蒋水华教授(通讯作者),合作单位包括中国地质大学(武汉)巴东地质灾害国家野外科学观测研究站、成都理工大学地质灾害防治与地质环境保护国家重点实验室、核工业江西工程勘察研究总院有限公司。论文于2025年9月19日在《岩石力学与工程学报》(*Chinese Journal of Rock Mechanics and Engineering*)网络首发,ISSN 1000-6915,CN 42-1397/O3。

学术背景
滑坡易发性预测(Landslide Susceptibility Prediction, LSP)是区域滑坡风险评估的基础,也是全球地质灾害防治研究的难点。传统方法在模型选择、环境因子组合、非滑坡样本定义等方面存在显著局限性,例如:监督机器学习依赖对称样本比例(1∶1),与野外滑坡实际分布(非滑坡面积远大于滑坡)不符;非滑坡样本标签简单赋“0”忽略其潜在滑动概率;评价指标单一导致结果可靠性不足。

针对这些问题,本研究提出基于半监督非对称理论(Semi-Supervised Imbalanced Theory)的解决方案,以江西省安远-寻乌县为案例,验证该理论在复杂山地丘陵区的工程适用性,旨在为滑坡风险精准防控提供新思路。

研究流程与方法
1. 环境因子构建与预测单元划分
- 环境因子选择:遵循“数据准确、类型丰富、物理意义明确”原则,选取地形(坡度、曲率等)、水文(地形湿度指数、降雨量)、地表覆盖(NDVI、公路密度)、岩性(岩土类型、断层距离)4大类13个高频因子。
- 斜坡单元划分:采用多尺度分割法(Multi-Scale Segmentation, MSS),基于DEM提取坡向和山体阴影,通过区域合并算法生成地貌自适应的斜坡单元,相比传统水文分析法更高效且减少人为误差。

  1. 初始滑坡易发性建模

    • 样本准备:收集研究区历史滑坡点作为正样本(标签值=1),随机选取等量非滑坡区单元作为负样本(标签值=0),构建1∶1对称数据集。
    • 模型训练:使用随机森林(Random Forest, RF)分类模型,输入环境因子频率比,按70%/30%划分训练集/测试集,预测初始易发性,并划分为极低、低、中、高、极高5个等级。
  2. 半监督非对称理论的核心步骤

    • 样本优化:剔除初始低/极低易发区内的滑坡点(可能为编录误差),确保正样本可靠性;从极低/低易发区随机选取非滑坡样本,比例设置为1∶1至1∶260(如1∶5、1∶180等)。
    • 标签改进:将初始易发性值(非零概率)赋给非滑坡样本,替代传统“0”标签,更符合地质实际。
    • 二次建模:以优化后的样本输入RF回归模型,生成不同比例下的易发性图,通过综合评价法确定最优比例。
  3. 结果验证与评价

    • 精度指标:采用ROC曲线下面积(AUC)和预测率曲线(Prediction Rate Curve)评估模型性能。实验显示,当滑坡/非滑坡比例从1∶1升至1∶180时,ROC精度从0.905提升至0.957,预测率精度从0.898增至0.937;比例超过1∶180后精度趋于稳定。
    • 野外验证:2022–2024年新增的6处滑坡事件均位于预测的极高/高易发区,验证了模型的实际应用价值。

主要结果与结论
1. 非对称比例优化:1∶180为最优样本比例,其AUC达0.957,显著优于传统对称比例(1∶1)。
2. 标签赋值改进:非滑坡样本赋小概率值(初始易发性指数)能更真实反映地质风险。
3. 工程适用性:在赣南山地丘陵区的成功应用,证明半监督非对称理论可推广至其他地质复杂区域。

科学价值与应用意义
- 理论创新:首次将半监督学习与非对称样本理论结合,解决了滑坡易发性预测中样本比例与标签赋值的核心难题。
- 技术贡献:提出的MSS斜坡单元划分法和综合评价法(ROC+预测率+易发性指数分布)为相关研究提供了标准化流程。
- 实践价值:成果可直接服务于区域地质灾害防控规划,例如指导安远-寻乌县滑坡高风险区的监测与治理。

研究亮点
1. 方法学突破:通过二次迭代自训练算法,实现了滑坡编录误差自动校正与非滑坡样本精准选择。
2. 跨学科融合:结合机器学习(RF)、地理信息系统(GIS)与工程地质学,构建了多维评价体系。
3. 数据驱动决策:基于大量比例试验(1∶1至1∶260)的定量分析,为样本比例设定提供了实证依据。

其他有价值内容
- 研究对比了RF与其他模型(如SVM、CNN)的性能,证实树模型在稳定性与效率上的优势。
- 强调了环境因子物理意义的重要性,避免单纯依赖统计筛选导致信息丢失。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com