分享自:

基于空间标记点过程与次渐近标记分布的滑坡数量与规模联合建模研究

期刊:Journal of the Royal Statistical Society Series C: Applied StatisticsDOI:10.1093/jrsssc/qlad077

关于滑坡灾害联合建模新方法的学术报告

本研究由Rishikesh Yadav1, Raphaël Huser1, Thomas Opitz2 和 Luigi Lombardo3 共同完成。1号与2号作者分别隶属于沙特阿拉伯阿卜杜拉国王科技大学(KAUST)的统计项目、计算机、电气和数理科学与工程(CEMSE)学部,以及法国国家农业、食品与环境研究所(INRAE)的生物统计与空间过程部门。3号作者来自荷兰特文特大学的地理信息科学与地球观测学院(ITC)。该项研究成果以“Joint modelling of landslide counts and sizes using spatial marked point processes with sub-asymptotic mark distributions”为题,于2023年发表在《Journal of the Royal Statistical Society, Series C: Applied Statistics》期刊上。

一、 研究背景与目标

该研究属于统计学与地球科学交叉的应用统计领域,特别是空间统计与极端值理论在自然灾害风险评估中的应用。滑坡是全球范围内严重的自然灾害,尤其在山区,每年造成数十亿美元的经济损失并威胁生命安全。传统的滑坡灾害评估多基于“易发性图”,这类模型通常仅利用地理协变量预测滑坡发生与否(二值信息),而忽略了滑坡的规模(尺寸)这一关键致灾因子。滑坡灾害的定义与其规模直接相关,无论是滑移体的体积还是滑坡疤痕的面积。因此,将滑坡发生次数(计数)与滑坡规模(尺寸)进行联合建模,对于准确的风险评估和国土规划至关重要。

研究的核心目标是开发一种新的贝叶斯分层建模框架,用于对土耳其某一地区的滑坡计数和尺寸进行高分辨率联合预测。具体而言,研究者旨在利用空间标记点过程模型,并引入由极端值理论所支持的“次渐近”标记分布,以灵活地模拟从低分位数到高分位数的滑坡尺寸。该方法旨在克服传统广义帕累托分布仅适用于高阈值以上数据的局限性,以及“分割模型”在阈值处存在不连续性的问题,从而实现对滑坡尺寸全分布的连续、统一且参数节俭的建模。

二、 研究流程与方法

研究流程涵盖了数据准备、模型构建、贝叶斯推断、模拟验证和实际数据应用等多个环节。

1. 研究数据与预处理: 研究区域位于土耳其乌卢斯市,面积约33.2平方公里。滑坡清单基于机载激光雷达技术获取。数据包含933个滑坡的精确位置和面积信息。空间数据被处理为两种空间单元:高分辨率的规则网格(13271个50米×50米的像素)以及基于地形的、物理意义更明确的斜坡单元(共355个)。此外,研究使用了九个形态测量协变量(如坡度、地形湿度指数、平面曲率、剖面曲率等),这些变量均在像素级别测得,并被证明与滑坡过程相关。

2. 模型构建: 研究者提出了一个基于标记点过程的贝叶斯分层模型。模型的核心结构如下: * 计数过程: 假设每个像素内的滑坡计数服从泊松分布,其对数强度(Log-Intensity)是一个包含固定效应(协变量)、空间结构化随机效应和空间非结构化随机效应的潜高斯过程。空间结构化随机效应通过内在条件自回归先验在斜坡单元尺度上定义,以捕捉空间依赖性并降低计算负担,形成一种“混合分辨率”建模策略(协变量和观测在像素级,随机效应在斜坡单元级)。 * 尺寸(标记)过程: 对于发生滑坡的像素,其滑坡尺寸(定义为滑坡面积的平方根,以获得更轻的尾部和更稳定的统计特性)被视作该点(滑坡事件)的“标记”。标记分布不再使用传统的对数正态或伽马分布,而是采用了一系列“次渐近”极值分布。这些分布(如Burr、扩展广义帕累托、伽马-伽马分布)在理论上与极端值理论兼容,能够灵活控制分布的中部、下尾部和上尾部行为,为从中小型到大型滑坡提供统一的、连续的参数化模型。 * 过程间的耦合: 计数过程和尺寸过程通过一个共享的潜空间随机效应组件联系起来,并通过一个可估参数β来量化两者间的相关性(正相关或负相关)。当β=0时,两个过程独立。

3. 贝叶斯推断与算法: 由于模型结构的复杂性和所选标记分布的灵活性,标准的近似贝叶斯推断方法(如INLA)难以直接应用。因此,研究者开发了一个定制化的马尔可夫链蒙特卡洛自适应采样方案。该方案结合了标准的Metropolis-Hastings更新、吉布斯采样以及自适应的Metropolis-Adjusted Langevin算法,专门用于高效处理模型中存在的大量潜高斯变量和超参数。尽管MCMC计算量更大,但其提供了“近乎精确”的推断,并且能灵活纳入各种新的模型结构。研究还通过模拟实验验证了该MCMC采样器的估计准确性和预测性能。

4. 模型比较与评估: 在实际数据应用部分,研究者拟合了多种模型变体(考虑是否包含非结构化随机效应,以及是否允许计数与尺寸过程相关),并比较了八种不同的标记分布(包括次渐近分布和经典分布)。模型的性能通过三种实验进行评估:样本内拟合、基于斜坡单元的10折交叉验证和基于随机剔除滑坡事件的5折细化交叉验证。评估指标包括曲线下面积、平均绝对误差、连续分级概率评分和偏差信息准则。

三、 主要研究结果

1. 模型性能比较: 交叉验证结果表明,包含共享空间效应和独立随机效应的全模型(M1)在预测性能上普遍优于其他简化模型。在标记分布的选择上,虽然不同指标下的“最优”分布略有差异,但三种次渐近分布(扩展广义帕累托、Burr、伽马-伽马)在预测滑坡尺寸(特别是基于样本外预测的绝对误差)时 consistently 表现出色,显著优于经典的、尾部较轻的分布(如对数正态、伽马分布)。这表明对于具有重尾特征的滑坡尺寸数据,次渐近分布在样本外预测中更具优势。综合各项指标,研究者最终选择采用伽马-伽马分布作为标记分布的全模型M1作为最佳模型。

2. 参数估计与科学发现: 对最佳模型的后验分析揭示了重要信息: * 过程间相关性: 共享参数β的估计值为显著的负值(中位数-0.444)。这意味着在斜坡单元尺度上,滑坡的高发生强度与相对较小的滑坡尺寸相关。这符合物理直觉:在一个给定的斜坡单元内,如果发生了很多滑坡,由于可用物质和空间的限制,单个滑坡的规模往往会偏小。 * 尾部特征: 伽马-伽马分布参数估计值表明,滑坡尺寸(面积的平方根)具有明显的重尾特征,上尾指数估计值为0.243。这证实了准确模拟极端大滑坡的重要性。 * 协变量影响: 对于计数过程,坡度是高度显著的正向预测因子。对于尺寸过程,大多数协变量的影响不显著,这可能与尺寸数据的样本量相对较小有关。

3. 灾害与风险制图应用: 研究展示了该联合建模框架在灾害评估中的实际应用价值。区别于仅表示发生概率的“易发性”图,研究者定义了综合考量滑坡发生可能性和规模的“灾害”图。灾害被量化为exp(η) × exp(2μ),其中η是计数过程的对数强度,μ是尺寸过程的对数中位数(因子2用于将尺寸转换回原始面积尺度)。通过对土耳其研究区域内四条主要道路沿线进行风险制图,研究发现不同道路的易感性和灾害模式存在差异,且由于β为负,某些区域可能出现高易发性但中等灾害,或低易发性但高灾害的情况。这种细致的风险评估对于有针对性的风险缓解和国土规划具有重要意义。

4. 对比模型结果: 作为对比,研究者还将数据聚合到斜坡单元尺度,拟合了联合区域模型。该模型估计的共享参数β为显著的正值(1.44),这与点过程模型的结论相反。其解释是:在区域聚合层面,一个斜坡单元内滑坡总数多,其滑坡尺寸的总和也倾向于更大。尽管单个滑坡可能较小,但累积效应显著。这凸显了建模尺度对结果解释的影响,也表明基于高分辨率点过程的模型能保留更精细的信息,其协变量效应的估计也更为稳定。

四、 结论与价值

本研究成功开发并验证了一个基于空间标记点过程和次渐近标记分布的贝叶斯分层建模框架,用于滑坡计数和尺寸的联合高分辨率预测。研究得出结论:引入共享空间效应和灵活的次渐近标记分布,能够显著提升对滑坡尺寸(尤其是大型滑坡)的预测能力,并为滑坡灾害(综合了发生频率和规模)的量化评估提供了统一、严谨的统计工具。

该研究的科学价值在于:1)将先进的次渐近极值理论分布引入空间标记点过程模型,为具有重尾特征的标记数据建模提供了新的、强大的工具;2)发展了高效的定制化MCMC算法,解决了此类复杂模型的推断难题;3)通过“混合分辨率”建模策略,在计算可行性与模型精细度之间取得了良好平衡。其应用价值直接体现在更准确的自然灾害风险评估上,成果可为灾害管理、基础设施规划和保险定价提供科学依据。

五、 研究亮点

  1. 方法创新: 首次将“次渐近”极值分布系统性地应用于滑坡尺寸的标记点过程建模,避免了阈值选择困难和模型不连续问题,实现了对滑坡尺寸全范围(从中小型到极端大型)的统一、连续且参数节俭的描述。
  2. 模型综合: 构建了一个耦合滑坡发生与规模的完整贝叶斯分层模型,通过共享潜过程量化了两者间的空间依赖关系,对灾害形成了更全面的定义。
  3. 算法贡献: 针对模型复杂度,开发了高效的自适应MCMC采样方案,确保了推断的可靠性,并为类似复杂空间模型的贝叶斯推断提供了参考。
  4. 跨学科应用: 深度融合了空间统计学、极端值理论和地球科学,展示了先进统计方法在解决实际环境科学问题中的强大能力。该框架具有通用性,可被推广应用于其他需要联合建模事件计数与强度的领域,如野火(次数与过火面积)、地震(次数与震级)等。

六、 其他要点

研究在在线补充材料中提供了大量额外的诊断图、结果表格和敏感性分析,包括MCMC链的收敛性诊断、不同先验设置下的结果稳健性检查、样本内拟合与细化交叉验证的详细结果等,充分支撑了正文结论的可靠性。这些材料为其他研究者复现和深入研究提供了宝贵资源。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com