本研究由陈跃红、徐聪聪、张晓祥、张若婧(均来自河海大学水文水资源学院,南京)、马强、刘昌军(均来自中国水利水电科学研究院减灾中心,北京)以及任立良、时开鑫(同为河海大学水文水资源学院)共同完成,发表于《地理学报》(Acta Geographica Sinica),第78卷,第5期(2023年5月)。
山洪是中国区域性自然灾害的主要类型之一,对环境安全、经济发展以及人员生命造成重大威胁。水利部统计结果指出,中国山洪灾害的人员伤亡占洪涝灾害的70%,因而成为破坏性极大的自然灾害。山洪具有显著的区域空间分异特点,且频发于复杂地形和多暴雨的环境之下。
地理区划一直是地理学研究的核心内容之一,通过划分区域单元来揭示地表要素的分布规律,为资源开发、风险管理和可持续发展提供科学依据。然而,在现有山洪区划研究中,区划单元界线相对粗糙,数量有限,尚未充分考虑最新的对地观测数据。伴随着全球气候变化的加剧和城市化进程的推进,地表要素快速变化,亟须制定更加科学和精细化的山洪区划方案。
基于此,该研究设计了面向山洪灾害预警预报与防治管理的地理区划方案,旨在运用最新的大数据和算法技术,划分符合山洪致灾因子及孕灾环境空间分异规律的区域,并为因地制宜开展山洪灾害管理和防治提供科学依据。
研究工作分为六个主要步骤:
数据预处理
研究基于中国多种自然地理区划成果,如中国三级阶梯、地貌区划、水文区划、气候区划等,并结合“全国山洪灾害调查评价项目”提供的1951年到2015年的历史山洪事件数据。通过对相关数据的处理,生成山洪区划的基础空间单元,并提取特征因子,分别包括用于一级区划的19个地形地貌因子和用于二级区划的31个降雨因子。
关键因子选择
为避免因子冗余和数据干扰,该研究采用随机森林(Random Forest)算法识别与历史山洪事件密切相关的关键因子。一级区划中筛选出12个下垫面关键因子(如高程、坡度、植被指数等);二级区划中筛选出10个降雨关键因子(如不同频率与时段的最大降雨量、年均降雨量等)。
混合聚类模型构建
研究创新性地使用自组织映射神经网络(Self-Organizing Map, SOM)与Ward层次聚类算法相结合,通过SOM初步分类各区域特征相似的基础单元,再通过Ward对结果进行二次聚类优化。这种方法既增强了单元内部要素相似性,也确保了单元间的显著差异性。
区划界线划定
结合dbi(Davies-Bouldin Index)和cqi(Clustering Quality Index)聚类评价指标,选定九类一级区划和33类二级区划作为初步结果。通过对接自然地形边界(如主要山脉、山丘区边界)和有效性评价结果,对碎小斑块进行后处理,进一步调整区划单元路径。
区划方案的评价与修正
研究借助地理探测器方法评价区划方案对历史山洪事件空间分布的解释力,分别对一级区划和二级区划的解释力达到了66.4%和75.4%,表明研究制定的区划方案与实际历史事件的疏密分布规律高度吻合。
命名与编码山洪区划方案
研究制定了命名和编码规范,一级区划方案按照“地理位置+气温带+水量+易发性”形式命名(如东北温带平水—中易发区),二级区划方案则在一级区划下进一步反映详细的地理位置,并以字母命名与编码以便于数据库管理和信息化分析。
一级区划方案
研究最终划分出9个一级区划单元(见图3),涵盖东南、东北、内蒙古、黄土高原等多种地理环境。其中各单元详细描述了不同地貌特征和山洪易发性,具体如下:
二级区划方案
在一级区划的约束下,细分为33个二级区划单元(见图4),体现了降雨致灾因子的空间分异。通过对山洪事件密度较高区域的细化,显著提高了方案的精细化程度。
数据支持与科学性验证
一级区划的划分与中国三级阶梯界线高度一致,初步印证了其与孕灾环境分布规律的契合度。二级区划的界线则能够更加精准地区分出历史山洪事件分布的密集与稀疏区域。
科学价值
本研究首次系统性地从山洪孕灾环境与致灾因子两方面入手,应用机器学习(Machine Learning)和自组织神经网络(Self-Organizing Map)构建山洪区划方案,克服了传统区划方法中依赖经验划分的主观性问题。
应用价值
研究成果能够为山洪预警预报和防控措施的区域化部署提供明确参考依据,推动中国山洪灾害防治管理向精细化和科学化迈进。
创新性
新型混合聚类方法的应用显著提高了区划结果的准确性和精度,同时通过随机森林算法最大化提取关键因子,为后续区域化研究提供了全新的技术框架。
本研究通过全新的数据驱动方法和分区策略,系统性地制定了中国山洪一级和二级区划方案。不仅从空间尺度揭示了山洪受地形和降雨影响的区域分异规律,而且为未来针对山洪灾害的精准管理提供了科学基础。未来研究可考虑将动态气候变化和更细化的社会经济因子纳入指标体系,进一步优化现有区划方案,使其在复杂环境中更具普适性和时效性。