分享自:

集成多源数据与经验知识的海口市生产-生活-生态功能结构识别

期刊:ISPRS International Journal of Geo-InformationDOI:10.3390/ijgi12070276

基于随机森林模型融合经验知识与多源数据的海口市“三生空间”功能结构识别研究学术报告

本研究发表于《ISPRS International Journal of Geo-Information》2023年第12卷第7期,论文题为“Identifying the Production–Living–Ecological Functional Structure of Haikou City by Integrating Empirical Knowledge with Multi-Source Data”。论文第一作者为赵冰冰,通讯作者为杨学席,主要作者还包括谭晓勇、罗亮、邓敏。研究机构包括中南大学地球科学与信息物理学院、香港城市大学建筑与土木工程系以及广东工贸职业技术学院。

一、 研究背景与目标 本研究属于城市地理学、土地利用规划与地理信息科学交叉领域。当前,快速城市化进程带来了土地利用冲突、生态压力增大等一系列问题,威胁城市可持续发展。传统的土地利用分类体系(如耕地、建设用地、林地等)侧重于自然属性的划分,难以刻画城市空间复杂的人类活动与功能复合性。例如,一个城市街区可能同时包含绿地(生态功能)、住宅(生活功能)和商业设施(生产功能)。为解决此问题,“生产-生活-生态空间”(Production-Living-Ecological Space, PLES)的概念在中国被提出,旨在从人类活动功能视角对国土空间进行综合分类与规划管理。

然而,现有PLES研究存在两个主要局限:第一,多数研究集中在省、市等宏观尺度,对城市内部精细尺度的功能结构识别关注不足;第二,PLES的概念定义往往较为模糊,导致识别方法多采用简单的线性加权或指标合成法,这些方法难以刻画城市环境中多变量交互的复杂非线性规则,且常忽视人类活动特征。因此,本研究旨在解决两个核心问题:(1)如何结合人类活动特征与物理环境特征来理解城市空间的功能结构;(2)如何从人类经验知识数据中挖掘非线性的空间认知规则。最终目标是为海口市提供一个精细尺度的PLES识别方法,其结果可为城市空间格局优化与协调管理提供理论依据。

二、 研究流程与方法 本研究以中国海南省海口市主城区为案例区,提出了一套融合经验知识与多源异构数据的监督分类方法,以识别城市PLES。整体工作流程包括PLES描述指标体系构建、基于经验知识的PLES标注、基于随机森林模型的PLES识别、结果分析与验证四个主要步骤。

1. PLEs描述指标体系构建 为全面刻画城市空间功能,研究整合了多源数据,构建了包含物理空间功能强度和居民出行特征两大维度的12个指标。 * 数据来源与处理: * 兴趣点(POI)数据:从高德地图获取2017年12月的67,339个POI,重分类为“娱乐”(如购物、餐饮、休闲)和“服务”(如生活服务、金融服务、政府机构)两大类,并计算其在研究单元内的密度。 * 兴趣面(AOI)数据:从百度地图爬取教育、医疗、住宅三类AOI多边形数据,计算其面积在研究单元内的占比,以表征教育、医疗和居住功能的强度。 * 土地利用数据:采用2017年30米分辨率全球土地覆盖数据,合并森林、灌丛、草地为“绿地”,并与水体一起计算覆盖率。 * 出行数据:采用滴滴出行GAIA数据集2017年9月工作日约132.6万条网约车行程记录。剔除了异常记录(如行程时间>2小时或为0)。 * 研究单元划分:依据海口市路网密度(约5.41 km/km²),将研究区划分为边长300米的规则网格,共计2794个。 * 指标体系: * 物理空间功能强度(X1-X8):包括住房功能强度(住宅AOI面积占比)、娱乐功能强度(娱乐POI密度)、教育功能强度(教育AOI面积占比)、医疗功能强度(医疗AOI面积占比)、服务设施强度(服务POI密度)、办公楼强度(工业/公司POI密度)、水体覆盖率、绿地覆盖率。 * 居民出行特征(X9-X12):基于网约车上下客数据,构建了出行复杂性(出发时间序列波动水平)、出行强度(24小时出发量平方和)、到达复杂性(到达时间序列波动水平)、到达强度(24小时到达量平方和)四个指标,以捕捉不同功能区的人类活动节奏差异。

2. 结合经验知识的PLES标注 为避免主观定义PLES,研究采用“从结果反推”的思路构建训练样本。研究者首先选取海口市具有明确功能属性的地标区域(如海南大学、万绿园、工厂、写字楼等),然后结合卫星影像和街景地图,人工判断并标注了524个网格单元的功能类型。其中,生活空间(如学校、医院、住宅区)236个,生产空间(如生产车间、商业办公楼)102个,生态空间(如林地、湖泊、公园)186个。这一标注集构成了监督学习的“地面真值”。

3. 基于随机森林的PLES识别 为解决传统线性方法无法处理复杂非线性关系的缺陷,本研究采用随机森林(Random Forest)这一集成学习算法。 * 模型构建:由于城市区域常具有混合功能,研究并未构建一个三分类模型,而是分别构建了三个二分类模型(生活功能导向、生产功能导向、生态功能导向模型)。例如,构建生产导向模型时,将标注集中的生产空间网格标记为“是”,其他(生活、生态)标记为“否”。 * 训练与验证:每个模型将70%的标注数据用于训练,30%用于验证。通过网格搜索法优化模型超参数(决策树数量、分裂准则、树的最大深度、最大特征数)。最终三个模型的分类准确率均超过92%,袋外误差(OOB error)最大为0.1503,表明模型具有良好的泛化能力。 * 功能判定:每个网格会依次输入三个模型,得到三个二分类结果。根据图4所示的组合规则,最终确定每个网格的功能标签(单一功能、两功能混合、三功能混合或无主导功能)。

4. 结果分析与验证 * 特征重要性分析:通过分析随机森林模型得出的特征重要性,可以解读模型对三类空间的“定义”。研究发现:生活空间识别的关键指标是住房功能强度和教育功能强度;生产空间的关键指标是办公楼强度和住房功能强度(但教育功能强度低);生态空间的关键指标是绿地覆盖率,且各项出行特征指标重要性虽高但数值低,表明工作日人们较少前往生态空间。这从数据驱动角度具体化了PLES的概念内涵。 * 结果验证:由于缺乏精确的PLES空间分布数据进行直接验证,研究将结果与Zhang等人(2021)基于出行流和POI识别的“职住空间”结果进行对比。两者在生产空间集聚区(如秀英、金贸、蓝天街道片区)和生活空间分布上表现出较高一致性,差异主要源于本研究对“生活空间”的定义更广(包含教育与医疗),而对比研究仅指居住功能。这侧面证明了本方法结果的合理性。 * 空间格局分析: * 总体结构:识别结果显示,海口主城区生活空间占比最高(31.25%),其次为生产空间(21.87%),生态空间占比最低(13.71%),弱功能区(未在任一模型中被强识别)占30.77%,多作为不同功能区之间的过渡带。混合功能区占比不足3%,这可能与300米网格的分辨率有关。 * 核密度分析:生活空间呈现“中心分散、外围斑块状集聚”的圈层结构,高密度区常围绕学校分布。生产空间向西南部集聚,主要围绕工业园区和市中心办公楼集群,这种布局可能导致长距离通勤。生态空间呈稀疏的点状分布,多位于公园等景区,表明居住区和工业区周边缺乏绿地。 * 优化启示:结果揭示了海口市生活与生产空间区域集聚、生态空间稀缺的现状。政府需促进教育资源和产业布局的均衡化,并在居住区和工业区周边增加植被覆盖以提升居民福祉。

三、 主要研究结论与价值 本研究成功提出并验证了一种融合经验知识与多源数据的城市PLES精细尺度识别方法。该方法的核心贡献在于:第一,通过引入人类出行活动特征,丰富了PLES的描述维度,弥补了仅依赖物理空间特征的不足;第二,利用随机森林模型从人工标注的经验知识中挖掘非线性的空间功能识别规则,克服了传统线性加权方法的局限性,使识别过程更灵活、高效。实验结果表明,该方法在海口市的PLES识别中具有高精度和良好的可解释性。

研究的科学价值与应用价值:在科学上,本研究通过数据驱动的方式,利用特征重要性分析具体阐释了生活、生产、生态空间在实际城市环境中的关键构成要素,丰富了PLES的理论认知。在应用上,该方法为城市管理者提供了一套可操作的工具,能够快速、准确地识别城市内部复杂的功能结构,特别是揭示了功能混合与过渡区域,为国土空间规划、城市更新、基础设施布局(如优化职住平衡、增加生态空间可达性)提供了精细化的决策支持。研究也指出,未来可通过考虑更细致的人类活动特征(如早晚高峰模式)和开展多尺度研究来进一步优化方法。

四、 研究亮点 1. 方法创新性:首创性地将监督学习(随机森林)引入PLES识别,利用经验知识标注集训练模型以挖掘复杂非线性规则,突破了传统指标合成法中线性假设的局限。 2. 数据融合深度:系统整合了表征物理环境的AOI、土地利用数据和表征人类动态活动的网约车出行数据,构建了多维度的城市功能描述指标体系,实现了“静态环境”与“动态活动”的结合。 3. 概念具体化:通过机器学习模型的特征重要性输出,反向解读了生活、生产、生态空间在海口市具体语境下的关键识别指标,使原本抽象的PLES概念变得具体、可度量。 4. 精细尺度探索:将研究单元细化为300米网格,致力于在城市内部微观尺度上识别PLES结构,为实施精细化的城市管理和规划提供了可能。 5. 实践指导性强:研究不仅完成了识别,更深入分析了空间分布模式及其潜在问题(如生态空间稀缺、生产空间过度集聚),直接为海口市的空间优化提供了明确的政策启示。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com