分享自:

基于先验增强概率-确定性模型的城区人类活动强度预测

期刊:International Journal of Geographical Information ScienceDOI:10.1080/13658816.2025.2562250

基于先验增强概率-确定性模型的城市人类活动强度预测研究

本研究由来自福州大学数字中国研究院(福建)的钟诚、吴升,以及中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室、中国科学院大学资源与环境学院的王培晓、张恒才、程诗奋、陆锋共同完成。研究成果以题为“Predicting human-activity intensity in urban areas with a prior-enhanced probabilistic-deterministic model”的论文形式,于2025年9月23日在线发表于国际学术期刊《International Journal of Geographical Information Science》。

一、 学术背景与研究目的

本研究隶属于地理信息科学、城市计算与时空数据挖掘交叉领域,核心任务是预测城市区域内特定时间段的人口密度,即人类活动强度。准确预测人类活动强度对于智能交通规划、商业布局优化、公共安全管理以及智慧城市建设具有重要应用价值。尽管已有大量模型被提出,但现有方法存在两个主要瓶颈:其一,未能有效整合有助于提升模型准确性与可解释性的先验知识。现有模型构建空间关系(如图的邻接矩阵)时,多依赖数据驱动方法(易受采样偏差影响,可解释性差)或简单的先验(如距离阈值,限制了隐藏依赖关系的建模),未能充分利用城市区域间复杂的、多元的功能相似性先验。其二,未能有效整合概率性预测与确定性预测的优势。确定性模型能提供高精度的单点估计,但无法量化预测不确定性,难以评估极端值风险;而概率性模型虽能提供不确定性区间,但往往以牺牲预测精度为代价。目前鲜有模型能在一个统一框架内无缝切换这两种预测模式,以适应不同应用场景的需求。

针对上述挑战,本研究旨在开发一个新型的预测框架。其核心目标包括:1) 引入一种能够捕获城市区域间多元功能相似性先验的方法,以提升模型精度与可解释性;2) 设计一个即插即用的概率预测模块,使模型能够在概率性与确定性预测模式之间灵活切换,实现优势互补。最终,研究者提出了一种“先验增强的双模时空图神经网络”(Prior-enhanced dual-mode spatiotemporal graph neural network, PED-STGNN)。

二、 详细研究流程与方法

本研究主要包含三大核心模块:基于超图节点向量化的多元功能相似性先验学习模块、先验增强的时空依赖关系学习模块,以及即插即用的概率预测模块。实验数据基于中国福建省福州市鼓楼、台江、仓山三区的移动定位数据。

第一模块:多元功能相似性先验学习(Hypernode2vec) 此模块旨在从城市兴趣点(Points of Interest, POI)数据中提取超越简单距离或序列相似性的、更高阶的多元功能关联,并将其编码为图神经网络可用的邻接矩阵先验。 1. 数据与问题建模:研究区域被划分为885个500米×500米的规则网格。POI数据经过重分类(如餐饮服务归为“消费类”,政府机构归为“工作类”等),形成“区域-功能”矩阵。研究者指出,城市区域与功能之间的关系是复杂的、一对多或多对一的,传统基于成对关系的图结构难以充分表征。因此,他们引入超图理论进行建模:将每个城市网格视为超图节点,将每种城市功能(如消费、工作、医疗)视为一条超边。一个具有多种功能的区域节点会连接多条超边,而一种覆盖多个区域的功能则对应一条连接多个节点的超边。 2. 超图权重矩阵学习:研究者设计了一个自监督学习框架来学习超图权重矩阵(W_region-func)。该矩阵编码了每个区域与每种功能之间的关联强度。具体流程为:首先随机初始化一个权重矩阵,通过一维卷积和Softmax函数进行初步计算。接着,对原始的“区域-兴趣点”矩阵进行扰动(包括随机行掩码、行替换和行保留),生成用于自监督学习的训练样本。然后,将扰动后的矩阵与初步计算的超图权重矩阵输入一个超图卷积网络(Hypergraph Convolutional Network, HGCN)和后续的前馈神经网络,预测原始的“区域-兴趣点”矩阵。通过最小化预测矩阵与原始矩阵的差异,反向优化得到最终的超图权重矩阵。这个过程使模型能够学习到区域与功能之间复杂的、非线性的多元关系。 3. 先验邻接矩阵生成:学习到的超图权重矩阵形状为(区域数×功能数),无法直接用于标准图神经网络。受Node2vec方法启发,研究者提出了Hypernode2vec方法:基于超图权重矩阵,以概率方式采样超图节点序列,然后使用Skip-gram模型学习每个区域的向量表示(嵌入)。最后,计算这些区域嵌入之间的两两相似性,对于每个区域,保留与其最相似的前k个区域(k1比例,实验中设为0.02),形成稀疏的、基于功能相似性的先验邻接矩阵(A_prior)。该矩阵反映了基于高阶多元功能关联的区域间相似性。

第二模块:先验增强的时空依赖关系学习 此模块将上述学习到的功能相似性先验整合到一个时空图神经网络架构中,以增强模型对时空模式的学习能力。 1. 模型架构:该模块包含两个时间卷积层和一个先验增强的图神经网络层。时间卷积层用于捕捉时间维度的依赖关系。 2. 先验增强的图卷积操作:在GNN层中,模型同时使用两种邻接矩阵进行信息聚合:一种是基于Wasserstein距离从人类活动强度序列构建的经典邻接矩阵(A_classic,保留前k2个连接,k2=0.03),另一种即是上述生成的基于功能相似性的先验邻接矩阵(A_prior)。模型分别通过这两个邻接矩阵进行图卷积运算,得到两组节点特征表示。然后,将这两组特征进行拼接,并通过一个全连接层进行融合。这种设计使得模型既能学习数据驱动下的时空关联,又能利用先验知识引导模型关注功能相似区域间的潜在联系,从而提升预测准确性和模型的可解释性。网络中还加入了残差连接以防止梯度问题。

第三模块:即插即用的概率预测 此模块使PED-STGNN能够在确定性和概率性预测模式之间灵活切换。 1. 概率预测实现:受基于变分推断的贝叶斯神经网络启发,该模块将传统多层感知机(MLP)的参数从确定值改为可学习的概率分布(高斯分布)。在预测时,通过“重参数化技巧”从该分布中采样参数,输入到概率MLP中得到预测值。通过多次采样并计算平均值作为最终点估计,同时可以计算出95%置信区间作为不确定性度量。 2. 双模切换机制:当使用采样得到的参数进行预测时,模型工作在概率模式。若将概率MLP中的参数固定为学习到的均值(即退化为确定值),则该模块等价于一个标准的确定性MLP。这种设计实现了“即插即用”,允许用户根据实际需求(是否需要不确定性量化)选择预测模式。 3. 损失函数:在概率模式下,损失函数由预测的均方根误差(RMSE)和变分分布与预设先验分布之间的KL散度(Kullback-Leibler divergence)共同构成,以平衡预测准确性和分布匹配。在确定性模式下,仅使用RMSE作为损失函数。

第四模块:实验验证与结果分析 研究者在福州的人类活动强度数据集上进行了全面的实验,设置了9个历史时间步长输入,预测未来时间步长。对比的基线模型包括ST-GCN、ASTGCN、T-GCN、STHGCN、ASTGCRN(均为确定性模型)以及SVGP和STNN(概率性模型)。 1. 精度对比(回答RQ1 & RQ4):在确定性模式下,PED-STGNN在所有基线模型中取得了最佳性能,其RMSE、MAE和MAPE分别为18.54、10.37和17.32%。与表现最好的基线ST-GCN相比,RMSE降低了约10.3%,MAE降低了约11.6%。这证明了引入多元功能相似性先验能有效提升预测精度。在概率性模式下,PED-STGNN同样表现优异,RMSE和MAPE均为最佳(19.99, 16.92%),MAE略高于专门的概率模型STNN(高出约5.5%),但综合精度优势明显。实验还表明,通过即插即用模块将确定性基线模型转为概率模式会导致精度轻微下降(RMSE增加最多3.62),但这种代价换来了不确定性量化能力,被认为是可接受的。 2. 消融实验(进一步验证RQ1):移除先验增强的邻接关系或经典的邻接关系,均会导致RMSE显著上升约17%。若同时移除两者,性能下降最严重。这确认了两种邻接关系(数据驱动的和先验引导的)对于模型性能都是至关重要的,且先验知识带来了显著的增益。 3. 可解释性分析(回答RQ2):为了验证Hypernode2vec是否真正捕获了多元功能相似性,研究者从先验邻接矩阵中随机选取了四个具有混合功能的区域,分析与其最常相连的其他区域。可视化结果显示,这些被连接起来的区域对(如包含大型医院的区域与另一医疗区,商业中心与另一商业区)尽管在空间上可能相隔较远,但主导功能高度相似。这证明模型学习到的先验关系确实反映了语义层面的功能相似性,而非简单的空间邻近性,从而增强了模型决策逻辑的可解释性。 4. 概率预测定性分析(回答RQ3):从时间维度看,概率预测给出的不确定性区间呈现出明显的昼夜周期性:白天(7:00-22:00)活动高峰期不确定性较宽,夜间较窄,这与人类活动规律相符。从空间维度看,不确定性较高的区域多分布在城市北部人口密集区及商业中心、医院等功能复杂的区域。研究者进一步计算了“不确定性/实际强度”比值作为极端值风险代理指标,揭示了城市内部风险空间的异质性。这些分析展示了概率预测模式在识别潜在高风险区域、支持风险管理方面的实用价值。

三、 研究结论与意义

本研究成功提出并验证了PED-STGNN模型。该模型通过创新的Hypernode2vec方法,从POI数据中提取了城市区域间的多元功能相似性作为先验知识,有效提升了人类活动强度预测的准确性和模型的可解释性。同时,其设计的即插即用概率预测模块,使单一模型架构能够根据应用场景需求,灵活输出确定性点估计或带有不确定性区间的概率预测,实现了精度与风险量化能力的兼顾。

四、 研究亮点

  1. 方法创新:提出了Hypernode2vec方法,将超图理论与自监督学习结合,首次将高阶多元功能关系作为可学习的先验知识引入时空预测模型,突破了传统基于一阶成对关系或简单POI距离的局限性。
  2. 架构创新:设计了一个双模预测框架,通过一个轻量级的即插即用模块,实现了确定性预测与概率性预测在统一模型内的无缝切换与优势互补,增强了模型的实用性和灵活性。
  3. 性能优越:在公开数据集上的实验表明,该模型在精度上显著优于多种先进的基线模型,同时提供了宝贵的模型可解释性洞察和不确定性量化能力。

五、 其他有价值内容

研究者在讨论部分也指出了本工作的局限性:1) 移动定位数据存在设备关机、信号漂移等导致的采样偏差;2) 未纳入天气、突发事件等外部影响因素;3) 受数据集所限,未验证模型在不同季节、不同城市的泛化能力。针对这些局限,提出了未来的研究方向,例如融合多源数据(公共交通刷卡、共享单车)、引入外部因子数据,以及在更广泛的时空范围内测试模型鲁棒性。这些思考为后续研究提供了清晰的路线图。

这项研究为地理信息科学和城市计算领域提供了一种融合先验知识与双模预测的先进框架,不仅推动了时空预测模型的技术前沿,也为智慧城市中的精细化管理和风险防控提供了更强大的决策支持工具。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com