分享自:

考虑空间尺度不匹配问题的融合遥感与社会感知数据的高分辨率人口制图研究

期刊:international journal of digital earthDOI:10.1080/17538947.2025.2479863

高分辨率人口空间分布研究:融合遥感与社会感知数据的跨尺度方法

作者及机构
本研究报告由Peijun Feng(中国地质大学(武汉)计算机学院)、Zheng Ma(中国地质大学(武汉)信息化办公室)、Jining Yan(中国地质大学(武汉)计算机学院/自然资源信息管理与数字孪生工程软件教育部工程研究中心)、Leigang Sun(河北省科学院地理科学研究所/河北省地理信息应用技术创新中心)、Nan Wu、Luxiao Cheng(湖北工业大学计算机学院)、Dongmei Yan(中国科学院空天信息创新研究院/可持续发展大数据国际研究中心)共同完成,发表于《International Journal of Digital Earth》2025年18卷1期(DOI:10.108017538947.2025.2479863)。


研究背景与目标

科学领域与研究动机
人口空间分布数据对区域规划、灾害管理、公共资源配置具有重要意义。联合国可持续发展目标(SDGs)强调需精准掌握人口分布以实现”包容、安全、可持续的城市和人类住区”。现有人口空间化方法存在两大核心问题:
1. 尺度不匹配:直接从行政区级(如乡镇)下推至网格级(如100米)时,因尺度差异导致特征表征偏差(spatial scale mismatch);
2. 数据异质性:现有多源数据(如夜光遥感、POI)在细粒度单元存在空间分辨率不足或同质化问题,难以捕捉人口分布的微观差异。

研究目标
提出一种融合Transformer与CNN的深度学习框架(TFACNet),通过构建跨尺度训练策略(100米→25米)和多源数据特征融合方法,实现25米高分辨率人口空间分布建模。


研究流程与方法

1. 数据准备与预处理

数据来源
- 人口数据:2020年中国乡镇级人口普查数据、WorldPop(100米)、LandScan(1公里)网格数据集
- 遥感数据:CLCD土地覆盖(30米)、NPP/VIIRS夜光数据(500米)、ASTER GDEM(30米)、NDVI(30米)
- 社会感知数据:高德地图POI(分为餐饮、交通设施、医疗等10类)

数据处理
- 空间一致性处理:将所有数据统一至WGS84坐标系,通过核密度分析将POI向量数据转为热力图张量
- 人口标签校正:结合普查数据对WorldPop网格数据进行校准(公式1),构建100米/25米分辨率的训练标签
- 特征标准化:采用均值-方差归一化消除多源数据量纲差异

2. TFACNet模型架构

创新性设计
1. 空间关系建模
- 以目标网格为中心生成15×15邻域图像块,通过一阶邻接矩阵编码空间依赖关系(公式2)

  1. 全局特征提取(Transformer模块)

    • 双分支结构:分别处理遥感数据(6通道)和POI数据(10通道)
    • 采用多层Transformer编码器(公式3-6),通过自注意力机制捕捉长程空间关联
  2. 特征融合策略(FAFS)

    • 通过特征注意力权重(公式10-11)自适应融合遥感与POI特征,解决社会-自然特征贡献度不均衡问题
  3. 局部特征提取(CNN模块)

    • 3层卷积单元(16→32→64滤波器)捕捉人口聚集效应,最后通过全连接层输出网格人口密度

3. 实验设计

训练细节
- 数据集:武汉(训练集926,684样本)与桂林(训练集2,722,381样本),测试集占比20%
- 超参数:初始学习率0.01(衰减率0.995/epoch),批大小256,150个epoch
- 硬件:NVIDIA Tesla A100 GPU

验证方法
- 街道级聚合验证:将25米网格人口汇总至街道尺度,与普查数据对比
- 评估指标:R²、RMSE、MAE


主要研究成果

1. 模型性能对比

定量结果(表2)
- 在武汉和桂林的测试中,TFACNet的R²分别达0.919和0.916,显著优于CNN(0.8530.812)、MLP(0.8330.829)和XGBoost(0.8580.870)
- 与传统人口产品相比:
- WorldPop在武汉的R²为0.471,LandScan为0.448
- 街道级误差分析显示,本方法在武汉56%街道的误差万人,远优于WorldPop(43%)和LandScan(34%)

可视化对比(图7)
- 相比WorldPop的均匀分布倾向和LandScan的边缘锯齿效应,TFACNet能更精准识别城市次级中心(如武汉蔡甸街、桂林灵川镇)
- 通过POI数据增强,模型可刻画商业区、交通枢纽等局部人口聚集特征

2. 消融实验(表3-4)

  • 模块贡献度:完整模型比单遥感分支(R²=0.797)和单POI分支(R²=0.877)分别提升0.122和0.042
  • 尺度敏感性:邻域窗口15×15时达到精度-效率平衡(图10),过大窗口(如17×17)导致推理时间增加40%

3. 因子重要性(图8)

  • 关键变量
    • 武汉:交通设施(权重0.18)、医疗POI(0.16)、夜间灯光(0.14)
    • 桂林:商业住宅(0.21)、餐饮服务(0.17)
  • 地形与植被因子在武汉更具解释力(洪水风险与绿地吸引力),而桂林受旅游设施影响更显著

研究价值与创新点

科学价值

  1. 方法论创新

    • 提出跨尺度下推框架,通过”低分辨率训练→相邻高分辨率预测”缓解尺度跃迁偏差
    • 开发TFACNet模型,首次将Transformer的全局建模能力与CNN的局部特征提取结合于人口空间化
  2. 数据融合突破

    • 设计分层密度热力图转换方法,解决POI向量数据的空间离散化问题
    • 验证多源数据互补性:遥感数据反映土地利用基底,POI提供社会经济语义

应用价值

  • 生成中国首批25米分辨率人口网格产品,为精细化城市管理(如疫情风险评估、应急避难规划)提供数据支撑
  • 开源模型架构可迁移至其他发展中国家,助力SDGs监测

局限与展望

  • 动态人口刻画不足:当前仅反映常住人口分布,未来可融合手机信令等实时数据
  • 跨区域泛化能力需验证:建议针对不同经济水平地区重新训练模型

亮点总结
1. 率先实现25米网格尺度的人口空间化(R²>0.91)
2. 创新性融合Transformer与CNN,构建”全局-局部”双重空间关系模型
3. 提出特征注意力融合策略(FAFS),自适应平衡多源数据贡献
4. 建立融合普查数据的网格校正方法,提升WorldPop等开放数据的本地适用性

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com