分享自:

基于街景图像的城乡感知人机对抗评分框架

期刊:international journal of geographical information scienceDOI:10.1080/13658816.2019.1643024

学术报告

研究主要信息

本文详述了一项针对城市感知评估的原创性研究,题为“A Human-Machine Adversarial Scoring Framework for Urban Perception Assessment Using Street-View Images”。该研究由Yao Yao、Zhaotang Liang、Zehao Yuan、Penghua Liu等多位研究者共同完成,作者来自多所高水平学术机构,包括中国地质大学、中国香港中文大学、中山大学、武汉大学等,并得到了阿里巴巴集团和腾讯公司的技术支持。文章于2019年7月19日在线发表在国际著名学术期刊《International Journal of Geographical Information Science》。

研究背景

近年来,城市感知(urban perception)作为一种居民对城市环境心理感受的重要衡量因子,受到学术界的高度关注。这一领域的研究与心理健康、公共安全、社会经济发展等诸多方面密切相关。然而,城市感知的评估传统上依赖于访谈和问卷等方法,存在样本不足和效率较低的问题。而以机器学习为基础的大规模数据集虽为此提供了解决之道,但其在特定区域(如中国城市)进行局部评估时的准确性往往较低。原因在于,数据训练样本的地区局限性和社会文化差异显著影响了城市感知的精度。因此,本研究旨在通过提出一种人机对抗评分框架(human-machine adversarial scoring framework),结合深度学习与街景图像,快速经济地评估中国城市的局部城市感知。

研究目标

本研究的目标是: 1. 设计一种基于人机对抗评分的方法学框架,用于提高城市感知评估的效率及准确性; 2. 通过深度学习技术和随机森林算法,提取视觉元素和城市功能,并分析其对感知的驱动因素; 3. 以中国高密度城市(武汉市)作为案例,验证所提出框架在区域感知评估中的适用性和有效性。

研究方法与流程

研究方法分为以下几个关键阶段:

第一阶段:设计人机对抗评分框架

研究首先结合认知心理学理论,提出“人机对抗评分”方法。由于人类在图像全局属性(global-property)认知方面更具优势,例如对“开放性”或“繁荣感”的快速判断,本框架通过将机器学习融入人类的标注过程,提高标注的速度与质量。

第二阶段:街景图像的语义分割

通过全卷积网络(Fully Convolutional Network, FCN)模型,研究团队对街景图像进行语义分割(semantic segmentation)。具体地,该模型利用MIT发布的ADE-20K数据集进行训练,能够识别151种语义类别,提取每张图像中各语义对象的像素占比。

第三阶段:人机对抗评分模块

在评分阶段,志愿者依据六种感知维度(富裕感、安全感、活跃感、美感、无聊感和压抑感),对街景图像进行1-100分的打分。同时,随机森林(Random Forest, RF)模型通过机器学习算法对志愿者评分行为进行拟合,并实时提供推荐评分。当推荐评分与志愿者评分误差持续小于10分时,标注任务终止。

第四阶段:驱动因素分析

研究通过语义分割提取的视觉要素,以及从高德地图获取的兴趣点(Point of Interest, POI),构建随机森林模型,探索视觉元素与城市功能对城市感知的驱动作用。

研究结果

研究取得了以下核心结果:

(1) 语义分割结果

利用ADE-20K数据集训练的FCN-8s模型在语义分割任务中,测试集上的准确率为66.83%。即便中国城市街景环境复杂多变,该模型依然在道路、建筑和自然景观等场景分类中表现出较高精度。

(2) 人机对抗评分完成情况

武汉市的案例研究中,共收集了24,860个街景点位的图片,最终获得约25,000张图像的评分数据。通过人机对抗评分,系统显著提升了标注效率,平均每小时每位志愿者可完成1,000-2,000张图片的评分任务。

(3) 随机森林拟合结果

六种感知类别的随机森林拟合平均误差小于10分,其中“安全感”、”富裕感”等维度的预测精度最高,RMSE均小于8分。美感和无聊感精度稍低,因其体现了更高的主观性。

(4) 拍分维度的相关性分析

感知之间表现出显著的相关性,例如富裕感、安全感和活跃感具有强正相关性(R > 0.95),反映了城市繁荣带来的感知连锁反应。而压抑感与其他感知的负相关则说明了城市健康发展对心理健康的重要影响。

(5) 驱动因素分析

通过对城市感知及其驱动因素的量化分析,研究发现建筑布局对富裕感和活跃感贡献较大,而自然景观对压抑感、美感和无聊感有显著影响。此外,教育和政府服务等POI对富裕感和安全感的提升作用尤为明显。

(6) 武汉市的感知空间分布

研究绘制了武汉市街景感知分布图,发现核心城区(如武昌、江汉等)在富裕感、安全感和活跃感等方面得分较高,而远郊区(如东西湖区)的自然景观、美感得分最高,压抑感得分最低,反映了其相对经济欠发达的特点。

研究结论与意义

研究表明,人机对抗评分框架能够在低成本条件下实现高精度的城市感知评估,其语义分割与随机森林算法提供了一种便捷的感知数据处理方式。通过武汉市案例研究,该框架对局部感知的捕捉能力得到了验证。

在科学意义上,本研究丰富了城市感知评估的技术方法,并通过视觉要素和功能结构的解析深化了对感知驱动因素的理解;应用价值方面,研究为城市规划和健康政策提供了新的数据支持路径,助力实现更具人性化与可持续发展的城市设计。

研究亮点

  1. 首次提出人机对抗评分框架,用于城市感知快速评估。
  2. 成功构建适用于中国城市街景的高精度语义分割模型。
  3. 在量化感知驱动因素间的关联上取得了突破性进展,特别是POI与感知分布的匹配度达到90%以上。
  4. 案例研究覆盖范围广,兼具学术价值与现实意义。

后续研究探讨

本文探讨了感知多样性问题、时间滞后效应以及志愿者个人属性可能引发的评分偏差,期望未来通过更大规模的众包数据和改进算法模型进一步优化城市感知研究。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com