分享自:

一种用于预测城市电动滑板车需求的可解释时空神经加法模型

期刊:Transportation Research ProcediaDOI:10.1016/j.trpro.2025.04.007

该文档是一篇学术期刊论文,报告了一项关于电动滑板车需求预测的原创性研究。因此,我将按照类型a的要求,为您生成一份详细的学术报告。

学术研究报告:面向多城市的时空可解释电动滑板车需求预测模型

一、 研究团队与发表信息

本项研究的主要作者为 Sören SchleibaumJulian Teusch(二者贡献同等)、Yannick Oskar ScherrJörg P. Müller。 * Sören Schleibaum 和 Julian Teusch 来自德国克劳斯塔尔工业大学的计算机科学系。 * Yannick Oskar Scherr 同时隶属于奥地利克拉根福大学运营、能源与环境管理系以及奥地利维也纳大学商业决策与分析系。 * Jörg P. Müller 同属克劳斯塔尔工业大学计算机科学系。Sören Schleibaum 为通讯作者。

此项研究成果以题为 《Spatial-temporal patterns of e-scooter demand prediction across cities》 的论文形式,发表于期刊 Transportation Research Procedia (Volume 86, 2025)。文章在线发表于2024年,收录于第26届欧洲交通工作组会议(EWGT 2024)的论文集。

二、 学术背景与研究目标

所属科学领域:本研究主要属于交通科学、城市信息学与人工智能的交叉领域,具体聚焦于城市微观交通(微出行)的需求预测与可解释人工智能。

研究背景与动机:电动滑板车等微出行服务在向可持续交通转型中扮演着重要角色。高效管理这些服务的关键在于准确预测需求。然而,受空间、时间及天气等多重因素影响的动态城市交通,给需求预测带来了巨大挑战。传统预测方法难以捕捉复杂的城市出行模式。近年来,基于机器学习(如长短期记忆网络LSTM、图卷积网络)的方法显著提升了预测精度,但这些深度神经网络模型通常被视为“黑箱”,缺乏对预测驱动因素的洞察。这种透明度和可解释性的缺失,阻碍了服务提供商做出提升服务效率和用户满意度的明智决策。

因此,本研究旨在填补高预测精度与模型可解释性之间的鸿沟,特别是在短期(如下一小时)电动滑板车需求预测的背景下。神经可加性模型(Neural Additive Models, NAM)为实现这一平衡提供了新思路。本研究受此启发,旨在开发一种既能保持深度学习预测能力,又能清晰展示不同特征如何影响需求的新模型。

研究目标: 1. (RQ1) 探究采用神经可加性模型(NAM)对短期电动滑板车需求预测精度的影响。 2. (RQ2) 探究空间和时间特征以及外部因素(如温度)如何影响不同城市的短期电动滑板车需求。

三、 研究详细工作流程

本研究的工作流程系统而严谨,可分为数据准备、模型设计、实验评估与结果解释四个主要阶段。

1. 数据收集与预处理 * 研究对象与样本规模:研究使用了来自四个不同城市环境的真实世界电动滑板车出行数据集,以确保评估的稳健性和普适性。具体包括: * 美国德克萨斯州奥斯汀:2018年4月至12月的数据,经过异常值处理后包含约65.4万次出行。 * 德国柏林:2023年9月至2024年4月的数据,处理后包含约111.1万次出行。 * 德国科隆:同期数据,处理后包含约63.4万次出行。 * 德国汉诺威:同期数据,处理后包含约31.2万次出行。 * 数据处理流程: * 地理与时间过滤:剔除预设城市边界多边形之外以及研究时段之外的出行记录。 * 异常值剔除:根据城市特定的阈值,剔除具有异常持续时间、距离或能耗的行程。 * 空间离散化:将城市区域划分为1000米×1000米的方形网格。每个出行记录的起点和终点被映射到对应的网格单元索引上。选择此网格大小是为了平衡预测的粒度与电动滑板车需求(尤其在郊区)的稀疏性。 * 时间离散化:将出行的开始和结束时间按1小时和3小时的周期进行离散化处理。 * 特征工程:除了历史出入流数据,还整合了时间相关特征(如星期几、小时)和天气条件特征(如温度、露点、降水、压力)。

2. 问题定义与基线模型 * 问题定义:研究采用了单单元(Single-Cell, SC) 问题表述,而非更常见的城市整体(City-Wide, CW)预测。SC方法聚焦于预测城市网格中单个特定单元在未来时刻(t+α+1)的流出需求(即该单元内被租用的滑板车数量)。模型输入包括:该单元及其周边邻域(由邻域大小ν定义)在之前一段时间(Δt)的历史流入和流出数据、该单元的位置(独热编码)、时间特征和天气特征。这种方法减少了输入/输出特征的数量,增强了模型的可解释性,并强调了局部因素(如天气、时间)的作用。 * 基线模型:为了评估性能,研究设定了两个基于神经网络的城市整体(CW)基线模型,它们使用整个城市的网格数据作为输入和输出: * BL-CNN:基于卷积神经网络(CNN)的模型。 * BL-FCNN:基于全连接神经网络(FCNN)的模型。 * 评估指标:采用对称平均绝对百分比误差(SMAPE)作为评估预测精度的主要指标,它能对不同流量规模的区域进行平衡评估。

3. 提出新模型:时空神经可加性模型(ST-NAM) * 核心创新:本研究提出了一种新颖且可解释的神经网络设计——时空神经可加性模型(Spatial-Temporal Neural Additive Model, ST-NAM)。它在NAM框架基础上进行了扩展,以显式表达城市交通中固有的电动滑板车出行模式。 * 模型架构(如图1所示):ST-NAM接收四类输入:邻域历史需求、邻域历史供应、单元位置矩阵、附加特征(时间+天气)。其架构包含三个核心部分: * 时空特征网络:处理前三个高度相关的特征。它由一个编码器(受Ham等人(2021)启发)、一个CNN和一个Transformer组成,用于捕获时空动态和空间依赖性。将多个相关特征通过一个特征网络处理,是对传统NAM架构的修改。 * 特征特定网络:每个附加特征(如温度、星期几)通过一个独立的、基于FCNN的小型神经网络进行处理。 * 交互网络:所有输入两两配对,送入一个交互层,以捕获特征间的相互作用。 * 最后,所有上述网络的输出被求和,得到对目标单元未来流出需求的预测。这种单单元架构使得输出仅为单个值,极大简化了解释过程。

4. 实验设计与分析流程 * 实验配置:研究进行了六组实验,针对四个城市和两个预测周期(1小时和3小时),系统性地探究了不同模型配置的影响。实验变量包括: * 预测周期:1小时 vs. 3小时。 * 模型范围:单单元(SC)ST-NAM vs. 城市整体(CW)ST-NAM。 * 邻域大小(ν):对比ν=1, 3, 5。 * 输入时间步长(Δt):对比Δt=1, 2, 3, 4, 5。 * 预测间隔(α):对比α=0, 1, 2(用于模拟为车辆重新调配留出操作时间的情况)。 * 数据分析与解释方法:在模型训练和评估后,研究利用ST-NAM固有的可解释性,对结果进行了深入分析: * 特征重要性分析:通过观察每个特征网络对最终预测的贡献,量化不同特征(如上一时段需求、天气、小时)的重要性。 * 部分依赖图分析:可视化单个特征(如历史平均需求、一天中的小时)与预测需求之间的关系,展示其影响模式。

四、 主要研究结果

1. 预测性能结果(对应RQ1) * ST-NAM的整体表现:在大多数实验配置下,单单元(SC)ST-NAM展现出了与先进的城市整体(CW)基线模型(BL-CNN, BL-FCNN)相竞争甚至更优的预测精度。例如,在1小时预测周期下,多个城市的SMAPE与基线模型相当或略有优势。 * 关键发现: * 预测周期影响:所有模型在预测未来3小时需求时的误差(SMAPE)均高于预测未来1小时,符合预期。但不同城市间误差增长幅度不同。 * 单单元 vs. 城市整体:在1小时预测上,SC ST-NAM通常优于或等同于CW ST-NAM。在3小时预测上,结果因城市而异,但SC方法在输入/输出特征数量(显著更低)方面具有巨大优势。 * 邻域大小(ν):ν=1(仅考虑本单元)导致预测精度下降。ν=3通常是最佳或接近最佳的配置,ν=5并未带来显著一致的提升,但增加了特征数量。这表明适度的空间上下文信息至关重要。 * 输入时间步长(Δt):最佳Δt值因城市和预测周期而异,但Δt=4或5通常能产生良好结果,表明需要一定长度的历史序列来捕捉模式。 * 预测间隔(α):增加α(为操作预留时间)通常会导致预测精度下降,这强调了实时或近实时预测对于运营调整的重要性。 * 核心结论:ST-NAM能够在使用少得多的输入和输出特征(依赖于邻域大小而非整个城市网格)的情况下,实现与复杂“黑箱”基线模型相当的预测精度。这验证了其高效性和实用性。

2. 时空模式与特征影响分析(对应RQ2) * 特征重要性:分析揭示了影响需求的关键因素在不同城市间的共性与差异。 * 普遍最重要的特征上一观测时间步的需求(O^t) 是所有城市中最显著的预测因子,强调了历史需求的持续性。 * 天气因素:德国城市(柏林、科隆、汉诺威)对露点、降水和压力等气象变量更为敏感,这可能源于其相比气候稳定的奥斯汀更为多变的天气条件。 * 时间因素:一天中的“小时”特征也具有显著影响,但其重要性通常低于历史需求。 * 部分依赖分析: * 历史需求的影响:在奥斯汀、科隆和汉诺威,历史平均需求与未来预测需求之间大多呈线性关系。而在柏林,这种关系更为平缓,可能与其多中心的城市布局导致需求分散有关。 * 小时特征的影响:可视化显示了一天中不同时间对高需求预测的影响模式: * 奥斯汀:呈现双峰模式(早高峰和午间高峰),可能与通勤模式相关。 * 柏林:需求在全天分布更均匀,反映了其多中心结构下活动的多样性。 * 科隆与汉诺威:需求在中午前后达到峰值,可能与午间休闲或工作相关活动集中有关。

五、 研究结论与价值

结论:本研究成功开发并验证了ST-NAM,一种用于短期电动滑板车需求预测的新型可解释神经网络模型。该模型在保持与先进“黑箱”模型相竞争的预测精度的同时,在推理时即提供了对每个输入特征贡献的清晰解读。研究证实,通过采用单单元预测和神经可加性模型框架,可以在不牺牲精度的情况下实现高度的模型透明度。

科学价值: 1. 方法论贡献:将神经可加性模型(NAM)创新性地应用于时空交通预测领域,并提出ST-NAM架构,有效融合了深度学习的表达能力和可加性模型的可解释性。 2. 理论洞察:通过跨城市的比较分析,实证揭示了影响电动滑板车需求的关键时空特征及其影响的普遍性与特异性,增进了对微出行行为动态的理解。 3. 推进可解释AI(XAI)在交通领域的应用:提供了一种“内在可解释”的解决方案,不同于常见的“事后解释”方法(如SHAP),降低了分析复杂性并支持实时解读。

应用价值: 1. 运营优化:精准且可解释的短期需求预测能帮助共享微出行服务商优化车辆调度和再平衡策略,减少车辆闲置时间,缩短用户步行距离,从而提升服务效率和用户满意度。 2. 城市规划与管理:模型揭示的详细需求驱动因素(如特定区域、时间、天气条件的影响)可为城市基础设施规划、政策制定(如停放区管理)提供数据驱动的决策支持。 3. 模型普适性:研究者指出,ST-NAM不仅限于电动滑板车需求预测,也可扩展至自行车共享、出租车需求等其他城市交通应用场景的预测与解释。

六、 研究亮点

  1. 创新性的模型设计:提出的ST-NAM是首个将神经可加性模型(NAM)应用于跨城市、短期、细粒度电动滑板车需求预测的研究,在模型精度与透明度之间取得了卓越平衡。
  2. 内在可解释性:模型本身具备可解释性,无需依赖复杂的事后解释工具,即可在预测的同时提供特征级别的贡献分析,实现了预测与解释的一体化。
  3. 系统性的跨城市验证:研究在四个具有不同特点的城市数据集上进行了全面、系统的实验,不仅验证了模型的鲁棒性,还通过比较分析获得了关于需求驱动因素跨城市异同的宝贵发现。
  4. 聚焦实用性与操作性:采用“单单元”问题表述,并考虑“预测间隔”,使研究更贴近微出行服务商的实际运营决策场景(如针对特定热点区域的车辆调度)。
  5. 详尽的超参数与配置分析:对邻域大小、输入时间步长、预测间隔等关键配置进行了深入实验分析,为后续研究和实际应用提供了重要的参数选择参考。

七、 其他有价值的内容

局限性与未来工作:作者在文中也坦诚指出了本研究的局限性并展望了未来方向: 1. 数据集多样性:未来计划在更多样化的数据集上研究特征影响,以更好理解电动滑板车需求的多样性。 2. 跨应用比较:计划将特征影响分析的框架应用于城市交通中的其他预测问题(如出租车需求预测),进行跨应用的比较研究。 3. 模型扩展:虽然当前模型已具竞争力,但在更长的预测周期上仍有改进空间,未来可探索更复杂的架构或集成方法。

致谢:本研究得到了下萨克森州科学与文化部(Volkswagen基金会“Vorab”项目,批准号ZN3493)以及数字创新中心的支持。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com