基于时空多图Transformer的无桩共享电动滑板车实时需求预测研究学术报告
本研究论文发表在《IEEE Transactions on Intelligent Transportation Systems》期刊第24卷第8期(2023年8月)。论文的主要作者为Yiming Xu,通讯作者为Xilei Zhao,他们均来自University of Florida的土木与海岸工程系。合作者还包括Xiaojian Zhang以及现已任职于WR Berkley的Mudit Paliwal。这项研究获得了美国交通部Southeastern Transportation Research, Innovation, Development and Education (STRIDE) University Transportation Center以及University of Florida Artificial Intelligence Research Catalyst Fund的资助。
一、 研究背景与目标
本研究属于智能交通系统与深度学习交叉领域,核心科学问题是无桩共享电动滑板车(Dockless Scooter-Sharing)的实时时空需求预测。作为一种灵活、便捷、环保的“第一/最后一公里”交通解决方案,无桩共享电动滑板车近年来在欧美城市发展迅速。然而,其运营面临两大核心挑战:一是出行需求在时空上的高度不均衡,导致车辆在某些区域堆积,侵占人行道并引发安全问题;二是需要为电量耗尽的车辆规划收集、充电和重新投放的地点。
要制定最优的车辆再平衡策略和投放计划,关键在于对滑板车需求进行高精度的实时时空预测。尽管已有大量研究针对站点式共享单车进行需求预测,并开发了基于循环神经网络(Recurrent Neural Network, RNN)、卷积神经网络(Convolutional Neural Network, CNN)和图卷积网络(Graph Convolutional Network, GCN)等模型,但这些模型难以直接应用于无桩滑板车场景。因为无桩滑板车没有固定站点,其起讫点需求在空间上更为分散,无法简单地抽象为站点节点构成的图。因此,专门针对无桩滑板车需求预测的研究相对缺乏。
此外,现有预测模型通常仅考虑地理邻接关系来捕捉空间依赖性,而忽略了与滑板车使用高度相关的其他空间因素,如区域功能、人口统计特征和建成环境等。同时,天气条件对滑板车使用有显著影响,但多数现有时空模型未将其纳入考量。为了填补这些研究空白,本研究提出了一种名为“时空多图Transformer(Spatio-Temporal Multi-Graph Transformer, STMGT)”的新型深度学习架构。该研究的目标是构建一个能够同时有效捕捉复杂空间依赖性和长期时间依赖性,并融入关键影响因素(如天气)的预测模型,以显著提升无桩共享电动滑板车实时需求预测的准确性。
二、 详细工作流程
本研究的工作流程严谨,主要包括问题定义、数据收集与处理、模型设计与构建、案例研究实施、模型对比与消融实验、模型效果评估等步骤。
首先,研究者对预测问题进行了形式化定义。研究区域根据人口普查区块组或普查区进行划分,以确保每个区域在社会经济与人口属性上具有同质性。定义每个区域i在时间间隔t内的滑板车使用次数为需求X_i_t。预测问题被定义为:给定节点相关性图G、天气条件矩阵C和历史需求矩阵X_T(包含T个连续历史时间间隔的需求),学习一个函数f,将历史需求映射到未来M个时间间隔的需求Y_t。
其次,研究团队在美国华盛顿特区和德克萨斯州奥斯汀市进行了两个独立的案例研究,以验证模型的泛化能力。数据收集工作详尽,包括:1) 滑板车出行数据:华盛顿特区的数据通过解析多家运营商(Bird, Lime, Lyft, Spin)的通用共享单车数据规范(General Bikeshare Feed Specification, GBFS)数据推断得出;奥斯汀市的数据则来自当地政府运营的数据共享门户。数据被聚合到区块组级别,并按1小时间隔统计出发(起点)需求量,划分为训练集、验证集和测试集。2) 天气数据:来自全球历史气候学网络(GHCN)数据库,包括日降水、日均温度和平均风速。3) 空间特征数据:包括从开放数据门户和Google Map API获取的各类兴趣点(Point of Interest, POI)数据;来自美国社区调查(American Community Survey)的人口统计特征数据(如人口密度、年轻人比例、收入、教育水平等);以及通过GIS技术和WalkScore API计算的建成环境与交通供给特征数据(如自行车道密度、步行指数、公交站点密度、停车场密度、路网密度等)。
本研究的核心创新在于STMGT模型的构建。该模型框架由三部分组成:空间块(Spatial Block)、时间块(Temporal Block)和一个1x1卷积层。空间块的核心是一个基于多图的图卷积网络(GCN),用于捕捉复杂的空间依赖性。这是模型的关键创新点之一。研究者没有使用单一的邻接图,而是构建了四个不同的图来全面表征区域间的相关性:空间邻接图(基于地理邻接关系)、功能相似图(基于POI类别的皮尔逊相关系数,阈值设为0.8)、人口统计相似图(基于人口统计特征的皮尔逊相关系数,阈值设为0.8)和交通供给相似图(基于交通供给特征的皮尔逊相关系数,阈值设为0.8)。这四个图被融合成一个综合的节点相关性图G,作为GCN的输入。具体而言,研究者采用了Kipf和Welling提出的经典两层GCN架构,其前向传播过程将历史需求矩阵X_T与融合后的邻接矩阵A_hat进行计算,通过ReLU和Softmax激活函数,输出一个融合了空间依赖性的新特征矩阵X’_t,0。
时间块由一系列K个Transformer块组成,用于捕捉长期时间依赖性。Transformer基于自注意力机制,能够并行处理序列数据,有效建模长程依赖关系。第一个Transformer块不仅接收来自空间块的输出X’_t,0,还同时引入了天气条件矩阵C作为额外输入。此后的Transformer块则顺序处理前一块的输出。每个Transformer块包含多头自注意力子层和前馈神经网络子层,并采用残差连接和层归一化来稳定训练。通过这种方式,模型将天气这一关键外部因素与时空特征进行了深度耦合。
最后,时间块的输出X’_t,K通过一个1x1卷积层生成最终的预测结果Ŷ_t。整个模型的算法流程清晰:先融合多图,再经GCN处理得到空间增强特征,然后由Transformer(结合天气信息)处理得到时间增强特征,最终由卷积层输出预测值。
在模型训练方面,研究使用了NVIDIA 1080Ti GPU,批次大小设置为36,Transformer块数量K为3,输入历史序列长度T为24。模型采用L2损失函数和Adam优化器训练了300个周期,初始学习率为0.005。
三、 主要研究结果
研究结果通过详尽的对比实验和消融分析,充分证明了STMGT模型的优越性。
首先,在模型对比实验中,研究者在两个案例数据集上将STMGT与15个基准模型进行了比较,涵盖了从传统统计模型(如历史平均HA、自回归综合移动平均ARIMA)、经典机器学习模型(如支持向量回归SVR、梯度提升决策树GBDT、随机森林RF),到基础的深度学习模型(如多层感知机MLP、门控循环单元GRU、长短期记忆网络LSTM),再到先进的时空深度学习模型(如T-GCN、STGCN、AGCRN、MC-STGCN)以及注意力机制模型(Transformer、Informer)。评估指标包括平均绝对误差(MAE)、均方根误差(RMSE)以及对大值更鲁棒的MAPE10和SMAPE。
实验结果显示,在两个案例中,STMGT模型在所有指标上均显著优于所有基准模型。具体而言,时空模型(如T-GCN, STGCN)的性能普遍优于仅能捕捉时间依赖的RNN模型(GRU, LSTM),这证实了空间依赖性的重要性。而采用多图输入的模型(MC-STGCN和STMGT)又优于采用单图(仅邻接图)输入的T-GCN,说明更全面的空间信息(功能、人口、交通相似性)能提升预测精度。最后,STMGT超越了同样使用多图但采用GRU捕捉时间依赖且未考虑天气的MC_STGCN,这凸显了Transformer在处理时间序列上的优势以及纳入天气信息的价值。
其次,为了探究模型中各个组件的贡献,研究者进行了消融研究(Ablation Study)。他们逐一移除了四个图(邻接图、功能相似图、人口统计相似图、交通供给相似图)和天气信息,观察模型性能的变化。结果非常具有启发性。对于两个案例,移除天气信息导致的预测误差增加最为显著(例如,华盛顿特区数据集的MAE增加了57%,RMSE增加了40%;奥斯汀数据集MAE增加26%,RMSE增加34%)。这一结果强有力地证明,天气条件是影响滑板车需求的最关键因素之一,将其纳入模型能极大提升性能。移除其他各个图也都会导致性能下降,表明每个空间关系图都对捕捉复杂的空间模式有所贡献。有趣的是,仅移除空间邻接图导致的性能下降相对有限(华盛顿特区MAE增20%,RMSE增6%),这暗示在无桩滑板车场景下,仅靠地理邻近性不足以完全描述空间依赖,功能、人口等属性的相似性可能扮演了更重要的角色。
为了进一步量化不同特征的重要性,研究者还计算了排列特征重要性(Permutation Feature Importance)。其结果与消融研究一致:天气信息是最重要的特征,其次是功能相似性。在华盛顿特区,人口统计相似性和交通供给相似性的重要性高于空间邻接;而在奥斯汀,空间邻接的重要性则相对更高。这揭示了不同城市滑板车使用模式的空间影响因素可能存在差异。
此外,研究者通过可视化特定区域(一个在华盛顿特区,一个在奥斯汀)的预测值与真实值随时间的变化,展示了模型具有良好的跟踪需求波动和预测高峰需求(如周末高峰)的能力。他们还分析了模型在不同小时段的平均预测误差,发现误差随着真实平均需求的增加而增加,但整体保持在较低水平(例如,华盛顿特区RMSE始终低于0.45)。
四、 结论与意义
本研究成功提出并验证了STMGT模型,这是一个用于无桩共享电动滑板车实时时空需求预测的创新型深度学习框架。研究得出结论:该模型通过融合基于交通领域知识构建的多图GCN来捕捉复杂的空间依赖性,并利用结合了天气信息的Transformer来捕捉长程时间依赖性,从而实现了卓越的预测性能。在两个现实世界的案例研究中,STMGT均显著超越了现有的先进基准模型。
该研究的科学价值在于:1) 方法论的创新:首次将Transformer与多图GCN深度融合,应用于一个尚未被充分探索但重要的交通预测问题。2) 领域知识的深度整合:突破了以往模型仅考虑地理邻接的局限,创造性地构建了功能、人口、交通供给等多个语义图,将丰富的交通领域知识系统地编码到深度学习模型中。3) 关键影响因素的识别与量化:通过严格的消融实验和特征重要性分析,明确并量化了天气信息是影响预测精度的最重要因素,这为后续相关研究指明了关键输入变量。
其应用价值十分显著:高精度的实时需求预测能够帮助共享微出行运营商制定最优的车辆再平衡调度方案,及时移走冗余车辆,缓解公共空间侵占问题;同时也能指导运营商更高效地进行车辆充电和投放,优化资产利用效率。对于城市管理者而言,该模型可以支持更好地规划和管理无桩共享滑板车运营,平衡其带来的便利性与可能产生的负面外部性。
五、 研究亮点与展望
本研究的亮点突出体现在以下几个方面:1) 问题新颖且具挑战性:聚焦于快速增长但预测研究匮乏的无桩共享滑板车领域,解决了其需求空间分散带来的建模难题。2) 模型架构的创新性:提出的STMGT模型是首个将多图GCN与Transformer结合用于该任务的框架,设计精巧。3) 实验分析的严谨性:通过两个独立案例验证了模型的泛化能力,并运用了全面的基准对比、消融研究和特征重要性分析,使结论坚实可信。4) 领域驱动的特征工程:构建的四个语义图充分体现了交通研究中对土地利用、人口、建成环境与出行行为关系的深刻理解。
研究者在文末也指出了当前工作的局限性和未来方向:首先,模型假设空间依赖性是静态的(即图结构不随时间变化),而现实中这种依赖关系可能是动态的(如早晚高峰模式不同),未来可采用动态图进行建模。其次,本研究使用了日度天气数据来预测小时需求,未来可尝试使用更高时间分辨率(如小时)的天气数据以提升精度。最后,COVID-19疫情可能改变了出行模式,未来可将疫情相关因素纳入模型以提高其普适性。这些思考为后续研究提供了有价值的指引。