本文由王莹、韩宝明、张琦和李得伟共同撰写,分别来自北京交通大学轨道交通控制与安全国家重点实验室和交通运输学院。该研究于2015年12月发表在《交通运输系统工程与信息》(Journal of Transportation Systems Engineering and Information Technology)第15卷第6期上。
随着城市轨道交通的快速发展,地铁客流量的预测成为保障地铁运营安全与效率的重要环节。北京地铁作为中国最繁忙的地铁系统之一,其客流量的波动具有显著的周期性特征,尤其是以周为周期的波动规律。为了更准确地预测地铁进站客流量,研究者采用了季节性时间序列模型(SARIMA,Seasonal Autoregressive Integrated Moving Average Model)。SARIMA模型是ARIMA模型的改进版本,特别适用于具有周期性特征的时间序列数据。该研究的主要目标是通过对北京地铁2013年5月至7月的进站客流量数据进行分析,建立SARIMA模型,并利用该模型进行短时客流量预测,为地铁运营管理提供参考。
研究流程主要包括以下几个步骤:
数据收集与预处理
研究者使用了北京市交通委提供的2013年5月至7月的北京地铁进站客流量数据。数据以天为单位进行统计,形成时间序列。通过对数据的初步分析,研究者发现北京地铁进站客流量具有以周为周期的波动性,周一至周五的客流量较高,周六和周日的客流量显著下降。
模型选择与构建
研究者选择了SARIMA模型进行建模。SARIMA模型能够处理具有周期性特征的时间序列数据,其核心思想是通过季节差分将非平稳时间序列转化为平稳序列,然后进行自回归和移动平均分析。研究者首先对原始序列进行了7次季节差分,使其满足平稳性要求。随后,通过自相关函数(ACF)和偏自相关函数(PACF)图确定了模型的参数,最终构建了SARIMA(1,1,2)(1,1,0)7模型。
模型检验与优化
在模型构建完成后,研究者对模型进行了参数估计和检验。通过ADF检验(Augmented Dickey-Fuller Test)验证了差分后序列的平稳性,并利用残差序列的Q检验(Q-statistic)进一步验证了模型的拟合效果。结果表明,模型的回归系数均通过了显著性检验,拟合效果良好。
客流量预测
研究者利用构建的SARIMA模型对北京地铁进站客流量进行了动态预测和静态预测。动态预测使用滞后变量的预测值进行迭代预测,而静态预测则使用滞后变量的实际值进行预测。结果表明,静态预测的精度更高,平均相对误差为0.003203,能够较准确地捕捉客流量的变化趋势。
节假日预测分析
研究者还特别分析了节假日期间的客流量预测效果。由于节假日期间客流量与平日差异较大,模型在端午节期间的预测误差较大,最大相对误差达到42.6%。研究者指出,节假日的客流量预测需要参考往年同期数据进行调整。
与ARIMA模型的对比
为了验证SARIMA模型的优越性,研究者还使用了ARIMA模型对同一数据集进行预测,并将结果与SARIMA模型进行了对比。结果表明,SARIMA模型的预测精度显著高于ARIMA模型,尤其是在捕捉客流量波动趋势方面表现更为出色。
周期性波动规律
北京地铁进站客流量具有显著的以周为周期的波动性,周一至周五的客流量较高,周六和周日的客流量显著下降。
SARIMA模型的预测精度
SARIMA模型在短时客流量预测中表现出较高的精度,静态预测的平均相对误差为0.003203,能够较准确地描述客流量的变化趋势。
节假日预测的局限性
模型在节假日期间的预测误差较大,表明节假日客流量的预测需要结合历史数据进行调整。
SARIMA模型的优越性
与ARIMA模型相比,SARIMA模型在捕捉客流量波动趋势方面表现更为出色,预测精度更高。
本研究通过构建SARIMA模型,成功预测了北京地铁进站客流量的短时变化趋势,为地铁运营管理提供了有力的数据支持。研究结果表明,SARIMA模型在处理具有周期性特征的时间序列数据时具有显著优势,尤其是在短时预测中表现出较高的精度。然而,模型在节假日期间的预测效果有待进一步优化。未来的研究可以结合更多的历史数据,特别是节假日期间的客流量数据,以提高模型的预测精度。
周期性波动规律的发现
本研究首次系统性地分析了北京地铁进站客流量的周期性波动规律,为后续的客流量预测提供了重要的理论依据。
SARIMA模型的应用
研究者创新性地将SARIMA模型应用于地铁客流量预测,验证了该模型在短时预测中的优越性。
高精度的预测结果
通过静态预测,研究者获得了平均相对误差仅为0.003203的高精度预测结果,为地铁运营管理提供了可靠的数据支持。
节假日的特殊处理
研究者特别关注了节假日期间的客流量预测问题,提出了结合历史数据进行调整的建议,为未来的研究提供了新的思路。
本研究还特别对比了SARIMA模型与ARIMA模型的预测效果,进一步验证了SARIMA模型在处理周期性时间序列数据时的优越性。此外,研究者还详细分析了模型在不同时间段的预测误差,为模型的优化提供了重要参考。