本文档属于类型a,即报告了一项原创性研究。以下是基于该文档生成的学术报告:
基于SARIMA模型的广珠城际铁路客流量预测研究
作者及机构
本研究由李洁、彭其渊和杨宇翔共同完成,作者分别来自西南交通大学交通运输与物流学院以及西南交通大学综合交通运输智能化国家地方联合工程实验室。该研究发表于《西南交通大学学报》2020年2月第55卷第1期。
学术背景
本研究属于交通运输领域,特别是铁路运输中的客流量预测。广珠城际铁路作为广州地区的重要客运通道,其客流量预测对旅客运输计划的编制和运营组织效率的提升具有重要意义。然而,现有的客流预测方法多应用于城市轨道交通,针对铁路车站的客流预测研究较少,且现有模型在预测步长对预测精度的影响方面缺乏深入探讨。因此,本研究旨在通过构建季节性差分自回归滑动平均模型(Seasonal Autoregressive Integrated Moving Average, SARIMA)来预测广珠城际铁路的客流量,并分析预测步长对预测精度的影响。
研究流程
本研究主要包括以下几个步骤:
数据收集与预处理
研究选取了广珠城际铁路的广州南站、小榄站和珠海站作为研究对象,收集了2012年12月31日至2014年5月31日的每日客流量数据。数据预处理包括去除异常值、修复节假日客流数据以及划分训练集和测试集。其中,节假日客流数据通过指数衰减加权平均法进行修复,异常值则通过孤立点分析(m (η,r))进行筛选和修复。
模型构建与参数优化
研究使用Python中的statsmodels模块构建SARIMA模型,并通过超参数优化确定模型的最佳参数。具体步骤包括:
模型检验
在模型预测前,研究对模型的有效性进行了检验。通过残差分析、残差分布直方图、Q-Q图以及Ljung-Box检验,验证了模型残差接近正态分布且不相关,表明模型能够有效拟合数据。
客流量预测与误差分析
研究采用步进预测(walk-forward)的方式进行预测,预测步长分别设置为1至4天。使用平均绝对百分比误差(MAPE)和均方根误差(RMSE)对预测效果进行评价。结果表明,SARIMA模型在预测步长为1时,广州南站、小榄站和珠海站的MAPE分别为3.97%、5.83%和5.43%;预测步长增加为2时,MAPE显著增加,分别为5.31%、6.79%和7.62%;预测步长大于2时,预测误差基本保持稳定。
模型对比
研究将SARIMA模型与随机森林(RF)、支持向量机(SVM)、梯度提升算法(GB)和K最近邻算法(KNN)进行了对比。结果表明,预测步长为1时,SARIMA模型的预测效果略优于其他模型;预测步长大于1时,RF、SVM、GB和KNN模型的预测误差显著增加,且为SARIMA模型误差的数倍。
主要结果
1. SARIMA模型的预测精度
SARIMA模型能够较好地捕捉客流的周期性变化规律,但在客流发生随机波动时,预测误差较大。预测步长为1时,SARIMA模型的预测精度较高,MAPE和RMSE分别为3.97%和1,358.77;预测步长增加时,预测精度有所降低,但误差增长幅度较小。
预测步长对预测精度的影响
预测步长为1时,SARIMA模型的预测误差较小,且误差分布较为集中;预测步长增加时,预测误差显著增加,且误差分布逐渐分散。这表明SARIMA模型在进行多步预测时,预测误差会随着预测步长的增加而累积。
与其他模型的对比
SARIMA模型在预测步长大于1时,预测精度显著优于RF、SVM、GB和KNN模型。这表明SARIMA模型能够更好地捕捉客流时间序列中的季节性和周期性规律,适用于多步预测。
结论
本研究通过构建SARIMA模型,成功预测了广珠城际铁路的客流量,并分析了预测步长对预测精度的影响。研究结果表明,SARIMA模型在预测步长为1时具有较高的预测精度,且在进行多步预测时,其预测精度显著优于其他模型。SARIMA模型能够较好地捕捉客流时间序列中的季节性和周期性规律,适用于铁路车站的短期客流量预测。
研究亮点
1. 创新性方法
本研究首次将SARIMA模型应用于广珠城际铁路的客流量预测,并通过超参数优化确定了模型的最佳参数,提高了预测精度。
预测步长的影响分析
研究深入分析了预测步长对预测精度的影响,填补了现有研究在预测步长对模型预测精度影响方面的空白。
模型对比
研究将SARIMA模型与RF、SVM、GB和KNN模型进行了对比,验证了SARIMA模型在多步预测中的优势。
研究价值
本研究为铁路车站的短期客流量预测提供了一种有效的方法,具有较高的科学价值和应用价值。研究结果可为铁路运输部门制定旅客运输计划和优化运营组织提供重要参考。此外,研究提出的SARIMA模型构建和优化方法,也可为其他交通领域的客流量预测研究提供借鉴。