分享自:

基于ARIMA模型的地铁客流量数据分析与预测

期刊:defense manufacturing technology

这篇文档属于类型a,即报告了一项原创性研究。以下是基于文档内容生成的学术报告:


作者及机构
本研究由吴祥彬、刘志锋、丁成龙、邹学钢、王睿麟、魏振华共同完成,他们均来自东华理工大学信息工程学院(江西南昌,330013)。该研究发表于《defense manufacturing technology》期刊,2021年12月第4期。

学术背景
随着城市轨道交通网络的快速发展,地铁客流量不断增加,导致地铁站客流量过度饱和,尤其是在节假日、早晚高峰时段以及大型活动期间。这种现象给车辆调度和乘客输送带来了巨大挑战。因此,如何科学预测地铁客流量,帮助运营部门合理调度车辆,成为亟待解决的问题。
本研究的主要科学领域为时间序列分析与预测,旨在通过建立数学模型,预测地铁未来客流量。研究选择了ARIMA(Autoregressive Integrated Moving Average,差分自回归移动平均)模型,因为该模型在时间序列预测中具有较好的表现。研究的背景知识包括时间序列分析、平稳性检验、差分处理以及ARIMA模型的参数选择等。研究的目标是通过ARIMA模型对某城市地铁客流量进行预测,并评估其预测效果。

研究流程
研究主要分为以下几个步骤:
1. 数据清洗与平稳性判断
首先对地铁运营数据进行清洗,去除异常值。以站名5为例,选择了2019年9月1日至2019年12月31日的数据。清洗后,绘制了客流量折线图,发现数据在周一到周四较为平稳,但在国庆和元旦期间出现峰值。这些峰值被视为正常值,未进行剔除。
2. ARIMA模型介绍与适用性分析
ARIMA模型是一种常用的时间序列预测模型,由自回归(AR)、差分(I)和移动平均(MA)三部分组成。本研究通过分析地铁运营数据,发现其符合ARIMA模型的规律,因此决定采用该模型进行预测。
3. 时间序列的差分处理
为了使时间序列数据具有平稳性,研究对数据进行了一阶差分处理。通过绘制一阶差分图,发现差分后的数据均值和方差已基本平稳,因此将差分次数d设置为1。
4. 选择ARIMA模型的参数(p和q)
通过绘制自相关图(ACF)和偏自相关图(PACF),确定了最佳的ARIMA模型参数为(p, q)=(4, 3)。
5. 模型预测与检验
使用确定的ARIMA模型对2019年12月14日至2020年12月25日的数据进行预测。预测结果显示,预测曲线与实际曲线基本吻合,但在假期期间存在一定误差。
6. 疫情期间数据的预测
对2020年1月24日至2020年5月31日的疫情区间数据进行预测。由于疫情期间数据较为稳定,未进行清洗。预测结果与实际值的误差稳定在10%以内,部分站点的预测结果如表2所示。

主要结果
1. 2019年数据预测结果
预测曲线与实际曲线大致相同,但在假期期间存在误差。以站名5为例,相对误差在5%以内的占50%,5%-10%之间的占33%,超过10%的占27%。
2. 疫情期间数据预测结果
疫情期间的预测结果与实际值的误差稳定在10%以内。例如,2020年5月25日的预测客流量为5856,实际客流量为6156,相对误差为4.9%。
3. 模型整体表现
ARIMA模型在预测地铁客流量方面表现出色,误差稳定在较低水平,能够有效反映客流量的变化趋势。

结论
本研究通过ARIMA模型对地铁客流量进行了预测,结果表明该模型能够较好地预测客流量的变化趋势,误差稳定在10%以内。这为地铁运营部门提供了科学依据,帮助他们合理调度车辆,提高运营效率。
研究的科学价值在于验证了ARIMA模型在地铁客流量预测中的适用性,为相关领域的研究提供了参考。其应用价值在于为地铁运营管理提供了技术支持,有助于缓解客流量过度饱和的问题。

研究亮点
1. 重要发现
ARIMA模型在地铁客流量预测中表现出色,误差稳定在较低水平。
2. 方法新颖性
研究通过一阶差分处理使时间序列数据平稳化,并通过ACF和PACF图确定了最佳模型参数,这一方法具有较强的科学性和实用性。
3. 研究对象的特殊性
研究不仅对常规数据进行了预测,还对疫情期间的异常数据进行了分析,验证了模型在不同情况下的适用性。

其他有价值内容
研究还引用了多篇相关文献,进一步支持了ARIMA模型在时间序列预测中的应用价值。例如,文献[4]和[5]分别探讨了ARIMA模型在纳斯达克指数和中国核心CPI预测中的应用,为本研究提供了理论支持。


以上是本研究的详细报告,涵盖了研究的背景、流程、结果、结论及亮点,为相关领域的研究者提供了全面的参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com