基于 ARMA-LSTM 组合模型的铁路客流量预测
本文研究了利用 ARMA-LSTM(自回归滑动平均模型-长短期记忆模型)组合模型对铁路客流量进行预测的方法。研究的目的是提升传统客流量预测方法的准确性,并结合深度学习与时间序列分析,解决传统单一预测模型在处理铁路客流量预测时的局限性。以下是该研究的综合报告。
随着中国铁路系统的快速发展,尤其是高铁和城市轨道交通的建设,铁路客流量预测成为了一个日益重要的课题。铁路客流量预测不仅有助于交通管理部门进行有效的运力调配,还能够帮助提高运输效率,减少成本。现有的铁路客流量预测方法大多依赖于传统的统计模型或机器学习模型,但这些方法通常存在很大的局限性,尤其是在捕获客流数据的复杂性(如季节性、趋势性、周期性及突发性等方面)时表现不佳。
传统的 ARMA(自回归滑动平均)模型在处理线性数据序列方面有较好的表现,但其在面对非线性数据时的能力较弱。而 LSTM(长短期记忆)网络作为一种深度学习模型,在时间序列数据的预测中显示了较强的性能,能够有效地捕捉数据中的非线性特征。本研究提出了一种 ARMA-LSTM 组合模型,旨在通过结合两种模型的优点,克服传统模型的缺点,提升铁路客流量预测的准确性。
该研究通过提出 ARMA-LSTM 组合模型,解决了传统预测方法在实际应用中的不足,具有重要的理论价值和实践意义。通过该模型,不仅能够准确预测短期铁路客流量,还能够为交通系统的智能调度、旅客流量管理等提供有效的预测工具。
本文选取了某区段内客运专线2015年1月至2016年3月的旅客列车梯形密度表数据,数据包括了每天每个车次在所经过站点的上下车人数据。在数据预处理阶段,首先进行了数据清洗,处理了缺失值和异常值。对于缺失值,使用了拉格朗日插值法进行补值,通过前后邻近的有效数据来估算缺失部分。异常值则采用了两种方法进行处理:一是将异常值视作缺失值进行插补;二是使用前后数据的平均值进行修正。
为了提取有用的特征,研究者通过移动平均法、移动标准差法等算法,从数据中提取了多个特征序列。进一步,采用了 adaptive-lasso 变量选择方法(自适应lasso)来从构造的特征序列中筛选出与客流量密切相关的关键特征。通过这种方法,最终筛选出了7天、10天和14天的移动平均序列、移动标准差序列等特征数据。
在模型部分,研究者首先采用 ARMA 模型对数据进行建模。ARMA 模型通过分析数据的自相关系数(ACF)和偏自相关系数(PACF),以及结合 Akaike 信息准则(AIC)和贝叶斯信息准则(BIC)确定最优模型的阶数。对于非平稳时间序列,则使用 ARIMA(自回归积分滑动平均模型)进行建模。
其次,研究者使用 LSTM 模型进行建模,LSTM 是一种循环神经网络(RNN)变种,能够通过门控机制(输入门、遗忘门、输出门)来控制信息的流动和记忆。LSTM 在捕捉时间序列数据的长期依赖性方面表现优秀,尤其适用于处理具有强烈非线性特征的数据。
为了进一步提升预测精度,研究者将 ARMA 和 LSTM 模型结合,提出 ARMA-LSTM 组合模型。在该模型中,ARMA 和 LSTM 各自提供独立的预测结果,然后通过 BP 神经网络(反向传播神经网络)对这两个模型的输出结果进行加权优化,从而得到最终的预测结果。加权系数通过神经网络训练得出,目的是使组合模型的预测结果达到最佳。
研究者将2015年12月27日至2016年3月14日的数据划分为三段,分别用于1月、2月和3月的预测测试。由于节假日(如元旦、春节)对客流量的影响较大,因此这三段数据包含了明显的节假日效应。
首先,使用 ARMA 模型进行预测,通过 AIC 和 BIC 信息准则选择合适的阶数。实验结果显示,ARMA(5,1,5) 模型在1月的预测中误差最小,表现最佳。
随后,使用 LSTM 模型进行预测,并对模型参数进行优化,最终选择了批量大小(batch_size)为1,时间步长(time_step)为7,学习率为0.0006,训练次数为1000次的配置。LSTM 模型的预测结果较为稳定,并且能够有效捕捉到数据中的非线性特征。
最后,通过 BP 神经网络对 ARMA 和 LSTM 的预测结果进行加权优化,得到最终的 ARMA-LSTM 组合模型预测结果。该模型在1月的预测中显示出较小的误差,进一步验证了组合模型的优越性。
为了验证 ARMA-LSTM 组合模型的预测效果,研究者将其与其他模型(如 ARMA、LSTM、GM、GM-LSTM 等)进行了对比,使用了均方根误差(RMSE)和平均绝对百分比误差(MAPE)两种评价指标。
从实验结果来看,ARMA-LSTM 组合模型在所有测试集中的表现均优于其他模型。具体而言,1月、2月和3月的 RMSE 和 MAPE 值分别为 1027.95 和 4.69%、1717.93 和 10.73%、458.33 和 3.10%。相较于 ARMA、LSTM 和 GM 等单一模型,组合模型显著提高了预测准确度,尤其是在处理复杂的非线性和季节性特征时,表现出更强的适用性。
本研究提出的 ARMA-LSTM 组合模型在铁路客流量预测中表现出了较高的准确性和优越的适用性。该模型不仅能够有效地捕捉时间序列中的线性特征,还能处理非线性和周期性变化,弥补了传统 ARMA 模型和 LSTM 模型各自的不足。
本研究的科学价值在于提出了一种新的时间序列预测方法——ARMA-LSTM 组合模型。该方法通过结合统计学和深度学习的优势,提供了一种更加全面和准确的预测工具,尤其适用于具有复杂特征的铁路客流量数据。应用于实际的铁路运输系统中,该模型能够提高客流量预测的准确度,从而优化运力调度和资源分配。
此外,ARMA-LSTM 组合模型不仅适用于铁路客流量预测,还具有较强的通用性,可以应用于其他领域的时间序列预测,如电力负荷预测、金融市场预测等。
尽管本文提出的 ARMA-LSTM 组合模型在实验中表现出色,但模型在参数设置和训练过程中的优化空间仍然存在。未来的研究可以进一步探索更多种类的模型组合,或结合其他深度学习算法,以进一步提高预测精度和模型的泛化能力。此外,如何将该模型应用到更大规模的铁路客流量数据中,以及如何应对突发事件(如自然灾害、突发疫情等)的预测,仍然是值得研究的方向。