分享自:

基于SARIMA模型的马来西亚道路交通事故死亡人数预测

期刊:Pertanika Journal of Science & TechnologyDOI:https://doi.org/10.47836/pjst.30.2.03

关于《使用季节性自回归综合移动平均模型预测马来西亚道路交通死亡事故》的学术研究报告

本研究由来自马来西亚多所研究机构的学者团队共同完成。主要作者包括 Ho Jen Sim(第一作者,隶属马来西亚道路安全研究所和马来西亚博特拉大学商业与经济学院)、Choo Wei Chong(通讯作者,隶属马来西亚博特拉大学商业与经济学院及计算统计与运筹学研究实验室)、Khairil Anwar Abu Kassim(隶属马来西亚道路安全研究所)、Ching Siew Mooi(隶属马来西亚博特拉大学医学与健康科学学院家庭医学系)以及 Zhang Yuruxian(隶属马来西亚博特拉大学商业与经济学院)。该研究以论文形式《Forecasting Road Traffic Fatalities in Malaysia Using Seasonal Autoregressive Integrated Moving Average (SARIMA) Model》发表于期刊《Pertanika Journal of Science & Technology》,并于2022年3月3日正式在线发布。

一、 学术背景与研究动机

本研究属于公共健康与交通安全领域的交叉学科研究,具体聚焦于应用时间序列分析模型进行交通事故预测。道路交通伤害是全球性的重大公共卫生问题。根据世界卫生组织(WHO)的报告,它是全球第八大死因,更是5至29岁儿童和青少年的首要死因。在马来西亚,道路交通死亡是第四大死亡原因,平均每天有18人丧生,其中摩托车骑手占死亡人数的一半。尽管马来西亚自上世纪70年代以来实施了多项道路安全措施(如1973年摩托车法规、1987年道路交通法、国家道路安全计划、自动感知安全系统等),但道路安全形势依然严峻,距离到2020年将预测死亡人数降低50%的目标仍有差距。

马来西亚是一个多元文化国家,全年有多个重要节日(如农历新年、开斋节、屠妖节、学校假期等)。在这些节日期间,出行活动激增,道路车流量平均增加约20%-30%,这不可避免地增加了交通事故和死亡风险。为了应对节日期间的交通安全挑战,马来西亚皇家警察、交通部等部门自2001年起联合实施了一项名为“Ops Bersepadu”的综合执法行动,旨在通过加强执法、宣传活动等措施减少交通事故。

在此背景下,准确预测交通死亡事故的季节性模式变得至关重要。它能够帮助相关机构优化资源(人力、预算、设备)配置,更有效地实施干预措施。先前的研究已证明,季节性自回归综合移动平均模型(Seasonal Autoregressive Integrated Moving Average, SARIMA)在预测具有季节性特征的交通事故数据方面表现优异,优于ARIMA等其他预测工具。然而,尽管马来西亚已有一些使用广义估计方程、ARIMA、泊松广义线性模型等方法的预测研究,但尚未有研究利用SARIMA模型对马来西亚的月度道路交通死亡数据进行建模和预测。因此,本研究旨在填补这一空白,开发一个适用于马来西亚月度交通死亡数据的SARIMA模型,并利用该模型的预测结果,评估“Ops Bersepadu”计划在节日期间的实际效果。

二、 详细研究流程与方法

本研究遵循经典的时间序列建模与分析流程——Box-Jenkins方法论,具体步骤如下:

1. 数据收集与划分: 研究数据来源于马来西亚皇家警察(RMP)记录的1980年至2019年共40年的月度道路交通死亡数据。为了评估自2001年开始实施的“Ops Bersepadu”计划的效果,研究人员将整个数据集划分为两个阶段:“Ops前”阶段(1980-2000年)和“Ops后”阶段(2001-2019年)。此外,为了进行模型训练与验证,数据被进一步划分为“样本内”数据(1980-2006年,用于模型参数估计和拟合)和“样本外”数据(2007-2019年,用于模型预测性能检验)。

2. 数据探索与平稳性检验: 首先,对时间序列数据进行描述性统计分析,了解其基本特征(如均值、中位数、最大值、最小值、标准差等)。然后,进行平稳性检验,这是构建ARIMA类模型的前提。研究使用了增广迪基-富勒检验(Augmented Dickey-Fuller test, ADF)和菲利普斯-佩龙检验(Phillip-Perron test, PP)两种单位根检验方法。检验结果表明,原始的月度死亡数据序列在水平值上是不平稳的,但经过一阶差分后,序列在1%的显著性水平下变得平稳,满足了建模的基本条件。

3. 模型识别与参数选择: 在确认序列经差分后平稳的基础上,研究人员绘制了自相关函数(Autocorrelation Function, ACF)图和偏自相关函数(Partial Autocorrelation Function, PACF)图。这些图显示了明显的季节性模式,表明需要引入季节性参数。ACF和PACF图提供了初步的模型阶数(p, d, q, P, D, Q)选择线索。基于此,研究人员构建了多达30个不同参数组合的SARIMA模型进行尝试和比较。

4. 模型估计与筛选: 使用计量经济学软件EViews对候选模型进行参数估计。为了从众多候选模型中选出最优模型,研究采用了赤池信息准则(Akaike Information Criterion, AIC)和贝叶斯信息准则(Bayesian Information Criterion, BIC)作为主要评判标准。通常,AIC和BIC值最小的模型被认为是最优的。通过比较,初步筛选出7个表现较好的SARIMA模型。

5. 模型诊断与样本内拟合评估: 对筛选出的模型进行拟合优度检验。除了AIC和BIC,还计算了样本内预测的误差指标,包括平均绝对误差(Mean Absolute Error, MAE)、均方根误差(Root Mean Square Error, RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)。这些指标用于评估模型对历史数据的拟合精度。在样本内评估中,SARIMA (1,1,2)(1,1,2)12 模型在RMSE和MAPE上表现最佳,在MAE上排名第二。

6. 样本外预测与稳健性检验: 一个优秀的预测模型不仅要在历史数据上拟合良好,更要能在未知数据上做出准确预测。因此,研究使用选出的最优模型对2007年至2019年的月度死亡人数进行“样本外”预测,并同样计算MAE、RMSE和MAPE。结果显示,SARIMA (1,1,2)(1,1,2)12 模型在样本外预测的三个误差指标上均优于其他候选模型,证明了其预测的稳健性。

7. 模型应用与效果评估: 确定最优模型为SARIMA (1,1,2)(1,1,2)12后,研究人员利用该模型计算出2001年至2019年期间,每次“Ops Bersepadu”计划执行所在月份(主要是农历新年和开斋节期间)的交通死亡人数预测值。然后将这些预测值与实际观测值进行对比,计算差异的绝对值和百分比。通过比较预测值(代表假设没有特殊干预下,基于历史趋势的“预期”死亡人数)与实际值,来评估“Ops Bersepadu”计划的实际效果。如果实际值显著低于预测值,可能表明计划有效;反之,则可能表明效果有限或情况恶化。

三、 主要研究结果

  1. 数据描述性结果:在1980年至2019年期间,马来西亚共记录了204,989起道路交通死亡事故。“Ops前”阶段(1980-2000年)月平均死亡人数为323人,“Ops后”阶段(2001-2019年)月平均死亡人数上升至542人,最高单月死亡人数达728人(相当于每天24人死亡)。数据显示,八月通常是死亡人数最高的月份,这与开斋节、学校假期和国庆日期间的大量城际旅行有关。
  2. 最优模型确立:经过系统性的建模、比较和验证,研究确定 SARIMA (1,1,2)(1,1,2)12 为预测马来西亚月度交通死亡人数的最佳模型。该模型在样本内拟合和样本外预测中均表现出最小的误差(MAE: 37.769, RMSE: 48.496, MAPE: 0.0692),且预测曲线与实际观测值曲线吻合度较高。
  3. “Ops Bersepadu”计划效果评估:通过对比2001年至2019年期间40次“Ops Bersepadu”行动期间的实际死亡人数与SARIMA模型的预测值,研究发现了一个值得警惕的现象:在40次行动中,有22次(超过一半)的实际死亡人数高于模型预测值。差异幅度从0.4%到24.7%不等。例如,在2015年7月的行动中,实际死亡人数(705人)比预测值(530.6人)高出24.7%,被警方称为自1994年以来最糟糕的一次行动。2011年8-9月(开斋节)记录了所有节日期间最高的死亡人数(1309人)。这表明,尽管实施了综合执法行动,但在多数节日期间,实际交通死亡风险仍然超过了基于历史趋势的预期水平。
  4. 季节性模式确认:模型成功捕捉到了马来西亚交通死亡事故明显的季节性波动,高峰通常出现在1月、2月、7月、8月、11月和12月,这与主要的节日和假期周期高度吻合。

四、 研究结论与价值

本研究的主要结论是,SARIMA (1,1,2)(1,1,2)12模型能够有效地拟合和预测马来西亚月度道路交通死亡人数的季节性变化趋势。这为马来西亚的交通安全管理部门提供了一个有力的定量分析工具。

研究的科学价值在于,它首次将SARIMA模型系统性地应用于马来西亚月度交通死亡数据的建模,验证了该模型在此类具有强季节性特征的发展中国家交通安全数据上的适用性和预测能力,丰富了该领域的案例研究。

其应用价值尤为突出: * 预测与规划工具:该模型可以帮助交通管理、警务和卫生部门提前预测高风险时段(节日期间)的交通事故死亡规模,从而进行更科学的资源规划和部署。 * 政策效果评估:研究通过对比预测值与实际值,为评估“Ops Bersepadu”等大型交通安全干预措施的效果提供了一种客观、量化的方法。结果表明,现有的干预措施在降低节日期间死亡人数方面效果“好坏参半”(mixed results),甚至在一些年份未能遏制死亡人数超过历史趋势预期。 * 决策支持:研究结果向政策制定者发出了明确信号:需要重新评估现有“Ops Bersepadu”计划的方法和策略。仅仅依靠节日期间加强执法可能不足以应对因车辆保有量增长、出行里程增加以及驾驶员行为等复杂因素带来的挑战。决策者应考虑采取更全面、更根本的干预措施。

五、 研究亮点

  1. 方法创新性:这是首次针对马来西亚月度道路交通死亡数据建立SARIMA预测模型的研究。此前的研究多基于年度数据,而月度模型能更精细地捕捉季节性规律,对于短期资源调配更具指导意义。
  2. 评估视角新颖:研究没有简单地描述死亡数字的升降,而是创造性地利用模型预测值作为“反事实”基线,来衡量实际干预措施(Ops Bersepadu)的“净效果”。这种方法比单纯比较不同年份同期数据更能排除长期趋势和季节性本身的影响,使评估更为严谨。
  3. 明确的政策启示:研究得出了具有挑战性和紧迫性的结论:超过一半的节日执法行动期间,实际死亡人数高于预测基线。这一发现直接指向了现有政策可能存在的不足,推动了关于如何改进节日交通安全管理的深入讨论。
  4. 完整的方法论展示:研究完整呈现了从数据准备、平稳性检验、模型识别与定阶、参数估计、模型筛选(AIC/BIC)、到样本内外验证的完整时间序列建模流程,具有很好的方法学参考价值。

六、 其他有价值内容

研究在结论部分也坦诚指出了自身的局限性并提出了未来研究方向: * 摩托车事故占马来西亚总交通死亡人数的60%,未来可以专门针对摩托车死亡数据建立预测模型。 * 建议探索经济因素、其他社会经济因素、车辆数据、出行暴露数据与交通死亡趋势之间的关系。 * 可以尝试将本研究建立的SARIMA (1,1,2)(1,1,2)12模型应用于马来西亚各州一级的数据预测,以便地方政府能更精准地分配资源,解决各自辖区内的道路安全问题。

这项研究不仅为马来西亚提供了一种有效的交通死亡预测工具,更重要的是,它通过科学的评估,揭示了当前节日交通安全管理面临的严峻挑战,为政策优化和资源高效利用提供了关键的数据支持和决策依据。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com