本文的研究团队由北京工业大学信息学部的汤健教授领衔,团队成员包括王子、夏恒、王天峥和乔俊飞,他们来自北京工业大学信息学部和智慧环保北京实验室。这项研究发表在《北京工业大学学报》(Journal of Beijing University of Technology),网络首发日期为2025年6月3日,收稿日期为2023年12月9日。
本研究属于环境科学与人工智能交叉领域,聚焦于城市固废焚烧(Municipal Solid Waste Incineration, MSWI)过程中二氧化碳(CO₂)排放浓度的多步预测问题。随着城市化进程加速,全球城市固废年产量预计到2050年将达到34亿吨,而焚烧作为一种高效处理方式,其占比已超过50%。然而,MSWI过程排放的CO₂对实现“双碳”目标(2030年碳达峰、2060年碳中和)构成严峻挑战。目前,针对MSWI过程CO₂排放的预测研究尚未见报道,而传统预测方法(如ARIMA或LSTM单一模型)难以同时捕捉数据中的线性和非线性特征。因此,本研究提出了一种结合差分整合移动平均自回归模型(ARIMA)和长短期记忆网络(LSTM)的混合模型(ARIMA-LSTM),旨在提升多步预测精度,为焚烧过程的智能优化控制提供支持。
研究采用北京某MSWI电厂每分钟的CO₂浓度数据(共720组,每组194个变量),通过Z-score法剔除28条异常值,保留692条有效数据。首先对数据进行平稳性检验(Augmented Dickey-Fuller Test, ADF),发现原始序列非平稳(检验统计量-0.4343 > 临界值-1.9413),经一阶差分后转为平稳(统计量-27.3156 < 临界值)。基于贝叶斯信息准则(BIC)确定ARIMA参数为(p=1, d=1, q=2),并验证残差符合正态分布(QQ图)且无自相关性(Durbin-Watson检验值=2.0122)。ARIMA模型通过单步滚动预测策略生成初始预测值及残差序列。
以ARIMA的预测残差作为LSTM的输入,采用多输入多输出的迭代多步预测策略。LSTM网络结构包含300个隐藏单元,训练轮次200次,学习率0.0014,Dropout系数0.2。其核心通过遗忘门、输入门和输出门调控信息流,利用反向传播算法更新权重(如梯度计算中fh_mw的更新公式见原文式61)。补偿模型的目标是捕捉ARIMA未能拟合的非线性特征。
将ARIMA主模型和LSTM补偿模型的预测值相加,得到最终的多步预测结果。为验证有效性,研究对比了单一LSTM模型和ARIMA-LSTM并行模型(输出取平均),采用10次重复实验的均值作为评价指标,包括平均绝对误差(MAE)、均方根误差(RMSE)和决定系数(R²)。
本研究首次将ARIMA-LSTM混合模型应用于MSWI过程CO₂排放预测,其科学价值体现在:
1. 方法论创新:通过“线性主模型+非线性补偿”框架,解决了传统模型对复杂时间序列拟合不足的问题,为工业过程预测提供了新思路。
2. 应用价值:精准的CO₂浓度预测可实时监测燃烧效率(CE),优化焚烧工艺,助力“双碳”目标实现。例如,CE的计算依赖于CO和CO₂浓度(式1),模型预测结果可直接用于燃烧状态评估。
3. 技术推广性:模型框架可扩展至其他污染物(如NOx)的预测,推动固废处理智能化。
研究团队开发的超参数敏感性分析方法(图8)为工业数据建模提供了调参指导,尤其适用于小样本场景(如固废焚烧数据的高成本获取)。未来工作可结合焚烧机理(如反应器动力学)进一步增强模型的可解释性。
(注:文中公式和图表编号均引用原文,具体推导可参考原论文。)