作者及机构
本研究的核心作者包括Zihao Guo、Jian Tang、Junfei Qiao和Haijun He,均来自北京工业大学信息技术学院和北京市计算智能与智能系统重点实验室。研究成果发表于2020年7月27-29日在中国沈阳举办的第39届中国控制会议(Proceedings of the 39th Chinese Control Conference)论文集。
研究领域与问题
该研究属于环境工程与人工智能交叉领域,聚焦城市生活垃圾焚烧(Municipal Solid Waste Incineration, MSWI)过程中产生的持久性有机污染物——二噁英(Dioxin, DXN)的实时监测难题。二噁英具有高毒性和生物累积性,其排放浓度检测传统依赖实验室离线分析(耗时数周至数月)或在线间接检测(需昂贵设备且模型可靠性不足)。
研究目标
针对现有检测方法的滞后性和高成本问题,提出一种基于改进深度信念网络(Deep Belief Network, DBN)的软测量模型,通过利用工业现场大量未被标记的过程数据(unlabeled samples),实现二噁英排放浓度的分钟级实时预测。
改进DBN的核心创新点包括:
- 预训练阶段:引入无标记样本增强模型对二噁英生成机制的学习能力。
- 受限玻尔兹曼机(RBM)改进:推导能量函数作为激活函数,提升特征提取效率。
- 微调阶段:采用Dropout算法随机失活神经元防止过拟合,结合自适应学习率误差反向传播(BP)算法优化权重迭代。
(1)预训练阶段
- 采用对比散度(Contrastive Divergence, CD-k)算法快速训练RBM,通过Gibbs采样近似梯度:
Δw_{ij} = ⟨v_i h_j⟩_0 - ⟨v_i h_j⟩_k 其中⟨·⟩表示期望值,下标0和k分别代表初始样本和k次采样后的重构样本。
(2)微调阶段
- Dropout机制:随机屏蔽50%神经元,等效于插入Bernoulli分布层:
math y^l = r^l * y^l, \quad r^l \sim \text{Bernoulli}(p=0.5)
- 自适应学习率BP算法:根据误差变化动态调整学习率η:
math η(i+1) = \begin{cases} η(i) \cdot (1+ε), & \text{if } e(i) < e(i-1) \\ η(i) \cdot (1-ε), & \text{otherwise} \end{cases}
其中ε为缩放因子(0.0001~0.001)。
表1显示四组实验的RMSE对比:
| 实验组 | 训练集RMSE | 测试集RMSE |
|——–|————|————|
| E1(传统DBN+小样本) | 0.03834 | 0.2409 |
| E4(改进DBN+无标记样本) | 0.04045 | 0.1992 |
关键发现:
- 无标记样本使传统DBN预测精度提升1.96%,改进DBN提升15.78%。
- Dropout算法有效抑制过拟合(训练与测试误差差距缩小)。
为垃圾焚烧厂的二噁英排放控制提供实时数据支持,助力实现《”十三五”全国城镇生活垃圾无害化处理设施建设规划》中二噁英达标排放的目标。
当前模型的随机性(如Dropout的随机失活)可能影响稳定性,未来需研究确定性正则化方法。此外,模型跨焚烧厂迁移能力有待验证。
参考文献
文中引用的关键文献包括Hinton的DBN原始论文(2006)、Riedmiller的自适应学习率研究(1994)等,为方法创新提供了理论支撑。