分享自:

基于无标记样本和改进深度信念网络的垃圾焚烧二恶英排放浓度软测量模型

期刊:Proceedings of the 39th Chinese Control Conference

基于无标记样本和改进深度信念网络的生活垃圾焚烧二噁英排放浓度软测量模型研究

作者及机构
本研究的核心作者包括Zihao Guo、Jian Tang、Junfei Qiao和Haijun He,均来自北京工业大学信息技术学院和北京市计算智能与智能系统重点实验室。研究成果发表于2020年7月27-29日在中国沈阳举办的第39届中国控制会议(Proceedings of the 39th Chinese Control Conference)论文集。

学术背景

研究领域与问题
该研究属于环境工程与人工智能交叉领域,聚焦城市生活垃圾焚烧(Municipal Solid Waste Incineration, MSWI)过程中产生的持久性有机污染物——二噁英(Dioxin, DXN)的实时监测难题。二噁英具有高毒性和生物累积性,其排放浓度检测传统依赖实验室离线分析(耗时数周至数月)或在线间接检测(需昂贵设备且模型可靠性不足)。

研究目标
针对现有检测方法的滞后性和高成本问题,提出一种基于改进深度信念网络(Deep Belief Network, DBN)的软测量模型,通过利用工业现场大量未被标记的过程数据(unlabeled samples),实现二噁英排放浓度的分钟级实时预测。

研究方法与流程

1. 模型架构设计

改进DBN的核心创新点包括:
- 预训练阶段:引入无标记样本增强模型对二噁英生成机制的学习能力。
- 受限玻尔兹曼机(RBM)改进:推导能量函数作为激活函数,提升特征提取效率。
- 微调阶段:采用Dropout算法随机失活神经元防止过拟合,结合自适应学习率误差反向传播(BP)算法优化权重迭代。

2. 数据准备与处理

  • 标记样本:来自北京某机械炉排焚烧厂的34组有效数据(2012-2018年),输入维度为18(涵盖焚烧温度、烟气成分等关键参数)。
  • 无标记样本:扩充训练集至71组样本,测试集保留17组。

3. 算法实现细节

(1)预训练阶段
- 采用对比散度(Contrastive Divergence, CD-k)算法快速训练RBM,通过Gibbs采样近似梯度:

 Δw_{ij} = ⟨v_i h_j⟩_0 - ⟨v_i h_j⟩_k 

其中⟨·⟩表示期望值,下标0和k分别代表初始样本和k次采样后的重构样本。

(2)微调阶段
- Dropout机制:随机屏蔽50%神经元,等效于插入Bernoulli分布层:
math y^l = r^l * y^l, \quad r^l \sim \text{Bernoulli}(p=0.5)
- 自适应学习率BP算法:根据误差变化动态调整学习率η:
math η(i+1) = \begin{cases} η(i) \cdot (1+ε), & \text{if } e(i) < e(i-1) \\ η(i) \cdot (1-ε), & \text{otherwise} \end{cases}
其中ε为缩放因子(0.0001~0.001)。

主要结果

1. 模型性能验证

  • 训练集预测(图7):RMSE低至0.03069,显著优于传统DBN(0.03834)。
  • 测试集表现(图9):改进DBN结合无标记样本的RMSE为0.1992,较传统方法提升17.32%。

2. 对比实验

表1显示四组实验的RMSE对比:
| 实验组 | 训练集RMSE | 测试集RMSE |
|——–|————|————|
| E1(传统DBN+小样本) | 0.03834 | 0.2409 |
| E4(改进DBN+无标记样本) | 0.04045 | 0.1992 |

关键发现
- 无标记样本使传统DBN预测精度提升1.96%,改进DBN提升15.78%。
- Dropout算法有效抑制过拟合(训练与测试误差差距缩小)。

研究结论与价值

科学价值

  1. 小样本高维建模方法:为解决工业过程中难测参数(如二噁英)的实时监测提供了新范式。
  2. 算法创新:改进DBN通过能量函数优化和自适应学习率,显著提升收敛速度和泛化能力。

应用价值

为垃圾焚烧厂的二噁英排放控制提供实时数据支持,助力实现《”十三五”全国城镇生活垃圾无害化处理设施建设规划》中二噁英达标排放的目标。

研究亮点

  1. 数据利用创新:首次系统整合工业现场无标记样本与稀缺标记样本。
  2. 算法融合:将Dropout策略引入DBN微调阶段,结合自适应学习率BP算法,突破局部最优限制。
  3. 工程实用性:模型计算延迟为秒级,可直接集成至焚烧厂DCS系统。

局限与展望

当前模型的随机性(如Dropout的随机失活)可能影响稳定性,未来需研究确定性正则化方法。此外,模型跨焚烧厂迁移能力有待验证。

参考文献
文中引用的关键文献包括Hinton的DBN原始论文(2006)、Riedmiller的自适应学习率研究(1994)等,为方法创新提供了理论支撑。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com