分享自:

基于深度学习与边缘计算的垃圾分类方法

期刊:计算机与数字工程DOI:10.3969/j.issn.1672-9722.2023.09.032

基于深度学习与边缘计算的垃圾分类方法学术报告

作者及机构
本研究由曲阜师范大学计算机学院的吴琦、闫毕成、王晨晨、崔文旭、辛若腾及司广涛(通讯作者)共同完成,发表于《计算机与数字工程》(Computer & Digital Engineering)2023年第9期(总第407期)。研究得到山东省自然科学基金(编号:zr2020mf105)资助。

学术背景
垃圾分类是环境保护与资源循环利用的关键环节,但传统方法(如焚烧、填埋)存在环境破坏问题,而人工分类效率低下。计算机视觉技术虽在垃圾识别中有所应用,但传统算法(如SURF-RANSAC、SVM)对复杂图像适应性差,准确率有限。深度学习技术通过自动特征提取显著提升了分类精度,但现有研究(如VGG16、Mask Scoring RCNN)在多样本、多类别场景下准确率仍不足(最高约90%)。此外,算法部署多依赖云端,实时性差。为此,本研究提出结合残差网络(ResNet)与边缘计算的解决方案,旨在实现高精度、低延迟的嵌入式垃圾分类系统。

研究流程与方法
1. 模型设计(GarbageCNet)
- 基础架构:基于ResNet50预训练模型,保留其卷积层与下采样层用于特征提取,解决深层网络梯度消失问题。
- 优化改进
- 添加全局平均池化层(Global Average Pooling, GAP)减少参数量,保留空间信息。
- 引入Dropout层(随机失活率30%)提升模型鲁棒性。
- 末端采用Softmax输出概率分布,损失函数为交叉熵(公式2),优化器选用Adam。
- 迁移学习策略:冻结前30层参数,微调后续层,平衡训练效率与精度。

  1. 数据集与训练

    • 数据来源:Kaggle公开数据集(12类垃圾,含纸张、金属、电池等,共15,000张图像)。
    • 数据增强:随机亮度调整、翻转,提升泛化能力。
    • 训练配置:batch_size=24,epochs=30,划分训练集(60%)、验证集(20%)、测试集(20%)。
  2. 边缘计算部署

    • 硬件平台:树莓派(Raspberry Pi)搭载摄像头模块,实现图像采集与实时处理。
    • 部署流程:模型转换为轻量化格式,通过Python调用OpenCV进行图像预处理,输入GarbageCNet预测分类结果。

主要结果
1. 模型性能
- 准确率:测试集达96.33%,较VGG19基线模型提升4.06%(图3)。
- 效率:训练时间缩短20%,得益于残差结构的快速收敛特性。
- 分类细节
- 固定形状物体(如衣服、鞋子)F1分数超0.97(表2)。
- 复杂物体(如金属)因形态多变,准确率降至90%。
- 混淆矩阵(图4)显示,白色玻璃(white-glass)与绿色玻璃(green-glass)易混淆,需进一步优化特征提取。

  1. 边缘端验证
    • 树莓派实测分类延迟<0.5秒,满足实时性需求。
    • 100次重复测试中,电池、纸箱等类别平均准确率超95%。

结论与价值
1. 科学价值
- 验证了残差网络在复杂垃圾图像分类中的优越性,尤其针对多类别场景(12类)。
- 提出GAP与Dropout的组合策略,为轻量化模型设计提供新思路。

  1. 应用价值
    • 边缘计算部署方案降低对云服务的依赖,适合社区、工厂等分布式场景。
    • 高精度(96.33%)与低延迟特性推动智能垃圾分类设备落地。

研究亮点
1. 方法创新:首次将ResNet50与边缘计算结合,解决算法落地难题。
2. 性能突破:在公开数据集中达到当前最高分类精度(96.33%)。
3. 工程贡献:完整开源树莓派部署代码,促进技术推广。

局限与展望
模型参数量仍较大,未来可通过神经网络剪枝进一步压缩;金属类识别精度待提升,需引入注意力机制优化特征提取。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com