基于深度学习与边缘计算的垃圾分类方法学术报告
作者及机构
本研究由曲阜师范大学计算机学院的吴琦、闫毕成、王晨晨、崔文旭、辛若腾及司广涛(通讯作者)共同完成,发表于《计算机与数字工程》(Computer & Digital Engineering)2023年第9期(总第407期)。研究得到山东省自然科学基金(编号:zr2020mf105)资助。
学术背景
垃圾分类是环境保护与资源循环利用的关键环节,但传统方法(如焚烧、填埋)存在环境破坏问题,而人工分类效率低下。计算机视觉技术虽在垃圾识别中有所应用,但传统算法(如SURF-RANSAC、SVM)对复杂图像适应性差,准确率有限。深度学习技术通过自动特征提取显著提升了分类精度,但现有研究(如VGG16、Mask Scoring RCNN)在多样本、多类别场景下准确率仍不足(最高约90%)。此外,算法部署多依赖云端,实时性差。为此,本研究提出结合残差网络(ResNet)与边缘计算的解决方案,旨在实现高精度、低延迟的嵌入式垃圾分类系统。
研究流程与方法
1. 模型设计(GarbageCNet)
- 基础架构:基于ResNet50预训练模型,保留其卷积层与下采样层用于特征提取,解决深层网络梯度消失问题。
- 优化改进:
- 添加全局平均池化层(Global Average Pooling, GAP)减少参数量,保留空间信息。
- 引入Dropout层(随机失活率30%)提升模型鲁棒性。
- 末端采用Softmax输出概率分布,损失函数为交叉熵(公式2),优化器选用Adam。
- 迁移学习策略:冻结前30层参数,微调后续层,平衡训练效率与精度。
数据集与训练
边缘计算部署
主要结果
1. 模型性能
- 准确率:测试集达96.33%,较VGG19基线模型提升4.06%(图3)。
- 效率:训练时间缩短20%,得益于残差结构的快速收敛特性。
- 分类细节:
- 固定形状物体(如衣服、鞋子)F1分数超0.97(表2)。
- 复杂物体(如金属)因形态多变,准确率降至90%。
- 混淆矩阵(图4)显示,白色玻璃(white-glass)与绿色玻璃(green-glass)易混淆,需进一步优化特征提取。
结论与价值
1. 科学价值:
- 验证了残差网络在复杂垃圾图像分类中的优越性,尤其针对多类别场景(12类)。
- 提出GAP与Dropout的组合策略,为轻量化模型设计提供新思路。
研究亮点
1. 方法创新:首次将ResNet50与边缘计算结合,解决算法落地难题。
2. 性能突破:在公开数据集中达到当前最高分类精度(96.33%)。
3. 工程贡献:完整开源树莓派部署代码,促进技术推广。
局限与展望
模型参数量仍较大,未来可通过神经网络剪枝进一步压缩;金属类识别精度待提升,需引入注意力机制优化特征提取。