基于深度学习与边缘计算的垃圾分类方法

分享自：
基于深度学习与边缘计算的垃圾分类方法

期刊:计算机与数字工程DOI:10.3969/j.issn.1672-9722.2023.09.032
基于深度学习与边缘计算的垃圾分类方法学术报告
作者及机构
 本研究由曲阜师范大学计算机学院的吴琦、闫毕成、王晨晨、崔文旭、辛若腾及司广涛（通讯作者）共同完成，发表于《计算机与数字工程》（Computer & Digital Engineering）2023年第9期（总第407期）。研究得到山东省自然科学基金（编号：zr2020mf105）资助。
学术背景
 垃圾分类是环境保护与资源循环利用的关键环节，但传统方法（如焚烧、填埋）存在环境破坏问题，而人工分类效率低下。计算机视觉技术虽在垃圾识别中有所应用，但传统算法（如SURF-RANSAC、SVM）对复杂图像适应性差，准确率有限。深度学习技术通过自动特征提取显著提升了分类精度，但现有研究（如VGG16、Mask Scoring RCNN）在多样本、多类别场景下准确率仍不足（最高约90%）。此外，算法部署多依赖云端，实时性差。为此，本研究提出结合残差网络（ResNet）与边缘计算的解决方案，旨在实现高精度、低延迟的嵌入式垃圾分类系统。
研究流程与方法
 1. 模型设计（GarbageCNet）
 - 基础架构：基于ResNet50预训练模型，保留其卷积层与下采样层用于特征提取，解决深层网络梯度消失问题。
 - 优化改进：
 - 添加全局平均池化层（Global Average Pooling, GAP）减少参数量，保留空间信息。
 - 引入Dropout层（随机失活率30%）提升模型鲁棒性。
 - 末端采用Softmax输出概率分布，损失函数为交叉熵（公式2），优化器选用Adam。
 - 迁移学习策略：冻结前30层参数，微调后续层，平衡训练效率与精度。
数据集与训练
数据来源：Kaggle公开数据集（12类垃圾，含纸张、金属、电池等，共15,000张图像）。
 
数据增强：随机亮度调整、翻转，提升泛化能力。
 
训练配置：batch_size=24，epochs=30，划分训练集（60%）、验证集（20%）、测试集（20%）。
 
边缘计算部署
硬件平台：树莓派（Raspberry Pi）搭载摄像头模块，实现图像采集与实时处理。
 
部署流程：模型转换为轻量化格式，通过Python调用OpenCV进行图像预处理，输入GarbageCNet预测分类结果。
 
主要结果
 1. 模型性能
 - 准确率：测试集达96.33%，较VGG19基线模型提升4.06%（图3）。
 - 效率：训练时间缩短20%，得益于残差结构的快速收敛特性。
 - 分类细节：
 - 固定形状物体（如衣服、鞋子）F1分数超0.97（表2）。
 - 复杂物体（如金属）因形态多变，准确率降至90%。
 - 混淆矩阵（图4）显示，白色玻璃（white-glass）与绿色玻璃（green-glass）易混淆，需进一步优化特征提取。
边缘端验证
 树莓派实测分类延迟<0.5秒，满足实时性需求。
 
100次重复测试中，电池、纸箱等类别平均准确率超95%。
 
结论与价值
 1. 科学价值：
 - 验证了残差网络在复杂垃圾图像分类中的优越性，尤其针对多类别场景（12类）。
 - 提出GAP与Dropout的组合策略，为轻量化模型设计提供新思路。
应用价值：
 边缘计算部署方案降低对云服务的依赖，适合社区、工厂等分布式场景。
 
高精度（96.33%）与低延迟特性推动智能垃圾分类设备落地。
 
研究亮点
 1. 方法创新：首次将ResNet50与边缘计算结合，解决算法落地难题。
 2. 性能突破：在公开数据集中达到当前最高分类精度（96.33%）。
 3. 工程贡献：完整开源树莓派部署代码，促进技术推广。
局限与展望
 模型参数量仍较大，未来可通过神经网络剪枝进一步压缩；金属类识别精度待提升，需引入注意力机制优化特征提取。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问