分享自:

基于SNW YOLOv8的块煤实时监测方法研究

期刊:Measurement Science and TechnologyDOI:10.1088/1361-6501/ad5de1

类型a:这篇文档报告了一项原创研究,因此属于类型a。


主要作者和研究机构
本研究的主要作者包括吴立刚(Ligang Wu)、陈乐(Le Chen)、李家龙(Jialong Li)、石建华(Jianhua Shi)和万加福(Jiafu Wan),他们分别来自山西大同大学机械与电气工程学院、山西大同大学煤炭工程学院以及华南理工大学机械与汽车工程学院。该研究发表于2024年的《测量科学与技术》(Measurement Science and Technology)期刊上。


学术背景
本研究的领域是计算机视觉与深度学习在工业应用中的结合,特别是针对煤矿运输过程中块煤(lump coal)的实时监测问题。块煤由于体积大、质量重,在煤矿输送带运行中可能造成堵塞甚至损坏设备,从而带来安全隐患和经济损失。传统方法依赖人工识别,效率低下且易受地下工作环境(如低光照和高粉尘)干扰。因此,开发一种低成本、高效且智能化的块煤检测方法成为迫切需求。

本研究旨在通过改进YOLOv8(You Only Look Once version 8)算法,提出一种名为SNW YOLOv8的新模型,以实现对块煤的高精度实时监测。具体目标包括提高模型对低分辨率小目标的检测能力、优化模型的轻量化设计以便于嵌入式部署,以及提升模型在复杂环境下的鲁棒性和泛化能力。


研究流程
本研究的工作流程分为以下几个步骤:

  1. 数据收集与预处理
    研究团队从中国山西省某煤矿采集了用于训练和测试的数据集,使用KBA127A防爆摄像机拍摄图像,分辨率为640×640 DPI。数据集中包含800张训练图像、200张验证图像和200张测试图像。为减少运动模糊和提升图像对比度,采用自适应直方图均衡化(Adaptive Histogram Equalization, AHE)对图像进行预处理。标注工作由专业人员完成,标注信息保存为YOLO格式。

  2. 模型架构设计
    SNW YOLOv8模型基于YOLOv8进行改进,包含四个主要部分:输入层、特征提取网络、特征融合网络和输出层。

    • 特征提取网络:引入了Space-to-Depth Convolution(SPD-Conv)模块,用于提取低分辨率小目标的特征。SPD-Conv通过将特征图划分为多个子特征图并沿通道维度拼接,减少了信息损失。
    • 注意力机制:结合Normalization-based Attention Module(NAM),通过批归一化(Batch Normalization, BN)调整权重稀疏性,增强模型对关键特征的关注。
    • 损失函数优化:采用Wise-IoU v3(WIoU v3)损失函数,通过动态聚焦机制减少距离和宽高比惩罚项的干扰,同时提升定位性能。
  3. 实验设置
    实验在Windows 10系统上进行,硬件配置包括Intel Core i9-10900K CPU和NVIDIA GeForce RTX 4090 GPU。深度学习框架为PyTorch 2.0.1,编程语言为Python 3.9。超参数经过优化,包括学习率设为0.1、批量大小为16、训练轮数为500等。

  4. 模型评估
    使用多种指标对模型性能进行评估,包括精确率(Precision, P)、召回率(Recall, R)、平均精度均值(mAP@0.5 和 mAP@0.5:0.95)、F1分数以及每秒帧率(Frames Per Second, FPS)。此外,还进行了消融实验(Ablation Study)以验证各模块的有效性,并与其他主流目标检测算法(如YOLOv3、YOLOv5、YOLOv7等)进行对比分析。


主要结果
1. SNW YOLOv8的性能提升
实验结果显示,SNW YOLOv8在精确率和召回率方面分别比原始YOLOv8提升了15.82%和11.71%,达到69.83%和63.13%。mAP@0.5和mAP@0.5:0.95分别提高了17.77%和30.43%。此外,SNW YOLOv8的实时检测速度达到192.93 FPS,比YOLOv8快39.10%。

  1. 消融实验结果
    消融实验表明,SPD-Conv显著提升了模型对小目标的召回率,NAM机制使精确率提高了5.83%,而WIoU v3则全面提升了模型性能。综合使用这三个模块后,模型的谐波均值(Harmonic Mean, F1)达到0.63,为所有对比模型中的最高值。

  2. 与其他注意力机制的比较
    在与SE、CBAM、CA、ECA和LSK等注意力机制的对比中,NAM表现出更高的检测速度(192.93 FPS)和更高的精确率(分别高出2.80%至12.34%)。此外,NAM的召回率也优于其他机制,进一步证明其在块煤检测中的优越性。

  3. 轻量化优势
    SNW YOLOv8的参数量仅为6.04百万,模型体积压缩至12.3 MB,远低于其他主流模型(如YOLOv5的92.7 MB)。这使其更适合在资源受限的矿井环境中部署。


结论与意义
本研究成功开发了一种改进的SNW YOLOv8模型,用于煤矿输送带上块煤的实时监测。该模型在检测精度、实时性和轻量化设计方面均表现出色,具有重要的科学价值和应用前景。

科学价值体现在三个方面:
1. 提出了SPD-Conv模块,有效解决了低分辨率小目标检测难题;
2. 引入了NAM机制,增强了模型对关键特征的提取能力;
3. 优化了WIoU v3损失函数,显著提升了模型的定位性能。

应用价值在于,SNW YOLOv8能够快速准确地检测块煤,从而预防输送带故障,降低煤矿生产中的安全风险和经济损失。此外,该模型的轻量化设计使其易于嵌入智能监控系统,为煤矿智能化提供了新思路。


研究亮点
1. 创新性地结合SPD-Conv、NAM和WIoU v3模块,显著提升了模型性能;
2. 首次在块煤检测任务中实现了高精度(69.83%)和高速度(192.93 FPS)的平衡;
3. 成功将模型参数量压缩至6.04百万,体积仅为12.3 MB,适合嵌入式部署;
4. 通过消融实验验证了各模块的独立贡献,为后续研究提供了参考依据。


其他有价值内容
研究团队还将SNW YOLOv8集成到一个基于PyQt5和OpenCV的实时监控系统中,展示了其在实际应用中的可行性。未来研究计划包括改进运动模糊图像的去模糊算法,以及进一步优化模型在复杂环境中的鲁棒性和精度。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com