分享自:

基于CA-YOLOv8的输送带大块煤检测方法

期刊:计算机辅助设计与图形学学报DOI:10.3724/sp.j.1089.2023.00471

油亚鹏(北京化工大学机电工程学院)、马波(北京化工大学机电工程学院/高端压缩机及系统技术全国重点实验室/高端机械装备健康监控与自愈化北京市重点实验室)、赵乐和王鹏琪(北京化工大学机电工程学院)团队在《计算机辅助设计与图形学学报》(Journal of Computer-Aided Design & Computer Graphics)202*年第3*卷第*期发表题为《基于CA-YOLOv8的输送带大块煤检测方法》的研究论文。该研究针对煤矿输送带大块煤检测中因环境复杂、图像模糊导致的检测精度低、泛化性差等问题,提出了一种融合图像复原技术与改进YOLOv8算法的创新解决方案。

学术背景

在煤炭开采运输过程中,输送带上未充分破碎的大块煤可能引发堵塞、跑偏甚至设备撕裂等安全事故。传统检测方法依赖阈值分割或边缘特征提取,存在实时性差、鲁棒性不足的缺陷;基于深度学习的目标检测算法(如YOLO系列)虽在精度上有提升,但煤矿环境的煤尘干扰、光照不均及输送带高速运动导致的图像退化问题仍未得到有效解决。研究团队旨在开发一种兼顾高精度与强泛化能力的大块煤检测方法,为煤矿智能化监控提供技术支撑。

研究流程与方法

1. 图像复原预处理

研究对象:来自4条不同工况输送带的监控视频图像(数据集D1-D4,总计训练集2,798张,验证集575张)。
退化建模:建立包含灰度失真、运动模糊、几何畸变和噪声干扰的复合退化模型:
$$ g(x,y) = [f(x,y) \cdot h(x,y)] * l(x,y) + \eta(x,y) $$
复原流程
- Step1 去噪:采用双边滤波(参数:核尺寸5,空间标准差σ_d=2.5,色彩标准差σ_r=30)保留边缘信息。
- Step2 几何校正:基于透视变换(选取近摄像头区域4个顶点)矫正图像畸变。
- Step3 运动去模糊:针对匀速直线运动模糊(退化函数长度L=5-16像素),使用维纳滤波复原。
- Step4 亮度均衡:CLAHE算法(分块8×8,阈值系数2.0-3.0)提升对比度。
验证指标:Brenner梯度函数、Tenengrad函数和熵函数显示复原后图像清晰度提升显著(如D1数据集Tenengrad值从60,561增至229,025)。

2. CA-YOLOv8模型构建

改进策略
- 输入端优化:基于输送带实际宽度(映射为640像素)进行自适应缩放,统一煤块尺度特征。计算公式:
$$ H = 32 \times \lceil \frac{640 \cdot L}{W \cdot 32} \rceil $$
其中W为输送带宽度,L为估计长度。
- 网络结构改进
- 坐标注意力机制(CA, Coordinate Attention):嵌入Backbone与Neck之间,通过双向特征编码增强大块煤关键特征提取。
- 检测头精简:移除小目标检测层(保留20×20和40×40尺度检测头),聚焦大块煤特征。
训练参数:初始学习率0.01,动量0.937,批大小16,损失函数采用CIoU+DFL组合。

3. 实验验证

性能对比
- 相同环境测试:D1→D1任务中精确率95.6%、召回率89.0%,优于原YOLOv8(90.1%/88.4%)。
- 跨环境泛化:D1→D3任务精确率91.7%,较基线提升17.0%;召回率68.7%,提升15.3%。
消融实验
- 仅图像复原+输入端改进时,跨环境精确率提升至87.5%(D1→D2);
- 单独添加CA模块使D2→D3任务精确率达95.2%,但召回率降低至52.8%;
- 完整模型(CA+检测头精简)在D2→D4任务中达到84.6%精确率与72.8%召回率。

主要结果与结论

  1. 图像复原有效性:CLAHE亮度均衡使D3数据集熵值从5.28提升至5.30,解决了昏暗环境下的细节丢失问题。
  2. 模型创新性
    • CA机制通过空间方向特征聚合,使大块煤检测热力图响应更集中(如图11所示);
    • 现实尺寸缩放策略使不同场景下煤块物理尺寸保持一致,提升模型泛化能力。
  3. 工程价值:在煤矿实际监控中,该方法可实现对>15%输送带宽度的大块煤实时检测(3060 GPU单帧处理时间<50ms),为自动破碎系统提供可靠输入。

研究亮点

  1. 多模态融合:首次将图像复原技术与改进YOLOv8结合,形成”预处理-特征增强-尺度优化”的全流程解决方案。
  2. 领域适应性改进:针对煤矿场景设计的CA嵌入策略和检测头精简方案,较通用目标检测算法(如文献[9]的YOLOv5改进)在跨环境测试中精确率提升9.5%。
  3. 可扩展性:提出的现实尺寸缩放方法可为其他工业检测场景(如矿石分选、流水线质检)提供借鉴。

应用展望

未来研究可进一步优化CA模块的计算效率,并探索多光谱图像融合以提升低照度条件下的召回率。该方法已在中国某煤矿试点部署,预计可将大块煤漏检率从传统方法的12%降至5%以下。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com