这篇文档属于类型a(单篇原创研究报告),以下是详细的学术报告内容:
本研究由江泽涛(桂林电子科技大学广西图像图形与智能处理重点实验室)、肖芸(通信作者)、张少钦(南昌航空大学)、朱玲红(南昌航空大学)、何玉婷和翟丰硕(桂林电子科技大学)共同完成,发表于《计算机辅助设计与图形学学报》(*Journal of Computer-Aided Design & Computer Graphics*)2023年3月第35卷第3期。研究得到国家自然科学基金(62172118、61876049)、广西自然科学基金重点项目(2021GXNSFDA196002)等多项资助支持。
研究领域:本研究属于计算机视觉中的低照度目标检测(low-illumination object detection)领域,聚焦于解决低光照环境下图像亮度低、噪声多、细节丢失导致的检测精度下降问题。
研究动机:现有通用目标检测方法(如YOLO、Faster R-CNN)在标准光照条件下表现良好,但在低照度场景(如夜间监控、无人机夜间作业)中性能显著下降。因此,亟需一种专用于低照度环境的检测方法。
技术背景:
1. 目标检测框架:主流方法分为单阶段(如YOLO系列)和双阶段(如Faster R-CNN)检测器,本研究基于单阶段YOLOv4改进。
2. 低照度图像特性:图像信噪比低、动态范围窄,传统增强方法易引入伪影。
3. 注意力机制:通过加权特征响应(如CBAM、SENet)可提升模型对关键信息的捕捉能力。
研究目标:提出Dark-YOLO方法,通过增强特征表征、多尺度特征融合及定位精度优化,提升低照度目标检测性能。
Dark-YOLO基于YOLOv4改进,包含以下核心模块:
- 骨干网络:采用CSPDarknet-53提取多尺度特征。
- 路径聚合增强模块(PAEM):结合空洞空间金字塔池化(ASPP)与加权特征融合(WFF),增强特征表征能力。
- 金字塔平衡注意力模块(PBAM):通过多尺度特征捕获(MSFCM)与平衡注意力机制(BAM)生成判别性特征。
- 预测交并比(IoU)分支:改进检测头,通过预测IoU值提升定位精度。
(1)PAEM模块
- ASPP分支:使用空洞率(dilation rate)为1、3、5的空洞卷积并行提取多尺度上下文特征,辅以平均池化分支。
- WFF融合:通过1×1卷积生成注意力权重,加权融合自顶向下与自底向上路径的特征。
(2)PBAM模块
- MSFCM:采用1×1、3×3、5×5、7×7深度可分离卷积提取多尺度特征。
- 平衡注意力:并联通道注意力(CAM)与空间注意力(SAM),分别通过全局平均池化和最大池化生成权重,结合跳跃连接抑制噪声。
(3)预测IoU分支
- 在检测头中新增IoU预测分支,通过交叉熵损失训练,将预测IoU值与分类得分、目标性得分加权(α=0.4)作为最终置信度。
消融实验:
对比实验:
可视化分析:
科学价值:
1. 提出PAEM与PBAM模块,解决了低照度图像特征表征弱、噪声干扰大的问题。
2. 引入预测IoU分支,首次将定位精度直接纳入置信度计算,提升检测可靠性。
应用价值:
可直接应用于夜间监控、自动驾驶、军事侦察等低照度场景,为实际工程问题提供高效解决方案。
局限与展望:
当前模型计算量较大,未来需研究轻量化设计(如模型剪枝、知识蒸馏)以进一步提升速度。