基于 dark-yolo 的低照度目标检测方法

分享自：
基于 dark-yolo 的低照度目标检测方法

期刊:journal of computer-aided design & computer graphicsDOI:10.3724/sp.j.1089.2023.19354
这篇文档属于类型a（单篇原创研究报告），以下是详细的学术报告内容：
作者及发表信息本研究由江泽涛（桂林电子科技大学广西图像图形与智能处理重点实验室）、肖芸（通信作者）、张少钦（南昌航空大学）、朱玲红（南昌航空大学）、何玉婷和翟丰硕（桂林电子科技大学）共同完成，发表于《计算机辅助设计与图形学学报》（*Journal of Computer-Aided Design & Computer Graphics*）2023年3月第35卷第3期。研究得到国家自然科学基金（62172118、61876049）、广西自然科学基金重点项目（2021GXNSFDA196002）等多项资助支持。
学术背景研究领域：本研究属于计算机视觉中的低照度目标检测（low-illumination object detection）领域，聚焦于解决低光照环境下图像亮度低、噪声多、细节丢失导致的检测精度下降问题。
研究动机：现有通用目标检测方法（如YOLO、Faster R-CNN）在标准光照条件下表现良好，但在低照度场景（如夜间监控、无人机夜间作业）中性能显著下降。因此，亟需一种专用于低照度环境的检测方法。
技术背景：
 1. 目标检测框架：主流方法分为单阶段（如YOLO系列）和双阶段（如Faster R-CNN）检测器，本研究基于单阶段YOLOv4改进。
 2. 低照度图像特性：图像信噪比低、动态范围窄，传统增强方法易引入伪影。
 3. 注意力机制：通过加权特征响应（如CBAM、SENet）可提升模型对关键信息的捕捉能力。
研究目标：提出Dark-YOLO方法，通过增强特征表征、多尺度特征融合及定位精度优化，提升低照度目标检测性能。
研究流程与方法1. 整体框架设计Dark-YOLO基于YOLOv4改进，包含以下核心模块：
 - 骨干网络：采用CSPDarknet-53提取多尺度特征。
 - 路径聚合增强模块（PAEM）：结合空洞空间金字塔池化（ASPP）与加权特征融合（WFF），增强特征表征能力。
 - 金字塔平衡注意力模块（PBAM）：通过多尺度特征捕获（MSFCM）与平衡注意力机制（BAM）生成判别性特征。
 - 预测交并比（IoU）分支：改进检测头，通过预测IoU值提升定位精度。
2. 关键技术细节（1）PAEM模块
 - ASPP分支：使用空洞率（dilation rate）为1、3、5的空洞卷积并行提取多尺度上下文特征，辅以平均池化分支。
 - WFF融合：通过1×1卷积生成注意力权重，加权融合自顶向下与自底向上路径的特征。
（2）PBAM模块
 - MSFCM：采用1×1、3×3、5×5、7×7深度可分离卷积提取多尺度特征。
 - 平衡注意力：并联通道注意力（CAM）与空间注意力（SAM），分别通过全局平均池化和最大池化生成权重，结合跳跃连接抑制噪声。
（3）预测IoU分支
 - 在检测头中新增IoU预测分支，通过交叉熵损失训练，将预测IoU值与分类得分、目标性得分加权（α=0.4）作为最终置信度。
3. 实验设计数据集：使用低照度专用数据集ExDark（7,363张图像，12类别），按8:2划分训练集与测试集。
 
训练策略：分两阶段训练（冻结骨干网络25轮+解冻微调25轮），初始学习率0.001，批量大小（batch size）优化为4。
 
评价指标：均值平均精度（mAP）、帧率（FPS），IoU阈值设为0.5。
 
主要结果消融实验：
PAEM使mAP提升1.22%（YOLOv4基线70.66%→71.88%）。
 
PBAM单独提升1.70%（72.36%），与PAEM联合提升2.80%（73.46%）。
 
预测IoU进一步将mAP提升至74.76%（+1.30%）。
 
对比实验：
Dark-YOLO在ExDark上mAP达74.76%，显著优于YOLOv4（70.66%）、YOLOv3（67.80%）及Faster R-CNN（63.52%）。
 
检测速度15.3 FPS，略低于YOLOv4（21.6 FPS），但满足实时性需求。
 
可视化分析：
在低照度、小目标及目标重叠场景中，Dark-YOLO漏检率更低，边界框定位更准确（如图10所示对比案例）。
 
结论与价值科学价值：
 1. 提出PAEM与PBAM模块，解决了低照度图像特征表征弱、噪声干扰大的问题。
 2. 引入预测IoU分支，首次将定位精度直接纳入置信度计算，提升检测可靠性。
应用价值：
 可直接应用于夜间监控、自动驾驶、军事侦察等低照度场景，为实际工程问题提供高效解决方案。
局限与展望：
 当前模型计算量较大，未来需研究轻量化设计（如模型剪枝、知识蒸馏）以进一步提升速度。
研究亮点创新模块设计：PAEM与PBAM结合多尺度特征与注意力机制，显著提升低照度特征判别力。
 
端到端优化：首次将IoU预测嵌入单阶段检测器，实现分类与定位的联合优化。
 
数据集验证：在专业低照度数据集ExDark上取得SOTA性能，具有强可复现性。
 
其他有价值内容实验部分详细对比了不同注意力机制（如CBAM、SENet）的效果，验证了PBAM的优越性（表3）。
 
开源代码与训练细节可为后续研究提供基准参考。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问