分享自:

基于双域引导的实时低光照图像增强网络在超高清交通监控中的应用

期刊:IEEE

基于双域引导的实时低光照图像增强网络在超高清交通监控中的应用研究

作者及机构
本研究的核心作者团队来自武汉理工大学导航学院及海事技术与安全国家重点实验室(Jingxiang Qu, Ryan Wen Liu, Yuan Gao, Yu Guo)以及中国科学院自动化研究所复杂系统管理与控制国家重点实验室(Fenghua Zhu, Fei-Yue Wang)。该研究以论文形式发表于IEEE旗下期刊,标题为《Double Domain Guided Real-Time Low-Light Image Enhancement for Ultra-High-Definition Transportation Surveillance》。

学术背景

研究领域与动机
该研究属于智能交通系统(Intelligent Transportation System, ITS)中的计算机视觉领域,聚焦于低光照条件下超高清(Ultra-High-Definition, UHD)图像的实时增强技术。交通监控系统在夜间或弱光环境中捕获的图像常存在可见性差、噪声干扰和边缘模糊等问题,直接影响车辆检测、行人识别等高层次视觉任务的准确性。传统方法(如直方图均衡化HE)难以兼顾全局对比度提升与局部噪声抑制,而现有深度学习模型在计算效率上难以满足UHD视频的实时处理需求(30帧/秒以上)。

研究目标
团队提出双域引导网络(DDNet),通过同时优化颜色域和梯度域特征,实现低光照图像的高效增强,并满足以下需求:
1. 有效性:提升亮度、抑制噪声,保留边缘细节;
2. 实时性:支持4K分辨率(3840×2160像素)图像的实时处理;
3. 实用性:增强结果可直接服务于交通监控中的目标检测与场景分割任务。

研究方法与流程

1. 网络架构设计

DDNet采用编码器-解码器结构,核心创新在于嵌入两个并行模块:
- 粗增强模块(Coarse Enhancement Module, CEM):负责颜色域恢复,通过自适应调整光照分布改善整体对比度。
- 基于LoG的梯度增强模块(Gradient Enhancement Module, GEM):利用拉普拉斯-高斯算子(Laplacian of Gaussian, LoG)提取边缘特征,增强模糊的纹理信息。

LoG算子设计
传统拉普拉斯算子对噪声敏感,团队改进为5×5的LoG卷积核(公式5),通过高斯平滑预处理抑制噪声干扰,其离散形式为:
k_log = [0,0,1,0,0; 0,1,2,1,0; 1,2,-16,2,1; 0,1,2,1,0; 0,0,1,0,0]

2. 自校准注意力模块(SCCAM)

为平衡计算效率与特征提取能力,编码器-解码器中引入自校准卷积注意力模块(Self-Calibrated Convolutions with Attention Module, SCCAM),包含:
- 上分支:空间注意力机制(Spatial Attention Module, SAM)定位重要特征区域;
- 下分支:标准卷积模块(Standard Convolution Module, SCM)通过层归一化(Layer Normalization)和参数化ReLU(PReLU)保留空间信息。
输出通过残差连接融合,公式为:
y_sccam = Conv1×1(y_upper; y_lower) + x_in

3. 损失函数

联合损失函数(公式11)包含三部分:
- 梯度一致性损失(L_lap):约束GEM输出的梯度图与真实值的L2距离;
- 粗增强损失(L_coarse):监督CEM的颜色恢复效果;
- 最终增强损失(L_final):基于结构相似性(SSIM)优化整体视觉质量。

实验结果与分析

1. 图像质量评估

在LOL、DICM等标准数据集上,DDNet的定量指标显著优于对比方法:
- PSNR:21.86(LOL测试集),比第二名MTRBNet(21.21)提高3.1%;
- NIQE:3.38(数值越低越好),表明增强结果更接近自然图像;
- 运行时间:4K图像处理仅需0.027秒(37 FPS),满足实时性需求(表VII)。

2. 交通场景验证

  • 目标检测:在ExDark数据集上,YOLOv5对DDNet增强图像的检测精度比原始图像提升42%;
  • 场景分割:基于DaFormer模型,ACDC数据集的平均交并比(mIoU)提高28%,尤其改善了对车牌、行人等小目标的识别(图11)。

结论与价值

科学价值
1. 双域协同机制:首次将颜色域与梯度域分解重构结合,解决了传统方法边缘模糊与噪声放大的矛盾;
2. 轻量化设计:SCCAM模块以少量参数实现多尺度特征提取,为UHD图像实时处理提供新范式。

应用价值
- 可直接部署于现有交通监控系统,提升夜间环境下车辆追踪、违章识别的准确率;
- 开源代码(GitHub仓库)支持工业级服务器(如Advantech Sky-6000)的快速集成。

研究亮点

  1. 创新性模块:GEM首次引入LoG算子指导边缘增强,相比传统Sobel滤波器噪声鲁棒性更强;
  2. 端到端效率:在同等硬件条件下,4K处理速度比LLFlow快16倍,且PSNR提升12.5%;
  3. 跨任务验证:通过检测与分割实验证实了增强结果对高层视觉任务的实际增益。

未来方向

作者指出需进一步优化:
- 减少对成对数据集的依赖,探索半监督训练策略;
- 通过模型剪枝(Pruning)进一步压缩参数量;
- 扩展至动态模糊场景的多任务联合增强。

(全文约2400字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com