作者及机构
本研究的通讯作者为浙江大学航空航天学院的Zhe-Ming Lu(IEEE高级会员),第一作者Zixuan Chen与共同第一作者Zewei He均来自同一机构。该研究发表于2024年的IEEE Transactions on Image Processing(第33卷),DOI编号10.1109/TIP.2024.3354108,并获得中国国家自然科学基金(52305590)、国家重点研发计划(2020AAA0140004)等多项资助。
研究领域与动机
单幅图像去雾(single image dehazing)是低层视觉中的经典病态问题,旨在从雾霾污染的观测图像中恢复清晰场景。尽管基于深度学习的去雾方法(如FFA-Net、AECR-Net)通过增加卷积网络的深度或宽度提升性能,但传统卷积神经网络(CNN)在特征表达能力和计算效率上仍存在局限:
1. 普通卷积(vanilla convolution)的局限性:传统卷积倾向于强调低频信息(如光照和颜色分布),而忽略高频细节(如边缘和纹理),导致去雾结果模糊;
2. 雾霾非均匀性(haze non-uniformity):现有方法多关注图像层面的雾霾分布差异,而忽视特征通道间的雾霾编码差异。
研究目标
团队提出DEA-Net(Detail-Enhanced Attention Network),通过细节增强卷积(DEConv)和内容引导注意力(CGA)模块,实现高效的高质量去雾,同时保持轻量化设计(仅3.653M参数)。
设计原理
DEConv由5个并行卷积层构成:1个普通卷积(VC)和4种差异卷积(Difference Convolution, DC),包括中心差分卷积(CDC)、角度差分卷积(ADC)、水平差分卷积(HDC)和垂直差分卷积(VDC)。差异卷积通过计算像素对的梯度差异(如HDC模拟Sobel算子),显式编码先验信息(如边缘增强)。
重参数化技术(re-parameterization)
训练阶段:5个卷积核独立更新参数;
推理阶段:通过线性叠加将5个卷积核合并为单一标准卷积核(公式1),使DEConv与普通卷积的参数量和计算成本一致,但特征提取能力显著提升。
实验验证
在SOTS-Indoor数据集上,替换普通卷积为DEConv的模型(model_fab_d)比基线(base_fab)PSNR提升0.6 dB(表I),特征可视化显示DEConv输出的边缘纹理更清晰(图8)。
两阶段生成机制
1. 粗粒度SIM生成:结合通道注意力(SE模块)和空间注意力(CBAM模块)生成初始空间重要性图(Spatial Importance Map, SIM);
2. 细粒度SIM优化:通过通道混洗(channel shuffle)和分组卷积,利用输入特征逐通道优化SIM,最终得到通道专属的权重图(公式4)。
优势
- 解决特征层面的雾霾非均匀性;
- 在SOTS-Indoor数据集上,CGA使PSNR进一步提升1.5 dB(表IV),且生成的SIM能更精准定位雾霾区域(图9)。
针对编码器-解码器架构中浅层与深层特征的感受野失配问题,提出基于CGA的自适应融合策略:
1. 使用CGA计算空间权重;
2. 加权融合浅层细节特征(flow)和深层语义特征(fhigh)(公式5)。
该方案比普通加法或拼接融合PSNR提升0.1 dB以上(表V)。
科学价值
1. 首次将差异卷积引入去雾领域,通过先验编码增强高频细节恢复;
2. 提出通道专属的注意力机制(CGA),解决特征级雾霾非均匀性问题;
3. 重参数化技术在去雾任务中的首次应用,实现性能与效率的平衡。
应用价值
DEA-Net可作为高级视觉任务(如目标检测)的预处理模块,其轻量化设计适合部署在移动设备。
局限与展望
当前模型在真实场景(非合成数据)中存在域偏移问题,未来计划结合量化压缩技术进一步优化效率。
(注:文中图表及参考文献详见原论文)