基于照度图引导的低照度图像增强网络

分享自：
基于照度图引导的低照度图像增强网络

期刊:计算机辅助设计与图形学学报DOI:10.3724/sp.j.1089.2024.19779
基于照度图引导的低照度图像增强网络的学术研究报告作者及发表信息本研究的通讯作者为杨勇（1976—），博士，教授，博士生导师，CCF杰出会员，来自天津工业大学计算机科学与技术学院；第一作者为黄淑英（1977—），博士，教授，硕士生导师，CCF会员，来自天津工业大学软件学院；其他合作者包括黎为（1998—）、万伟国（1991—）和赖厚增（1995—），分别来自江西财经大学软件与物联网工程学院和天津工业大学。该研究发表于《Journal of Computer-Aided Design & Computer Graphics》（计算机辅助设计与图形学学报）2024年第1期（Vol.36, No.1）。
学术背景低照度图像增强是计算机视觉领域的重要研究方向，广泛应用于自动驾驶、视频监控、医学影像等领域。由于光照不均匀，低照度图像通常存在能见度差、对比度低、颜色失真等问题。现有的增强方法（如基于直方图均衡化、Retinex理论或深度学习的方法）往往存在过增强或欠增强现象，影响后续高级视觉任务（如目标检测）。
本研究的目标是提出一种基于照度图引导的低照度图像增强网络（Low-light Image Enhancement Network Guided by Illuminance Map），通过构建照度图（Illuminance Map）指导网络对不同亮度区域进行差异化增强，并结合数据增强策略和直方图损失函数（Histogram Loss Function），提升增强效果的自然性和鲁棒性。
研究流程与方法1. 照度引导图的构建研究团队首先提出了一种照度引导图生成方法，用于量化低照度图像不同区域的明暗程度。具体步骤如下：
 1. 将输入的低照度图像 ( L ) 的 RGB 通道归一化至 ([0,1]) 范围。
 2. 对每个像素点，取 R、G、B 三通道的最大值，并进行反色变换，得到照度图 ( G )：
 [ G = 1 - \max_{c \in {R,G,B}} L_c ] 该公式确保较暗区域在照度图中呈现较高亮度（即增强力度更大），而较亮区域则对应较低的增强力度。
2. 多尺度注意力 U-Net 网络结构研究团队设计了一种多尺度注意力 U-Net（Multi-scale Attention U-Net），其核心结构包括：
 - 编码器部分：包含 1 个卷积层和 4 个多尺度特征提取层，每层由卷积块和通道注意力残差模块（Channel Attention Residual Block, CARB）组成。
 - 解码器部分：与编码器对称，通过跳转连接（Skip Connection）复用浅层特征。
 - 通道注意力残差模块：通过全局平均池化（Global Average Pooling）和 1×1 卷积计算通道注意力权重，调整特征图的重要性。
网络的输入为低照度图像与照度图的拼接结果，输出为增强后的图像。
3. 数据增强策略为解决训练数据不足的问题，研究团队提出两种数据增强方法：
 1. 概率旋转增强（Probability Rotation Enhancement）：对训练图像随机应用 8 种旋转和翻转操作（如 90° 旋转、水平翻转等），增加样本多样性。
 2. 内循环增强（Inner-loop Enhancement）：在训练过程中，将第 3 和第 6 个训练周期生成的增强图像加入训练集，进一步提升数据多样性。
4. 损失函数设计研究团队提出了一种多元联合损失函数，包含以下三个部分：
 1. 均方误差损失（MSE Loss）：衡量增强图像与真实图像之间的像素差异。
 2. 边缘损失（Edge Loss）：通过拉普拉斯算子（Laplacian Operator）约束高频细节的恢复。
 3. 直方图损失（Histogram Loss）：基于直方图匹配（Histogram Matching）思想，确保增强图像的灰度分布接近真实图像。
最终损失函数为：
 [ L = \alpha L{\text{MSE}} + \beta L{\text{Edge}} + \lambda L_{\text{Hist}} ] 其中，权重系数 (\alpha=5)、(\beta=3)、(\lambda=2.5 \times 10^{-6})。
实验结果1. 合成数据集（LOL）测试在 LOL 数据集上的实验表明，本文方法在 PSNR（峰值信噪比） 和 SSIM（结构相似性） 指标上分别达到 26.687 dB 和 0.889，优于对比方法（如 RetinexNet、EnlightenGAN 等）。具体数据如下：
| 方法 | PSNR (dB) | SSIM | LOE（亮度循环误差） |
 |—————|———–|——–|———————|
 | RetinexNet | 18.782 | 0.561 | 2201.662 |
 | EnlightenGAN | 22.447 | 0.716 | 1251.696 |
 | 本文方法 | 26.687| 0.889| 721.867 |
2. 真实场景测试在真实低照度图像上，本文方法能够有效抑制噪声并恢复细节。例如，在夜间道路场景中，该方法成功检测出低照度条件下原本不可见的行人、自行车等目标，目标检测率提升 10.17%~17.19%。
3. 消融实验引导图与直方图损失的贡献：去除引导图后，PSNR 下降至 22.806 dB；仅去除直方图损失时，PSNR 为 26.381 dB，证明两者均对性能提升至关重要。
 
数据增强的效果：使用数据增强策略后，网络训练稳定性显著提高，PSNR 随迭代次数持续上升，而未使用数据增强的网络在 100 次迭代后出现过拟合。
 
结论与价值本研究提出了一种创新的低照度图像增强方法，其核心贡献包括：
 1. 照度图引导机制：通过量化图像局部亮度差异，实现自适应增强，避免过增强或欠增强问题。
 2. 多尺度注意力 U-Net：结合通道注意力残差模块，提升特征提取能力。
 3. 数据增强与直方图损失：解决了小样本训练问题，并优化了全局亮度分布。
该方法在合成数据和真实场景中均表现出色，不仅提升了图像质量，还为后续计算机视觉任务（如目标检测）提供了可靠支持。
研究亮点引导图创新：首次将反色变换应用于照度图构建，直观反映增强力度需求。
 
联合损失函数：结合边缘、像素和直方图约束，全面优化增强效果。
 
实际应用价值：在自动驾驶、安防监控等领域具有直接应用潜力。
 
其他价值本研究还开源了基于 Raise 数据集合成的 1,800 对低光/正常光图像，为后续研究提供了宝贵资源。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问