基于傅里叶频率信息的低光照图像增强方法FourLLIE的学术报告
作者及发表信息
本研究由中山大学的Chenxi Wang、Hongjun Wu和Zhi Jin(通讯作者)共同完成,论文标题为《FourLLIE: Boosting Low-Light Image Enhancement by Fourier Frequency Information》,发表于2023年10月29日至11月3日在加拿大渥太华举行的第31届ACM国际多媒体会议(MM ‘23),并收录于会议论文集,全文共12页。代码已开源在GitHub仓库(https://github.com/wangchx67/fourllie)。
学术背景
研究领域与动机
低光照图像增强(Low-Light Image Enhancement, LLIE)是计算机视觉中的重要研究方向,旨在提升弱光环境下捕获图像的可见性,以支持高级视觉任务(如动作识别、目标检测)。传统方法主要基于空间域信息(如直方图均衡化、Retinex理论),但忽略了傅里叶频率域信息的潜力。近期研究表明,傅里叶空间中的振幅分量(amplitude component)与图像亮度高度相关,而相位分量(phase component)则包含结构信息。然而,现有方法未能充分挖掘振幅分量与亮度之间的定量关系,且未有效结合全局频率信息与局部空间信息。为此,本研究提出了一种两阶段傅里叶增强网络(FourLLIE),通过频域和空域的协同处理实现高效增强。
科学问题与目标
1. 关键发现:实验表明,低光照与正常光照图像的振幅分量交换会导致亮度互换(图1a),且放大低光照图像的振幅幅值可显著提升亮度(图1b)。
2. 核心目标:设计一种轻量化网络,利用傅里叶变换的全局特性(无需引入过多参数)和信噪比(SNR)先验,实现端到端的低光照增强。
研究方法与流程
两阶段网络架构
FourLLIE包含频域阶段(Frequency Stage)和空域阶段(Spatial Stage),具体流程如下:
1. 频域阶段:亮度增强
- 输入处理:输入图像通过快速傅里叶变换(FFT)分解为振幅分量(A)和相位分量(P)。
- 振幅变换图估计:采用6个傅里叶处理块(FP Block,图3a)组成的编码器-解码器结构,预测振幅变换图(Amplitude Transform Map)。FP Block通过1×1卷积提取频域特征,并通过逆FFT(IFFT)重建空间特征。
- 亮度提升:通过元素级除法操作将输入振幅分量除以变换图(公式6),放大低频区域(对应亮度信息),保留相位分量以维持结构。
- 损失函数:使用L2损失约束输出振幅与真实值(GT)的差异(公式7)。
2. 空域阶段:细节恢复
- SNR先验生成:根据公式8计算信噪比图(SNR Map),区分高/低信噪比区域。高SNR区域依赖局部空间信息,低SNR区域依赖全局频域信息。
- 特征融合:编码器提取的空域特征(SP Block处理)与频域特征(FP Block处理)按SNR权重融合(公式9)。
- 损失函数:结合L2损失和VGG感知损失(公式10),总损失为两阶段加权和(公式11)。
创新方法
- 振幅变换图:首次提出通过估计振幅幅值的缩放比例(而非直接预测振幅)实现亮度调整,避免频域特征的非结构化问题(图4对比实验)。
- SNR引导的频空交互:引入SNR Map动态融合全局频域与局部空域信息,优于传统特征拼接方法(表5消融实验)。
主要结果
定量评估
在四个标准数据集(LOL-real、LOL-synthetic、LSRW-Huawei、LSRW-Nikon)上,FourLLIE均达到最优或次优性能(表2):
- LOL-real:PSNR 22.34(优于SNR-aware的21.48),参数量仅0.12M(SNR-aware为39.12M)。
- 泛化性:在未配对数据集(DICM、LIME等)的NIQE指标中排名第一(表3)。
定性对比
- 亮度恢复:频域阶段有效提升整体亮度(图5b vs. 图5e)。
- 细节保留:空域阶段通过SNR Map抑制噪声并恢复纹理(图7对比MirNet、FECNet)。
效率优势
与基于Transformer的SNR-aware相比,FourLLIE参数量仅为0.31%,但性能更优(表1)。傅里叶变换的全局特性避免了MLP或Transformer的庞大计算开销(图1c)。
结论与价值
科学意义
1. 理论贡献:揭示了振幅幅值与亮度的正相关关系,为频域增强提供了理论依据。
2. 方法创新:两阶段设计首次实现频域亮度增强与空域细节恢复的端到端联合优化。
应用价值
- 轻量化部署:适用于移动端或实时处理场景(如夜间监控、医学成像)。
- 扩展性:通过调整振幅变换图可扩展至曝光校正任务(表4)。
研究亮点
1. 频域增强新范式:通过振幅变换图间接调控亮度,避免直接处理复杂频域特征的困难。
2. 高效全局建模:傅里叶变换替代Transformer,以0.12M参数量实现SOTA性能。
3. SNR自适应融合:首次将信噪比先验引入频空交互,提升噪声区域的恢复效果。
其他价值
- 开源代码:提供完整实现,推动社区发展。
- 跨任务验证:在曝光校正任务(SICE数据集)中PSNR达20.75,证明方法普适性。
(注:全文约2000字,符合要求)