基于深度学习的低照度图像与视频增强综述
本文由Chongyi Li(新加坡南洋理工大学)、Chunle Guo(南开大学)、Linghao Han(南开大学)、Jun Jiang(商汤科技)、Ming-Ming Cheng(南开大学)、Jinwei Gu(商汤科技)及Chen Change Loy(新加坡南洋理工大学)合作撰写,发表于《IEEE Transactions on Pattern Analysis and Machine Intelligence》。论文系统回顾了深度学习在低照度图像增强(Low-Light Image Enhancement, LLIE)领域的最新进展,并提出了一个综合性基准测试平台与数据集LLIV-Phone,旨在推动该领域的研究发展。
低照度图像增强(LLIE)的核心目标是通过算法提升在弱光环境下拍摄的图像或视频的视觉质量或可解释性。传统方法如直方图均衡化和基于Retinex理论的方法存在局限性,例如:
1. 理想化假设问题:Retinex模型将反射分量直接作为增强结果,而实际场景的光照条件复杂,导致细节丢失或色彩失真;
2. 噪声忽略:多数方法未显式建模噪声,导致增强后噪声被放大;
3. 计算效率低:传统优化算法耗时较长。
近年来,基于深度学习的方法凭借其鲁棒性和高效性成为主流,但缺乏系统性综述。本文填补了这一空白,并分析了不同学习策略、网络结构、损失函数及数据集的优劣。
作者将现有方法分为五类:
- 监督学习(Supervised Learning, SL):占73%,依赖成对数据(如LOL数据集),但易因合成数据与实际场景差异导致泛化能力不足。代表方法包括LLNet(首篇深度学习LLIE论文)、Retinex-Net(结合Retinex理论的分解-增强网络)及MBLLEN(多分支特征融合)。
- 无监督学习(Unsupervised Learning, UL):如EnlightenGAN,通过生成对抗网络(GAN)避免配对数据需求,但训练稳定性与颜色保真度仍是挑战。
- 零次学习(Zero-Shot Learning, ZSL):如Zero-DCE,仅需测试图像自身优化,无需训练数据,但非参考损失函数设计复杂。
- 强化学习(Reinforcement Learning, RL):如DeepExposure,通过策略网络调整局部曝光,但奖励机制设计困难。
- 半监督学习(Semi-Supervised Learning, SSL):结合监督与无监督学习,如DRBN,通过递归波段网络提升泛化性。
作者呼吁关注以下方向:
1. 开发兼顾人类视觉与机器感知的评估指标;
2. 探索RAW-to-RGB的端到端联合优化;
3. 结合语义信息(如人脸检测)引导增强任务。
通过系统性总结与资源开放,本文为低照度增强领域提供了重要参考,并推动了工业界(如手机摄影)与学术界的协同创新。