这篇文档属于类型b(综述类科学论文)。以下是详细的学术报告:
本文由Yawen Xiang(军事科学院系统工程研究所)、Heng Zhou(西安电子科技大学/军事科学院)、Chengyang Li(北京大学/军事科学院)、Fangwei Sun、Zhongbo Li(通讯作者)及Yongqiang Xie(均来自军事科学院)合作完成,发表于Remote Sens.期刊2024年第1卷。文章题为《Application of Deep Learning in Blind Motion Deblurring: Current Status and Future Prospects》,采用知识共享许可协议(CC BY 4.0)开放获取。
本文系统综述了深度学习在盲运动去模糊(Blind Motion Deblurring)领域的研究进展,涵盖数据集、评估指标、方法分类(2018-2023年)及未来挑战。背景问题聚焦于:运动模糊(由相机与场景相对运动引起)会降低图像清晰度,影响自动驾驶、目标分割等计算机视觉任务。传统非盲去模糊方法依赖模糊核(blur kernel)估计,但在真实复杂场景中性能受限,而深度学习的自适应特性为解决这一问题提供了新思路。
文章提出以骨干网络为核心的四类方法框架:
2.1 CNN-based 方法
- 两阶段网络(如Schuler et al.):先估计模糊核,再通过非盲去卷积恢复图像。缺点是对模糊核估计精度敏感,难以处理非均匀模糊。
- 端到端网络:分为多尺度(如Nah et al.的DeepDeblur)、多分块(如DMPHN的分层处理)和多时序结构(如MT-RNN的迭代去模糊)。实验表明,多尺度策略在GOPRO数据集上PSNR达33.01%,但可能丢失边缘信息。
2.2 RNN-based 方法
- 利用时序依赖性处理动态场景模糊(如Zhang et al.的空间变体RNN)。局限性在于长程依赖中的梯度消失问题,常与CNN结合以弥补空间信息捕捉不足。
2.3 GAN-based 方法
- 监督方法(如DeblurGAN-V2)通过对抗训练生成逼真清晰图像,但易出现模式坍塌和伪影。
- 无监督方法(如CycleGAN变体UID-GAN)通过解耦内容与模糊特征,减少对配对数据依赖。
2.4 Transformer-based 方法
- 全局建模能力(如Restormer的多头注意力机制)在RealBlur-R数据集上PSNR达36.19%,显著优于CNN。但计算成本高(如Uformer的50.9M参数)。
此综述为图像去模糊领域的研究者提供了宝贵的理论参考和实践指南,尤其对算法选型、数据优化及未来技术突破具有直接启示作用。