作者及机构
本研究的核心团队由来自西安交通大学(Xi’an Jiaotong University)、旷视科技(Megvii Technology)、加州大学默塞德分校(University of California, Merced)以及陕西玉兰九州智能光电技术有限公司(Shaanxi Yulan Jiuzhou Intelligent Optoelectronic Technology Co., Ltd)的研究人员组成。第一作者为Chengxu Liu,通讯作者包括Xueming Qian和Ming-Hsuan Yang。该研究以论文形式发表于计算机视觉领域的顶级会议CVPR(计算机视觉与模式识别会议),属于开放获取版本,最终出版版本可通过IEEE Xplore获取。
研究领域与动机
该研究属于计算机视觉中的图像复原(image restoration)领域,具体聚焦于盲运动去模糊(blind motion deblurring)问题。现实世界中,相机抖动、物体快速运动等因素会导致图像模糊,而此类模糊通常具有空间可变性(spatially-variant),即不同区域的模糊模式(blur pattern)差异显著。传统方法主要依赖特征空间中的残差重建(residual reconstruction),但这类方法存在两大局限:
1. 模型解释性不足:基于卷积神经网络的“黑盒”特性难以捕捉真实场景中的复杂运动;
2. 空间适应性缺失:忽略了对图像空间中运动模式的定制化处理。
研究目标
为解决上述问题,作者提出了一种新型滤波模型——运动自适应可分离协同滤波器(Motion-Adaptive Separable Collaborative Filter, MISC Filter),旨在直接在图像空间(image space)中处理模糊,而非依赖特征空间的残差学习。
MISC滤波器由两个关键模块构成:
- 运动引导对齐模块(Motion-Guided Alignment, MGA):通过运动估计网络预测运动流(flow)、掩膜(mask)、核(kernels)、权重(weights)和偏移量(offsets),将模糊模式沿运动方向对齐至中间时刻。
- 运动流估计:使用轻量级卷积层预测像素级偏移(offset),表征从运动中心到终点的方向。
- 双向变形(bi-directional warping):结合掩膜调制,避免不同方向的对齐像素遮挡问题。
- 可分离协同滤波模块(Separable Collaborative Filtering, SCF):通过协同估计的1D核(垂直与水平方向)、权重和偏移量,对对齐后的图像进行滤波。
- 参数协同估计:采用核估计器(kernel estimator)、偏移估计器(offset estimator)和权重估计器(weight estimator),其中核通过一对1D核近似2D核,显著降低计算复杂度。
为平衡运动估计网络与残差重建网络的效率,作者对比了五种耦合策略(如并行、半并行、串行、半共享、全共享),最终选择全共享结构(shared-based)并优先执行滤波操作,以最大化模型性能(PSNR提升0.4 dB)。
科学价值
1. 方法创新:首次提出在图像空间中直接处理运动模糊的滤波框架,突破了传统残差重建的局限性;
2. 理论贡献:通过运动引导对齐与协同滤波的耦合,为空间可变模糊建模提供了可解释性强的解决方案。
应用价值
MISC滤波器可应用于自动驾驶、监控视频增强等实际场景,尤其适合处理相机抖动或物体快速运动导致的模糊。代码已开源(GitHub仓库:https://github.com/chengxuliu/miscfilter)。
在硬件引起的模糊(如屏下摄像头UDC)任务中,MISC滤波器虽未专门优化低光问题,但仍达到与专用模型(如BNUDC)相近的性能(PSNR 38.42 dB vs. 38.60 dB),展现了其泛化潜力。