本研究由Microsoft Research的Neel Joshi、Sing Bing Kang、C. Lawrence Zitnick和Richard Szeliski共同完成,发表于2010年7月的ACM Transactions on Graphics期刊(第29卷第4期,文章编号30),DOI为10.1145⁄1778765.1778767。
本研究属于计算机视觉与计算摄影学交叉领域,聚焦于解决相机抖动导致的图像模糊问题。在光线不足的拍摄环境下,相机抖动是导致照片质量下降的最常见原因之一。传统的去模糊方法主要分为两类:基于图像统计信息的盲去卷积(blind-deconvolution)方法和使用额外硬件辅助的方法。然而,现有方法存在三个主要局限:(1) 大多假设模糊是空间不变的;(2) 计算时间长;(3) 难以处理大范围模糊(典型模糊核尺寸达30像素,最大可达100像素)。
本研究创新性地提出了一种结合硬件传感器与优化算法的”辅助盲去卷积”(aided blind-deconvolution)方法,通过测量相机在曝光期间的6自由度运动(three rotational and three translational degrees of freedom,简称6-DOF)来估计空间变化的点扩散函数(point-spread function,PSF),进而实现高质量图像复原。
研究团队开发了一套可附加在消费级相机上的惯性测量装置,包含: - 三轴MEMS加速度计(测量范围±1.5g) - 三个单轴MEMS陀螺仪(测量范围±150°/s) - Arduino控制板与蓝牙传输模块 - 通过相机热靴同步触发采集
该装置以200Hz采样率记录曝光期间的加速度和角速度数据。所有组件均为市售标准件,总成本低廉,具有商业化潜力。硬件平台还预留了高速相机接口用于校准验证。
研究建立了基于刚体动力学的6-DOF运动模型: 1. 旋转运动通过陀螺仪数据积分获得:
θ_t^i = (R_{t-1}^i ω_{t-1}^{t-1})Δt + θ_{t-1}^i x_p^i(t) = 0.5*(a_p^i(t-1)-g)Δt² + v_p^i(t-1)Δt + x_p^i(t-1) 针对传感器积分导致的运动估计漂移问题,研究提出创新解决方案: 1. 假设平移漂移主要影响x,y方向(z方向影响可忽略) 2. 在1mm半径范围内搜索最优终点位置(u,v) 3. 构建能量函数优化:
E = argmin ||b-A(d,u,v)i||²/σ² + λ||∇i||^0.8 改进Levin等人的MAP框架: 1. 数据项采用新建立的空间变化模糊模型 2. 图像先验保持超拉普拉斯分布(hyper-laplacian prior) 3. 使用迭代重加权最小二乘法求解
开发了基于高速相机的”真值”测量方法: 1. 使用200fps高速相机同步拍摄 2. 通过运动恢复结构(structure from motion,SFM)技术重建3D场景 3. 建立相机运动与模糊核的对应关系 4. 校准传感器响应特性与相机内参
通过地面真值测量发现: 1. 相机抖动通常包含显著的旋转分量(特别是roll轴) 2. 透视效应会导致明显的空间变化模糊 3. 典型曝光期间(1/2秒)相机位移约数毫米
在实验室控制场景中: 1. 相比Fergus等人(2006)和Shan等人(2008)的纯图像方法,本方法复原质量最接近地面真值 2. 能处理30-100像素的大模糊核 3. 保持故意虚化区域(如浅景深)不被错误锐化
室外拍摄验证显示: 1. 对1/10-1/2秒曝光图像均有效 2. 残留振铃效应(ringing artifact)明显少于对比方法 3. 在Canon 1Ds Mark III+40mm镜头组合上表现良好
作者指出以下改进方向: 1. 传感器噪声限制:当漂移超过2mm时优化可能失败 2. 深度变化场景:当前假设场景深度均匀,需扩展深度估计能力 3. 初始速度假设:需改进静止状态检测方法 4. 频率信息丢失:建议结合编码曝光(coded exposure)技术
这项研究为计算摄影领域开辟了新途径,其硬件-算法协同设计的思路对后续研究具有重要启发意义。随着MEMS技术进步,该方案有望成为消费相机的标准功能。