这篇论文”simultaneous localization, mapping and deblurring”由首尔国立大学电子工程与计算机科学系的Hee Seok Lee、Junghyun Kwon和Kyoung Mu Lee团队完成,发表在2011年IEEE国际计算机视觉会议(IEEE International Conference on Computer Vision)上。
在视觉同时定位与建图(Visual SLAM)系统中,相机快速移动导致的运动模糊是一个长期存在的技术难题。当相机在未探索区域(unmapped region)高速移动时,传统SLAM系统常因模糊图像导致特征点检测和匹配失败,进而造成定位漂移或地图重建中断。虽然现有重定位(relocalization)算法能一定程度上处理模糊造成的定位丢失,但在未探索区域这一问题仍然无解,因为此时缺乏可用于匹配的先验地标(landmark)。
运动模糊不仅在SLAM中造成技术挑战,传统去模糊方法也存在明显的局限性:(1)基于单幅图像的非均匀去模糊方法计算量大,难以满足实时SLAM需求;(2)假设全局均匀模糊的传统方法无法处理复杂三维场景;(3)单纯依赖图像信息估计点扩散函数(PSF, Point Spread Function)容易产生误差累积。针对这些问题,研究团队提出了一个创新思路:利用SLAM系统估计的三维几何信息(相机位姿和场景结构)来指导运动模糊处理,同时通过去模糊图像提升SLAM性能,形成二者的正向循环。
研究提出的统一框架包含三个核心模块:(1)基于预测的运动模糊鲁棒数据关联方法;(2)融合3D几何信息的快速模糊核估计;(3)基于SLAM信息的图像去模糊。这三个模块形成一个闭环系统:SLAM提供的位姿和3D点结构简化了模糊核估计过程,而准确的模糊核又能提升数据关联精度和去模糊质量,去模糊后图像则提供了更多可靠特征点用于持续SLAM构建。
研究的技术创新主要体现在三个层面: 1. 模糊核参数化与局部均匀假设:将非均匀模糊核建模为直线轨迹,用幅值(ℓ)和方向(φ)参数化表示,并在各地标周围小区域内假设模糊均匀性 2. 基于3D几何的核估计方法:利用SLAM估计的相机位姿pk和3D地标位置l,通过公式推导直接计算模糊核参数,避免了复杂的图像处理 3. 运动模糊鲁棒的数据关联:在传统的特征匹配前增加模糊预测与补偿环节,显著提升模糊图像下的特征跟踪成功率
运动模糊预测与数据关联增强
相机位姿精细化估计
模糊核构建与图像去模糊
特征提取与地图扩展
研究在配备鱼眼镜头(160°视场)的Point Grey Dragonfly 2相机上进行实验,图像分辨率640×480,处理平台为2.4GHz四核PC配NVIDIA GeForce 9600GT GPU。与常规keyframe-based SLAM系统相比,所提方法展现出显著优势:
建图完整性:在快速相机移动场景下,传统SLAM在未探索模糊区域无法注册新地标,导致地图残缺(仅664个地标);而模糊处理方法成功重建整个访问区域(1133个地标)
跟踪稳定性:模糊条件下,传统系统的跟踪地标数平均降至44.6个,而处理方法保持在114.2个(提升156%)
定位精度:通过重投影误差评估,传统方法平均误差4.02像素,模糊处理方法降至1.75像素(提升56.5%)
与单图像去模糊方法[18][20]相比,基于SLAM的去模糊方法在非平面场景展现出明显优势: - 传统均匀去模糊[18]在非均匀模糊区域产生严重伪影 - 基于相机运动的非均匀去模糊[20]对复杂3D结构敏感 - SLAM方法通过精确的3D几何约束,即使在运动剧烈区域也能保持边缘清晰度
值得注意的是,研究证实适度的模糊核估计误差(如2像素内)不会显著影响去模糊质量,这得益于SLAM系统内在的束调整(Bundle Adjustment)对3D点位置的持续优化。
首次提出并实现了视觉SLAM与图像去模糊的双向协同框架,打破了传统处理中这两个任务的分离状态。实验证明,3D几何信息能使模糊核估计准确率提升约3倍,而去模糊图像又使特征点数增加2-3倍。
提出基于运动预测的模糊鲁棒数据关联方法,通过泰勒展开近似模糊特征块,将特征匹配成功率从30%提升至70%以上,解决了模糊条件下视觉里程计的连续性难题。
开发了面向实时SLAM的快速非均匀去模糊算法,通过局部均匀假设和GPU加速,将处理时间从秒级降至200ms内,满足了SLAM的实时需求。
该技术特别适合无人机、移动机器人和增强现实等动态场景应用:(1)无人机在高速飞行时的稳定定位;(2)手持设备在弱光环境下(长曝光导致的运动模糊)的AR体验改善;(3)自动驾驶车辆在颠簸路况下的持续建图。实验视频显示,系统能在相机移动速度达2m/s时仍保持稳定跟踪。
问题定义层面:首次将运动模糊处理形式化为SLAM系统的内在环节而非外部预处理,建立了二者间的数学耦合关系。
技术路径层面:利用SLAM中间结果(位姿和3D点)作为去模糊的先验知识,同时用去模糊结果反哺SLAM,形成技术闭环。
实现层面:提出的模糊核参数化方法仅需存储幅值和方向两个参数,大大降低了计算复杂度,使实时非均匀去模糊成为可能。
研究团队已开源部分代码,为后续相关研究提供了宝贵基础。该方法被后续多项工作引用,已成为处理动态视觉SLAM中运动模糊问题的代表性方案之一。