基于图像传感器的可见光定位系统:一种鲁棒且低复杂度的LED感兴趣区域跟踪算法
一、 研究团队与发表信息
本研究由华南理工大学材料科学与工程学院、自动化科学与工程学院以及电子与信息工程学院的研究人员共同完成。主要作者包括宋洪展、温尚生(通讯作者)、袁丹兰、黄琳怡、严梓洪和关伟鹏。该研究成果以题为“Robust LED Region-of-Interest Tracking for Visible Light Positioning with Low Complexity”的学术论文形式,发表于国际期刊 Optical Engineering 2021年5月刊(第60卷,第5期,文章号053102)。论文于2021年1月30日收稿,4月27日被接受,并于5月11日正式在线发表。
二、 学术背景与研究目标
本研究属于室内定位技术领域,具体聚焦于基于图像传感器(Image Sensor, IS)的可见光定位(Visible Light Positioning, VLP)技术。随着室内位置服务需求的增长,传统室内定位技术如蓝牙、Wi-Fi、RFID等存在精度有限、覆盖范围小、延迟高或硬件成本高等问题。VLP技术利用广泛部署的LED照明设备作为信标,通过可见光进行通信和定位,具有高精度、无电磁干扰、可同时实现照明与定位等优势。在基于图像传感器的VLP系统中,摄像头通过滚动快门效应捕获调制了ID信息的LED光源图像,系统需要通过图像处理提取LED的成像区域(Region of Interest, ROI),进而解码ID并计算位置。
然而,现有的VLP系统在实际应用中面临两大核心挑战:高定位延迟和低鲁棒性。计算延迟主要源于图像处理环节,尤其是从整幅图像中提取LED-ROI的过程。而鲁棒性问题则体现在非信号光干扰(如其他光源)、遮挡、LED倾斜导致形状变化、以及LED切换(Handover)等复杂场景下,传统的ROI提取方法容易失效或产生错误,导致定位失败。因此,本研究旨在提出一种鲁棒性强、计算复杂度低的LED-ROI提取与跟踪算法,以提升VLP系统在实际复杂环境下的实时性、准确性和可靠性。
三、 研究方法与详细流程
本研究提出了一种名为“Quick-ROI”的两阶段算法,包含初始化和跟踪两个状态。其核心思想是:仅在必要时(如系统启动或目标丢失时)对全图进行一次性、低复杂度的初始化搜索;在后续连续帧中,仅在前一帧ROI结果附近的邻域内进行快速跟踪,从而极大减少每帧需要处理的像素数量,降低计算量并增强抗干扰能力。
1. 初始化阶段:基于下采样的改进模板匹配 初始化阶段的目标是在第一帧或目标丢失时,自动确定LED-ROI的位置和大小模板。 * 研究对象与处理:输入为CMOS摄像头捕获的原始图像(分辨率2048×1536)。为了减少冗余信息,算法首先将原始图像按固定比例(例如6倍)进行下采样。理论上,这将使后续处理的像素数量减少到原来的1/36。 * 核心方法与流程: * 模板生成:由于使用圆形LED作为发射器,模板形状预设为圆形。对于方形或矩形LED,模板可相应调整。模板尺寸的确定是自适应的:算法生成一系列不同尺寸的候选模板,分别与下采样后的图像进行匹配。 * 匹配与尺寸估计:通过计算每个候选模板与其在下采样图像中的最佳匹配区域之间的像素相似度(比较二值化后的图像),选择相似度最高的候选模板尺寸作为最终的LED-ROI模板尺寸。 * 粗定位与精修:使用确定好的模板在整个下采样图像中进行匹配,得到LED-ROI的粗略区域。然后将该区域映射回原始图像坐标。为了消除下采样可能引入的误差,算法会在映射后的区域边界向外扩展一个模板尺度的范围内,再次进行像素检查,以精确确定原始图像中LED-ROI的边界。
2. 跟踪阶段:基于邻域的内向搜索方案 初始化获得精确的LED-ROI边界后,系统进入跟踪状态。对于后续的每一帧图像,不再处理整幅图像。 * 研究对象与处理:输入为当前帧图像,但处理区域仅限于一个“邻域”。 * 核心方法与流程: * 定义邻域:以前一帧得到的LED-ROI区域为中心,将其长度和宽度扩展至原始值的3倍,形成一个搜索邻域。这个邻域远小于整个图像。 * 内向搜索:在该邻域内,算法通过逐行、逐列积分像素强度(亮度)来检测LED-ROI的新边界。由于LED区域通常比背景更亮,其像素强度积分曲线会呈现明显的波峰,从而可以精确定位LED的边界。这种方法即使LED因倾斜而呈椭圆形,也能有效工作。 * 状态切换:只要跟踪成功,系统就持续使用此低复杂度的跟踪方案。仅当发生以下三种情况时,系统才会切换回初始化阶段:(a) 首帧启动;(b) 发生LED切换(当前跟踪的LED移出视野,新LED进入);© 移动速度过快,导致目标在下一帧中超出了基于前一帧结果定义的邻域范围(文中计算理论最大支持速度约为37.7 km/h)。
3. 实验设计与数据分析流程 研究通过一系列实验验证Quick-ROI算法的性能,并与现有主流方法进行对比。 * 实验平台与参数:实验使用两个LED进行双LED定位算法验证。摄像头型号为MindVision UB-300,分辨率2048×1536,曝光时间0.05毫秒。算法在计算机(Microsoft Surface Laptop 2)和嵌入式树莓派机器人平台(TurtleBot 3 Burger)上分别进行测试。 * 对比方法:选择了VLP领域中常用的ROI提取方法作为对比基线,包括霍夫圆检测(Hough Circles)、轮廓检测(Contour Detection)、均值漂移(Meanshift)、连续自适应均值漂移(Camshift),以及文献[7]和[11]中的轻量级ROI提取方法。 * 性能指标: * 鲁棒性:在模拟的恶劣环境下测试,包括引入不同形状(圆形、矩形)的非信号光干扰、部分遮挡等情况,通过视觉结果和检测精度百分比来评估。 * 跟踪精度:定义为算法提取的LED-ROI中心与真实LED-ROI中心之间的欧几里得距离(单位:厘米)。通过对大量样本(3194帧)计算累积分布函数(CDF)和平均误差来评估。 * 实时性:测量每种算法处理单帧图像所需的平均计算时间(毫秒)。 * 切换处理能力:测试在LED移入/移出视野(Handover)场景下的表现。 * 倾斜适应性:测试摄像头与LED平面不平行时,LED成像变为椭圆形的情况下算法的有效性。 * 距离适应性:测试不同LED-摄像头距离(即图像中LED尺寸变化)对初始化阶段的影响。 * 数据公开:研究团队公开了用于测试的数据集,这是VLP领域首个专注于ROI跟踪鲁棒性测试的正式数据集,供其他研究者验证算法性能。
四、 主要研究结果
1. 鲁棒性表现卓越 * 抗干扰与抗遮挡:在存在圆形、矩形等非信号光干扰,甚至LED被部分遮挡(半遮挡)的严苛场景下,Quick-ROI算法仍能准确提取目标LED的ROI区域。相比之下,霍夫圆检测和轮廓检测等方法会将干扰光源误判为LED-ROI,导致定位失败。文献[7]和[11]的轻量级方法虽然计算快,但对微小干扰也非常敏感,因为它们需要对全图进行行/列像素检索。 * 平滑处理LED切换:在Handover场景下,传统的Meanshift和Camshift等跟踪算法一旦目标移出视野就会丢失跟踪目标。而Quick-ROI在跟踪失败后能自动触发初始化流程,利用高效的改进模板匹配方法在全图中快速重新搜索并锁定新的LED目标,实现了平滑过渡。 * 支持倾斜与距离变化:实验表明,当LED因摄像头倾斜而呈椭圆形时,Quick-ROI的跟踪方案(基于行/列像素强度积分)仍能准确检测其边界。同时,其初始化阶段的模板尺寸自适应估计功能,使其能适应不同拍摄距离下LED成像尺寸的变化。
2. 跟踪精度高 对3194个稳定样本(无干扰、无遮挡)的测试结果显示,Quick-ROI算法的跟踪误差累积分布函数(CDF)表明,超过90%的跟踪误差小于0.8厘米,平均跟踪精度达到0.46厘米。这一精度水平足以满足高精度室内定位的需求,且在实际LED安装误差可能大于0.8厘米的背景下,该算法引入的误差可忽略不计。
3. 实时性能突出 在相同的计算机平台上,使用相同视频数据测试,Quick-ROI算法处理单帧(2048×1536分辨率)的平均时间成本仅为2.1毫秒,显著低于所有对比方法(霍夫圆检测79.57毫秒,轮廓检测42.38毫秒,Camshift 14.17毫秒,文献[11]方法7.44毫秒)。在计算能力较弱的树莓派机器人平台上,平均处理时间也仅为17.17毫秒,证明了其低复杂度和在嵌入式设备上部署的可行性。
4. 综合性能对比优势明显 如表2所示,Quick-ROI在平均计算时间、矩形干扰检测精度(99.11%)、圆形干扰检测精度(100%) 等多个关键指标上均表现最佳或接近最佳。虽然在无干扰情况下的纯跟踪精度(2.66厘米)并非最高,但其在鲁棒性、实时性和精度之间取得了卓越的平衡。而其他方法往往在某一项指标(如速度或精度)上表现优异,却在严苛环境下(干扰、遮挡)性能急剧下降。
五、 研究结论与价值
本研究成功提出并验证了一种名为Quick-ROI的新型LED-ROI提取与跟踪算法,用于解决基于图像传感器的可见光定位系统在实际应用中面临的实时性与鲁棒性瓶颈。该算法通过“初始化(改进模板匹配)+ 跟踪(邻域内向搜索)”的两阶段架构,实现了在复杂环境(干扰、遮挡、目标切换、倾斜)下快速、准确、稳定地提取LED目标区域。
其科学价值在于为VLP系统中的图像处理环节提供了一种创新的、高效的设计思路,将目标跟踪思想与特定的VLP应用场景(LED形状先验、信号光特性)紧密结合,并通过下采样、自适应模板、邻域限制等具体技术手段大幅降低了计算复杂度。应用价值则体现在:该算法显著提升了VLP系统的实用化水平,使其能够应用于对实时性要求高、环境光线复杂、存在动态障碍物的真实室内场景(如机器人导航、AGV调度、人员定位等)。研究团队在树莓派机器人平台上的成功实现,进一步证明了该算法在低成本、资源受限的嵌入式终端上部署的潜力。
六、 研究亮点
七、 其他有价值内容
论文还简要介绍了其所属的VLP系统框架,指出完整的IS-based VLP系统通常包含三个关键部分:LED-ROI提取、LED-ID解码和位置计算。本研究专注于第一个也是最影响实时性和鲁棒性的环节。同时,论文也提及了其团队之前的相关工作(如基于卡尔曼滤波、贝叶斯预测、粒子滤波的跟踪方法),并指出了这些方法在初始化复杂性和处理未知数量LED目标方面的局限性,从而凸显了本次提出的Quick-ROI算法的改进与优势。此外,论文对算法最大支持速度的理论推导,为评估算法在高速移动场景下的适用性提供了定量依据。