分享自:

基于滚动快门相机的光学相机通信过渡型数据解码方法

期刊:current optics and photonicsDOI:https://doi.org/10.3807/copp.2018.2.5.422

本文介绍了一项由Byung Wook Kim、Ji-Hwan Lee和Sung-Yoon Jung三位研究人员完成的研究,他们分别来自韩国湖西大学、AP Systems公司和岭南大学。该研究成果以论文《Transition-based data decoding for optical camera communications using a rolling shutter camera》的形式,发表于2018年10月的期刊《Current Optics and Photonics》(第2卷第5期,第422-430页)。

研究背景与目的 该研究属于可见光通信(VLC)与光学相机通信(OCC)交叉领域。随着LED照明因其价格下降和能效提升而日益普及,利用LED进行无线数据传输(即可见光通信)因其无电磁干扰、安全、低成本和高能效等优势,展现出巨大潜力。其中,光学相机通信(OCC)是一种利用LED作为发射器、相机作为接收器的无线通信形式。现代智能手机普遍配备的CMOS(互补金属氧化物半导体)相机,其卷帘快门(Rolling Shutter)工作机制可将LED发射的时序调制光信号,转换为捕获图像中的空间条纹图案,从而实现数据解码,这为OCC的广泛应用提供了硬件基础。

然而,在实际应用中,相机接收到的图像质量会受到光晕(Light Smear)、运动模糊(Motion Blur)和失焦模糊(Focus Blur)等多种退化效应的影响。这些退化导致图像中代表“亮”(ON)与“暗”(OFF)的条纹宽度变得不规则,使得传统的、基于固定条纹宽度阈值进行解码的方案性能严重下降。虽然已有一些技术(如多项式拟合、直方图均衡化)被用于缓解模糊影响,但它们通常计算复杂,对移动设备造成负担。因此,本研究旨在提出一种基于跃迁的解码方案,其核心目标是:在存在图像退化(尤其是光模糊)和可变LED调光等级的现实条件下,实现更简单、更鲁棒的数据解码,同时避免复杂的图像处理技术,以减轻移动设备的计算压力。

详细工作流程 该研究的工作流程可分为发射端处理接收端解码两大模块,并包含一系列实验验证。

1. 发射端信号构建与调制 研究人员设计了一套完整的信号帧结构和调制方案。首先,数据流被分割成信号帧。每个信号帧的结构包含:两个保护符号(Guard Symbol)、一个同步脉冲(Synchronization Pulse)和八个数据符号。保护符号位于同步脉冲前后,用于清晰地区分同步段与数据段,减少检测错误。同步脉冲由20个“码片”(Chip)组成,其内部包含频繁的电平跃迁,在卷帘快门图像中会呈现为一个最长的亮条纹,用于接收端的帧同步。

为了实现调光控制并与解码方案兼容,研究采用了码长为1的多编码可变脉冲位置调制(MC-VPPM)。在这种调制下,每个数据符号由10个码片构成。通过改变这10个码片中“1”(高电平/亮)和“0”(低电平/暗)的数量比例,可以精确控制LED的平均亮度,实现以10%为步进的调光等级(例如,70%调光等级下,数据“0”对应“1111111000”,数据“1”对应“0001111111”)。同步脉冲的码片模式也根据目标调光等级进行了特别设计(参见论文表1),以确保在不同亮度下都能产生明显的长脉冲特征。整个信号通过LED驱动器驱动商用LED灯具发出,调制频率高达10kHz,远高于相机帧率,既满足了高速数据传输,又避免了人眼可察觉的闪烁。

2. 接收端图像处理与解码算法 接收端使用智能手机(如三星Galaxy系列)的CMOS相机捕获图像(分辨率3200×2400)。解码过程包含以下关键步骤:

  • 图像采集与感兴趣区域(ROI)检测:相机在卷帘快门模式下捕获包含LED光源的图像。由于LED照明区域在图像中亮度极高,研究采用图像二值化方法提取ROI。具体方法是设定一个全局阈值(例如最大像素和的60%),将图像转换为黑白二值图,从而分离出包含闪烁条纹的LED照明区域。
  • 水平投影与形态学处理:由于卷帘快门是逐行扫描,数据信息主要体现在水平方向上。为了消除垂直方向上的噪声(如反光、模糊边缘),研究进行了水平形态学处理:如果一条扫描线上有超过20%的像素被判定为高亮度,则将该整行都设置为高亮度。此操作能将ROI图像有效地投影成一维的“条形码”式亮暗条纹序列,突出了水平方向的脉冲模式,抑制了垂直干扰。
  • 脉冲宽度测量与参考值建立:这是解码算法的准备阶段。算法首先在投影后的条纹序列中识别出最长的两个高脉冲,它们对应两个同步脉冲。关键的创新在于定义了扩展符号脉冲(Extended Symbol Pulse) 的概念。当两个连续的数据符号比特相同(如连续两个“1”或两个“0”)时,在图像中它们会融合成一个更宽的高脉冲或低脉冲,其宽度约为单个符号脉冲的两倍。算法将第三长的高脉冲宽度作为区分“扩展高脉冲”与“正常高脉冲”的参考阈值。同时,将紧跟在同步脉冲后的低脉冲宽度作为“正常低脉冲”的参考宽度,用于区分“扩展低脉冲”。
  • 帧同步:利用同步脉冲是图像中最长高脉冲的特性,定位信号帧的起始和结束位置。保护符号的设计(例如在70%调光下,同步脉冲前的保护符号为“1111111000”,以低电平结束;同步脉冲后的保护符号为“0001111111”,以低电平开始)确保了同步脉冲两端存在电平跃迁,使得帧边界更容易被识别。
  • 基于跃迁的数据解码:这是本研究的核心算法。解码不依赖于测量每个脉冲的绝对宽度,而是观察连续两个符号脉冲之间的电平跃迁模式
    • 解码从同步脉冲之后开始,依次取两个脉冲进行分析。
    • 如果两个脉冲呈现 “低-高”(L-H) 模式,则解码为数据比特 “1”
    • 如果两个脉冲呈现 “高-低”(H-L) 模式,则解码为数据比特 “0”
    • 解码后,需要判断第二个脉冲的性质:检查第二个脉冲的宽度是否达到“扩展脉冲”的阈值
      • 如果是扩展脉冲(意味着它与下一个待解码的脉冲原本属于同一符号),则在下一轮解码中,将这个扩展脉冲作为第一个脉冲,再取它后面的一个新脉冲组成新的“两个连续脉冲”进行分析。
      • 如果是正常脉冲,则在下一轮解码中,将其丢弃,重新取后续两个新的连续脉冲进行分析。
    • 此过程重复进行,直到遇到下一个同步脉冲,完成一个帧内所有数据符号的解码。最后,去除帧头尾的保护符号,即可得到原始的8位数据比特。

3. 实验验证流程 研究在室内环境下搭建了实验系统进行性能测试。发射端使用由树莓派(Raspberry Pi)通过UART控制的20瓦商用LED灯具。接收端为手持智能手机。实验设置了不同的变量来验证算法的鲁棒性: * 调光等级:在30%到80%之间变化,采集了100张图像进行测试。 * 相机角度:模拟手持设备的自然晃动,相机旋转角度在-60度到60度之间随机选取。 * 相机ISO感光度:测试了从80到800的不同ISO设置,以观察卷帘快门效应在不同光敏感度下的明显程度。 对于每组参数,研究人员捕获图像,并应用上述解码流程,最终统计解码正确率作为性能指标。

主要结果 1. ROI检测与图像预处理有效性:实验表明,即使存在反射或模糊,水平形态学处理和投影能有效生成清晰的、可用于解码的一维条纹序列(条形码图像)。提高ISO设置(如至800)能使卷帘快门效应更明显,有助于在弱光条件下进行通信。 2. 角度适应性:实验发现,当LED光源在图像平面中错位角度在-60度至60度之间时,单幅图像中至少能捕获到两个同步脉冲,从而满足解码所需的帧同步条件。当角度过大(如72度)时,图像中可能只包含一个同步脉冲,导致无法正确确定数据帧边界。 3. 解码正确率:论文表3展示了所提方案在不同调光等级下的解码正确率。在30%、40%、50%、60%调光等级下,100次传输帧均能100%正确解码。在70%和80%调光等级下,正确率分别为99/100和99/100。这证明了该方案在宽范围调光等级下均能保持高鲁棒性。 4. 算法执行示例:论文通过一个50%调光等级下的具体解码例子,逐步演示了算法如何根据跃迁模式和扩展脉冲判断规则,将接收到的脉冲序列(如“L-H-H-L-L-…”)正确地解码为原始数据比特(“0-1-0-0-0-1-1-0”)。

结论与价值 本研究提出并验证了一种用于光学相机通信的、基于跃迁的卷帘快门相机数据解码方案。该方案的核心优势在于其简单性和鲁棒性。它摒弃了传统方法中对复杂图像处理技术(如滤波、直方图均衡)的依赖,也无需精确测量每个“亮/暗”条纹的宽度。取而代之的是,仅通过检测连续两个符号脉冲之间的电平跃迁(低-高或高-低),并结合对“扩展脉冲”的智能判断,即可实现准确解码。这种方法对由光晕、运动模糊等引起的脉冲宽度变化不敏感,从而在现实非理想成像条件下显著提升了通信可靠性。同时,该方案完全兼容支持调光功能的MC-VPPM调制,使得可见光通信在传输数据的同时,能够灵活调节照明亮度,满足了实际照明应用的需求。该研究的成果为在智能手机等移动设备上实现低成本、高鲁棒的OCC应用(如室内定位、智能标识信息推送等)提供了有力的技术方案。

研究亮点 1. 方法创新性强:提出了全新的“基于跃迁”的解码范式,将解码问题从复杂的图像质量恢复和精确宽度测量,转化为简单的模式识别(跃迁方向判断)和逻辑判断(是否扩展脉冲),极大降低了计算复杂度。 2. 鲁棒性突出:方案专门针对实际应用中的主要挑战——图像退化(模糊)和可变调光等级——进行设计,实验数据证明其在多种不利条件下仍能保持接近100%的解码正确率。 3. 实用价值高:方案无需额外的复杂计算,非常适合集成在计算资源有限的移动设备中。同时,与调光技术的无缝结合,使其更符合商用LED照明系统的实际运行模式,推动了OCC技术从实验室走向实际部署。 4. 系统性工作:研究不仅提出了核心算法,还设计了完整的通信帧结构、同步机制,并进行了详尽的实验验证,涵盖了从信号发射、调制、接收到解码的全链条流程,工作完整且系统。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com