类型a:
本研究的作者为Jing He和Biao Zhou,来自湖南大学计算机科学与电子工程学院。文章发表于IEEE Photonics Journal第14卷第4期(2022年8月)。论文标题为《A Deep Learning-Assisted Visible Light Positioning Scheme for Vehicles with Image Sensor》。
该研究属于智能交通系统(Intelligent Transportation System, ITS)与可见光通信(Visible Light Communication, VLC)的交叉领域。研究动机源于当前车辆定位技术的局限性:GPS信号在城市、隧道等环境中易受干扰,雷达与激光雷达(LiDAR)成本高昂,而基于射频(RF)的Wi-Fi或蓝牙技术易受电磁干扰。因此,作者提出一种基于图像传感器(Image Sensor, IS)的可见光定位(Visible Light Positioning, VLP)方案,以低成本实现高精度车辆定位。
技术背景方面,VLC利用LED(发光二极管)作为发射器,图像传感器作为接收器。然而,现有VLP方案在远距离传输时,由于LED光源在图像中的空间分离性降低,导致通信与定位性能急剧下降。此外,传统定位算法依赖大量LED参考点,计算成本高。本研究的目标是设计一种深度学习辅助的VLP方案,同时支持远距离通信、高精度定位和LED调光需求。
研究设计了分层编码方案,将LED定位数据映射为两种信号:
- 远距离数据(Long-Distance Data, LDD):由LED矩阵上8个区域(每个区域含2×4个LED)共同传输1比特数据,增强空间分离性。
- 近距离数据(Short-Distance Data, SDD):由单个LED传输1比特数据,使用可调光空间八相移键控(Dimmable Spatial 8-Phase Shift Keying, DS8-PSK)编码,支持7种调光级别(Dimming Level, DL)。
两种数据通过分层编码结合,并采用脉宽调制(PWM)控制LED的4种灰度状态。LED矩阵总功率通过调光级别动态调整(见公式2)。
接收端使用智能手机摄像头(索尼IMX519)捕获信号,流程如下:
1. 图像预处理:通过形态学操作和轮廓检测提取完整的LED矩阵图像,分割为64个子区域。
2. LED状态分类:采用四层卷积神经网络(CNN)(输入10×10 RGB图像,含3个卷积层+1个全连接层+Softmax输出)分类每个LED的4种状态。
3. 分层解码:将LED状态解映射为LDD和SDD。LDD通过多数判决法恢复(公式3),SDD直接通过DS8-PSK解码。
传统基于3D-2D坐标映射的算法计算成本高,本研究改用三层人工神经网络(ANN)预测车辆坐标。输入包括:
- 两个LED矩阵的世界坐标(各3轴)和图像坐标(各2轴),共10个参数。
- 输出为车辆的世界坐标(xv, yv, zv)。ANN隐藏层含10个神经元,激活函数为tanh。
该研究为智能交通系统的VLP应用提供了重要技术参考。