分享自:

基于双向循环卷积神经网络的可见光定位和姿态跟踪: 应对环境动态变化

期刊:scientia sinica informationisDOI:10.1360/ssi-2022-0239

类型a:

《中国科学:信息科学》2023年研究成果学术报告

1. 研究团队与发表信息
本研究由中山大学电子与通信工程学院的周炳朋(第一作者及通信作者)、陈光森、朱杰友共同完成,发表于《中国科学:信息科学》(*Scientia Sinica Informationis*)2023年第53卷第7期(页码1404–1422),网络版发布于2023年7月11日。研究得到国家自然科学基金青年基金(62001526)、广东省自然科学基金(2021A1515012021)等多项资助。

2. 学术背景与研究目标
本研究属于室内高精度定位领域,聚焦可见光定位技术(Visible Light-based Position and Orientation Tracking, VLP)。传统VLP方法依赖固定参数的信号传播模型(Signal Propagation Model, SPM)或静态指纹库(Fingerprinting, FG),但在动态环境中(如散射变化、LED发射功率波动、接收机增益漂移),其性能显著下降。为此,本研究提出了一种基于双向循环卷积神经网络(Bidirectional Recurrent Convolutional Neural Network, Bi-RCNN)的新方法,旨在通过挖掘可见光信号中的时空纹理特征,解决动态环境下的运动目标定位与姿态跟踪问题,最终实现厘米级精度(1.5 cm误差)的鲁棒定位。

3. 研究流程与方法
研究分为以下关键步骤:

(1) 系统模型构建
- 实验场景:模拟9 m×9 m×4 m的室内空间,部署81个LED(方形阵列)和9个光电二极管(Photodiode, PD)组成的接收阵列,PD分布为半径0.05 m的圆盘。
- 动态干扰模拟:引入系统参数(LED功率、PD增益)和环境参数(多径衰落系数)的随机波动(波动强度νse=0.1),以模拟实际动态场景。
- 观测模型:接收信号强度(Received Signal Strength, RSS)结合直射与散射路径模型(公式3–4),并添加高斯噪声(信噪比20 dB)。

(2) Bi-RCNN网络设计
- 双向循环结构:前向与后向循环模块分别挖掘历史与未来时刻的RSS时间相关性特征,通过遗忘门(公式13、14)和记忆门(公式16–21)选择性保留时空信息。
- 3D卷积层:记忆门采用两层3D卷积(核尺寸3×3×3,10个卷积核)提取RSS样本的空间纹理特征(如LED阵列的几何投影模式)。
- 数据预处理:对RSS样本序列(长度k=105)滑动截取子序列(长度ks=10),归一化后输入网络(公式10)。

(3) 模型训练与测试
- 数据集:生成105组带标签的RSS序列(80%训练,20%测试),标签为目标位姿参数αr(3D坐标+3自由度姿态角)。
- 优化目标:最小化网络输出与真实位姿的误差,采用TensorFlow-GPU 2.40框架,硬件为NVIDIA RTX 3090。

4. 主要结果与逻辑关联
- 定位性能对比:在20 dB信噪比下,Bi-RCNN的定位误差(1.5 cm)显著优于基线方法(如基于SPM的传统方法误差>10 cm,基于LSTM的方法误差约3 cm,图9–10)。
- 动态环境鲁棒性:即使信噪比低至−30 dB或环境波动强度增至0.4(图13),Bi-RCNN仍保持稳定性能,而传统SPM方法误差急剧上升(图14)。
- 模块有效性验证:双向循环结构与3D卷积的结合(对比基线算法5)证明时空特征融合对提升精度的关键作用。其他影响因素包括LED/PD数量(图15)和背景光干扰(图12)。

5. 结论与价值
本研究通过Bi-RCNN首次实现了动态环境下基于可见光的厘米级定位跟踪,其核心贡献在于:
- 理论层面:提出时空纹理特征作为动态环境中位置鉴别的新范式,突破传统SPM对固定模型的依赖。
- 方法创新:设计双向循环卷积网络结构,结合3D卷积的空间挖掘能力与循环网络的时间建模能力。
- 应用价值:为智能仓库、自动驾驶等需要高精度室内定位的场景提供解决方案,尤其适用于LED照明普及的物联网环境。

6. 研究亮点
- 动态环境适应性:通过遗忘门与记忆细胞机制,有效抑制环境参数波动的干扰(公式24–25)。
- 多模态特征融合:首次将时空纹理特征同时纳入可见光定位模型(图6)。
- 开源可复现:实验参数与网络结构(图8)详细公开,支持后续研究扩展。

7. 延伸讨论
研究还探讨了LED布局、PD阵列尺寸等工程因素对性能的影响(图11, 15),为实际部署提供参数设计指南。未来可进一步探索与视觉定位(Image-based VLP)的联合优化,以应对更复杂场景。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com