分享自:

基于多尺度SE-ResNet50的LED-ID室内可见光定位方法

期刊:IEEE

该文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


基于多尺度SE-ResNet50的室内可见光LED-ID定位方法研究

一、作者与机构信息
本研究由多位作者合作完成,包括:
- 第1作者:1st given name surname(单位:dept. name of organization, name of organization, city, country)
- 其他作者:4th/2nd/5th/3rd/6th given name surname(分别来自不同机构,详见原文)
研究发表于IEEE会议或期刊(具体名称未明确标注),文档编号格式为xxx-x-xxxx-xxxx-x/xx/$xx.00 20xx IEEE。

二、学术背景与研究目标
科学领域:本研究属于可见光通信(Visible Light Communication, VLC)与室内定位技术的交叉领域,涉及多媒体广播、无线通信、深度学习等方向。
研究背景
1. 技术需求:传统室内定位技术(如TDOA、RSS、AO)依赖额外设备且计算量大,而工业场景仅需区域级定位即可满足任务分发需求。
2. 技术瓶颈:现有LED-ID定位方法在远距离或边缘区域因LED面积缩小导致数据包捕获不全,且光电二极管(PD)易受环境光干扰。
3. 创新契机:可见光通信具有频谱资源丰富、部署成本低等优势,结合图像传感器(CMOS)与深度学习可提升定位稳定性。
研究目标:提出一种基于图像传感器和多尺度SE-ResNet50网络的LED-ID定位方法,实现高精度、低成本的工业级室内定位。

三、研究流程与方法
1. 系统架构设计
- 硬件配置
- 发射端:编码LED(电压12V,功率10W,尺寸12mm×12mm),采用OOK调制(开关键控)传输ID信号。
- 接收端:CMOS图像传感器(IMX335,分辨率640×480,帧率30fps)捕获信号帧图像。
- 定位流程:LED发射编码光信号→移动终端捕获图像→多尺度SE-ResNet50分类→查询LED-ID数据库获取位置信息。

  1. 算法开发与优化

    • 多尺度卷积模块
      • 并行使用3×3和5×5卷积核提取局部与全局特征(公式2-4),增强对不同尺寸LED的适应性。
    • SE注意力机制
      • 通过压缩-激励(Squeeze-Excitation)模块(图5)动态加权通道特征,提升关键信息提取能力(公式5-8)。
    • 迁移学习
      • 基于ImageNet预训练的ResNet50参数初始化模型,优化特征提取能力(如条纹、纹理等)。
  2. 实验验证

    • 测试平台:2m×2m×2.2m封闭环境,划分144个测试点(间距0.1m),LED固定高度160cm。
    • 数据采集
      • 4种编码LED各采集14400帧图像(每点100帧),70%训练集、15%验证集、15%测试集(共25921张)。
    • 模型训练
      • 软件环境:PyTorch 2.2.0、Python 3.9;参数:batch size=64,epoch=100,Adam优化器(学习率0.0001),L2正则化(λ=0.001)。

四、主要研究结果
1. 消融实验(表Ⅱ)
- 单独使用SE模块或迁移学习仅提升3.18%和13.74%,而多尺度卷积使准确率达98.78%。
- 完整模型(多尺度+SE+迁移学习)准确率99.45%,较原始ResNet50(61.26%)提升38.19%。

  1. 对比实验(表Ⅲ)

    • 改进模型准确率(99.45%)显著高于VGG-16(65.93%)、MobileNet_v2(48.13%)等主流网络。
  2. 边缘区域性能(图9)

    • 在光辐射边缘区域(距离增加、角度偏移),最低识别率仍达99.12%,验证模型强鲁棒性。

五、结论与价值
1. 科学价值
- 提出首个结合多尺度卷积与SE注意力的ResNet50改进模型,解决了LED-ID边缘识别难题。
- 证明了迁移学习在可见光定位任务中的有效性,为小样本学习提供新思路。
2. 应用价值
- 可部署于智能工厂等大场景,仅需编码LED和普通摄像头即可实现低成本定位(无需额外设备)。
- 支持512种LED-ID扩展,未来可通过提升摄像头分辨率进一步增加容量。

六、研究亮点
1. 方法创新
- 多尺度卷积与SE注意力机制协同优化,显著提升特征提取能力。
- 首次将LED-ID定位转化为图像分类问题,简化系统复杂度。
2. 技术突破
- 在工业级测试环境下实现99.45%的识别准确率,边缘区域性能优于传统算法。

七、其他价值
- 开源硬件设计(如MCP4725 DAC、LM2596S降压模块)和软件参数(GitHub未标注但可复现)为后续研究提供参考。


(注:因原文未明确标注期刊名称和部分作者信息,报告中以原文格式保留;术语如“OOK调制”等首次出现时标注英文。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com