分享自:

基于注意力CNN与随机森林的GNSS多径检测混合架构

期刊:Physical CommunicationDOI:10.1016/j.phycom.2026.103141

关于《物理通信》期刊中《一种用于GNSS多径检测的混合注意力-CNN与随机森林架构》研究的学术报告

本报告旨在向国内同行介绍一篇发表于国际期刊《物理通信》(*Physical Communication*)的最新研究成果。该研究由来自阿尔及利亚多所大学与研究机构的团队完成,主要作者包括Ayoub Bengherabi(第一作者兼通讯作者)、Mustapha Flissi、Khaled Rouabah、El Ouanas Belabbaci以及Messaoud Bengherabi。论文于2026年4月29日在线发表,卷期为第77卷,文章编号103141。

一、 研究的学术背景

本研究属于全球导航卫星系统(Global Navigation Satellite System, GNSS)信号处理与人工智能交叉领域,具体聚焦于GNSS接收机中多径(Multipath, MP)干扰的检测问题。GNSS在提供精确的定位、导航与授时服务中扮演着核心角色,然而,其性能在密集城市等复杂环境中常因多径效应而严重下降。多径是指卫星发射的直射信号(Line-of-Sight, LOS)经过建筑物、地面等物体反射后,与直射信号叠加进入接收机,导致信号波形(相关峰)发生畸变,进而引入伪距和载波相位测量误差。这种误差是城市峡谷等场景中高精度定位的主要障碍之一。

传统的多径抑制技术主要分为硬件方法(如抗多径天线)和软件方法(如窄相关器、多径估计延迟锁定环等)。然而,在反射信号与直射信号在时域和频域上非常接近的密集城区,传统方法效果有限。近年来,机器学习(Machine Learning, ML)方法,特别是深度学习,为多径检测提供了新的思路。卷积神经网络(Convolutional Neural Network, CNN)能够自动从信号表示中提取空间特征,已展现出潜力。但现有方法仍面临一些挑战:在高噪声(低载噪比, C/N0)条件下鲁棒性不足;一些先进模型(如视觉Transformer)计算开销大,难以在资源受限的GNSS接收机上实时部署;部分方法依赖外部传感器或高精度环境模型,限制了其独立应用的普适性。

因此,本研究旨在开发一种独立、高效且鲁棒的多径检测方法。其核心目标是:直接利用GNSS接收机内部易于获取的原始相关器输出(I/Q信号),构建一种混合深度学习架构,实现在各种复杂和挑战性操作条件下(特别是低C/N0、不同延迟和多普勒偏移)准确可靠的多径检测,而无需依赖任何辅助传感器或先验环境信息。

二、 研究的详细工作流程

本研究的工作流程是一个完整的闭环,从数据生成、模型构建到实验验证,具体可分为以下几个关键步骤:

1. 合成数据集生成与信号建模 由于真实世界中大规模、精确标注的多径与直射信号数据难以获取,本研究采用了一种基于软件定义的合成数据生成方法。这是整个研究的基础。 * 研究对象与样本量:研究生成了一个包含2000个平衡样本的数据集,其中1000个为多径信号,1000个为直射信号。每个样本是一个80×80像素的二维灰度图像,但其具有两个“通道”,分别代表同相(I)和正交(Q)相关器的输出。这种二维图像表示法,将延迟和多普勒偏移映射为空间坐标,保留了多径引起的相关峰畸变的空间结构特征。 * 信号处理与数据生成过程: * 信号模型:基于经典的GNSS多径信道模型,接收信号被建模为直射信号与多个衰减、延迟、具有多普勒频偏和相位偏移的反射信号副本的叠加,并加上加性高斯白噪声。 * 参数配置:为了覆盖广泛的现实场景,合成数据模拟了不同的多径参数,包括相对幅度α(0.1至0.9)、延迟偏移δτ(0至1.5个码片周期Tc)、多普勒频偏δf(-125至+125 Hz)以及相位偏移δθ(0至2π弧度)。同时,在不同载噪比(C/N0)水平下生成数据,以评估模型在噪声环境下的性能。 * 图像生成:通过软件模拟GNSS接收机的相关过程,对于给定的信号参数集,计算其在预设的延迟-多普勒二维网格上的I/Q相关值,并将其归一化后生成为80×80×2的三维张量(图像)。图2和图3直观展示了直射信号清晰、尖锐的相关峰,以及多径信号下出现的峰值展宽、畸变和旁瓣等特征。

2. 提出混合架构AM-CNN-RF 本研究提出的核心创新是一种名为 AM-CNN-RF 的混合架构,它集成了注意力模块增强的卷积神经网络随机森林分类器。 * 特征提取阶段(AM-CNN): * 输入:上述生成的80×80×2的I/Q相关图像。 * 网络结构:AM-CNN包含三个卷积层(分别使用16、32、64个3×3滤波器),每个卷积层后接批量归一化和ReLU激活函数,并穿插最大池化层进行下采样。 * 核心创新——注意力机制:在卷积特征提取之后,集成了一个卷积块注意力模块。该模块顺序应用通道注意力空间注意力。通道注意力学习不同特征通道的重要性权重,强调信息丰富的通道(例如,可能对相位失真更敏感的通道);空间注意力则学习特征图中不同空间位置的重要性权重,引导网络聚焦于相关峰发生畸变的特定区域(如峰值不对称或旁瓣区域)。这种机制使模型能自适应地“关注”与多径相关的关键失真特征,抑制噪声干扰。 * 输出:经过注意力模块和全连接层后,AM-CNN将每张输入图像转换为一个128维的特征向量,该向量被设计为捕获了信号中独特的多径“签名”。 * 分类决策阶段(RF): * 与传统的CNN在最后使用Softmax层直接分类不同,本研究将AM-CNN提取的128维特征向量输入到一个随机森林分类器中进行最终决策。 * 工作原理:随机森林通过构建大量决策树(一种集成学习方法),每棵树在训练数据的自助采样集和随机特征子集上训练。对于新的特征向量,每棵树给出一个类别预测(LOS或多径),最终通过所有树的投票结果决定最终分类。 * 优势:这种设计结合了CNN强大的非线性特征提取能力和随机森林优秀的泛化能力及抗过拟合特性。随机森林能更好地处理高维特征空间中的复杂决策边界,尤其在数据有限或噪声较大时,能提供更稳定、可靠的分类结果,缓解了纯深度学习模型的“黑箱”不确定性。图4展示了该混合架构的端到端工作流程。

3. 系统性能评估实验 研究设计了一系列详尽的实验来全面评估所提方法的性能。 * 评估指标:采用准确率、精确率、召回率、F1分数和特异性等标准分类指标。 * 评估策略:使用五折交叉验证以确保结果的稳健性,并报告均值和标准差。 * 实验内容: * 消融研究:为了验证注意力机制中不同组件的贡献,分别测试了完整CBAM、仅通道注意力、仅空间注意力三种配置。结果表明,完整CBAM在C/N0为36 dB-Hz的挑战性条件下取得了最佳性能(准确率94.30%),证明了通道与空间注意力协同工作的有效性。 * 多径特性影响分析:在良好信号条件(C/N0=47 dB-Hz)下,测试了模型对不同多径延迟(δτ)和多普勒频偏(δf)的检测能力。结果显示,即使在延迟小至0.2个码片、多普勒偏移达50 Hz的情况下,AM-CNN-RF仍能保持接近完美的检测精度(>99%),证明了其对“短延迟”和动态多径的出色敏感性。 * 噪声鲁棒性分析:这是评估的重点。研究在从26 dB-Hz到46 dB-Hz的宽范围C/N0下测试了模型性能。如图7所示,随着噪声增大(C/N0降低),所有模型性能均下降,但AM-CNN-RF始终表现最优,在极低C/N0(36 dB-Hz)下仍能保持96%的准确率,显著优于基准CNN模型(90%)和单独的AM-CNN(94.3%)。这直接证明了混合架构在恶劣信号环境下的优越鲁棒性。 * 与基准模型对比:将AM-CNN和AM-CNN-RF与多个基准模型进行了全面对比,包括:一个标准的CNN基准模型、单独的随机森林、以及将AlexNet、ResNet18、ResNet50、VGG16等经典深度学习架构与RF结合的模型,还对比了另一篇文献中提出的CNN-VMD方法。如表10所示,在所有C/N0水平下,AM-CNN-RF均取得了最高的平均准确率,尤其是在低C/N0时优势更为明显。 * 误差与判别能力分析:通过绘制混淆矩阵(图9-11)和接收者操作特征曲线(ROC曲线,图12-14),深入分析了模型的分类行为。AM-CNN-RF的混淆矩阵显示其假阳性和假阴性数量均极低;其ROC曲线在所有C/N0水平下都最靠近左上角,拥有最高的曲线下面积,表明其具有最优的敏感性与特异性权衡。 * 计算复杂度分析:对模型的计算开销进行了量化(表12)。AM-CNN相对于基准CNN仅增加了约0.12%的参数和2.6%的计算量(GFLOPS),而AM-CNN-RF因加入RF分类器,参数有所增加,但推理计算量基本不变。其单样本推理时间在毫秒级,表明该框架具备在实时GNSS接收机中部署的潜力。

三、 研究的主要结果

  1. 注意力机制的有效性得到验证:消融实验表明,集成通道和空间注意力的完整CBAM模块能最有效地提升特征提取能力,在低C/N0下将检测准确率提升至94.30%,高于任何单一注意力组件。t-SNE可视化(图6)也显示,经过注意力机制提炼的特征,在潜在空间中实现了LOS与多径类别的清晰分离。
  2. 混合架构AM-CNN-RF展现出卓越的综合性能:在所有实验场景中,AM-CNN-RF均一致地超越了其组成部分AM-CNN以及所有其他基准模型。特别是在低载噪比(C/N0)条件下,其性能优势最为显著。例如,在C/N0为36 dB-Hz时,AM-CNN-RF准确率达到96%,而基准CNN为90%,单独的RF模型则骤降至71.9%。这强有力地证明了RF分类器在利用CNN提取的深度特征进行决策时,具有更强的泛化能力和抗噪声干扰能力。
  3. 模型对多径参数变化具有强鲁棒性:实验结果表明,无论是多径延迟从0.2Tc变化到1Tc,还是多普勒频偏在0-50 Hz范围内变化,AM-CNN-RF的检测准确率都稳定在99%以上(在C/N0=47 dB-Hz下)。这表明模型学习到的是多径引起的本质性空间畸变特征,而非依赖于特定的延迟或频偏值。
  4. 模型在复杂几何和信号环境下表现稳定:研究还评估了卫星仰角和方位角变化对性能的影响。模型在低仰角(多径更严重)和复杂的“十字街”方位角场景下仍能保持高精度(>98%),证明了其应对城市峡谷中复杂几何条件的能力。此外,在包含GPS L1、Galileo E1 (BOC调制)和GPS L5等高带宽信号模拟的多GNSS场景测试中,AM-CNN-RF性能仅轻微下降(从GPS L1的96%降至多GNSS的95.4%),显示了其良好的泛化性。
  5. 误差分析证实了混合架构的优越性:混淆矩阵分析显示,AM-CNN-RF的误分类数(尤其是假阴性)远低于基准CNN。ROC曲线分析进一步表明,AM-CNN-RF在所有信噪比水平下都拥有更高的真阳性率和更低的假阳性率,其分类决策的置信度更高。

这些结果逻辑连贯:首先,合成数据为模型训练提供了高质量、可控的样本;其次,AM-CNN成功地从这些数据中提取了具有判别力的特征;最后,RF分类器利用这些特征做出了更稳定、更准确的最终判断。每一步的结果都为下一步的验证提供了基础,并共同支撑了研究的核心结论。

四、 研究的结论与价值

本研究成功提出并验证了一种用于GNSS多径检测的新型混合深度学习架构AM-CNN-RF。该架构通过将注意力机制嵌入CNN以增强对相关峰畸变特征的提取,并利用随机森林分类器提升决策的稳健性,实现了在多种挑战性信号条件下(低C/N0、不同延迟/多普勒、复杂几何)卓越且一致的多径检测性能。

科学价值: 1. 方法创新:提出了一种“注意力CNN特征提取 + 集成学习分类”的混合范式,为GNSS信号处理领域的AI应用提供了新的思路。它巧妙地将深度学习的表示学习能力与经典机器学习模型的稳定决策能力相结合。 2. 特征表示创新:验证了将GNSS I/Q相关器输出表示为二维图像,并利用计算机视觉中的注意力机制进行处理的有效性,为GNSS信号分析开辟了新的特征学习途径。 3. 解决关键挑战:该研究直接针对现有方法在低信噪比下性能下降、计算复杂或依赖外部信息等痛点,提供了一种高效的解决方案。

应用价值: 1. 推动高精度导航:该技术可集成于GNSS接收机的信号处理链中,作为多径检测的前端模块,为后续的误差估计与修正提供可靠输入,有助于提升城市环境下的定位精度和完整性。 2. 适用于独立与资源受限平台:该方法仅需接收机内部的标准相关器输出,无需摄像头、IMU等额外传感器,且计算效率经过优化,使其非常适合在自动驾驶汽车、无人机、智能手机等对功耗和成本敏感的嵌入式平台上部署。 3. 促进实时处理:论文中提到的实时相关图像生成流程与较低的模型推理时间,表明该框架具备向实时多径 mitigation(缓解)系统发展的潜力。

五、 研究的亮点

  1. 性能卓越:在合成数据集上,尤其是在低至36 dB-Hz的恶劣信号条件下,所提AM-CNN-RF架构达到了96%的检测准确率,显著优于现有的CNN基准模型和多种深度学习架构,展现了极强的噪声鲁棒性。
  2. 架构新颖:将卷积块注意力模块(CBAM)与CNN结合用于GNSS信号特征提取,并创新性地用随机森林替代传统的Softmax分类层,构成了一个高效且强大的混合模型。这种设计是本研究的核心创新点。
  3. 系统全面:研究不仅提出了新模型,还涵盖了从理论建模(信号模型)、数据合成、模型设计、消融实验、多维度性能评估(噪声、延迟、多普勒、几何)、到与广泛基准对比和计算复杂度分析的完整链条,论证充分、严谨。
  4. 面向实际:研究明确考虑了实时处理的需求,讨论了相关图像生成的流程和模型的计算开销,并强调了其作为独立解决方案(不依赖外部辅助)的实用性,使研究成果更贴近工程应用。

六、 其他有价值的内容

研究中对合成数据生成方法的详细描述为相关领域的研究者提供了可复现的基准构建方案。此外,对不同卫星星座信号调制方式(如BPSK(1), BOC, BPSK(10))的考虑,以及在多GNSS场景下的测试,表明了该方法对不同GNSS信号体制具有一定的适应性和泛化能力,增加了其应用范围。论文最后也指出了未来工作的方向,包括在真实世界数据上进行验证,以及进一步优化框架以适应实时嵌入式部署,为后续研究指明了路径。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com