这篇文档属于类型a,即报告了一项单一原创研究的学术论文。以下是基于文档内容的学术报告:
基于卫星影像全局和局部深度学习特征检索的无人机绝对定位方法
作者及机构
本研究由侯慧太、蓝朝桢*、徐青共同完成,作者单位为战略支援部队信息工程大学地理空间信息学院。该研究发表于《地球信息科学学报》2023年第25卷第5期,DOI为10.12082/dqxxkx.2023.220827。
学术背景
随着无人机(Unmanned Aerial Vehicle, UAV)技术的成熟,无人机在军事和民用领域的应用日益广泛。然而,无人机执行任务的前提是对自身位置的准确定位。传统无人机导航依赖全球导航卫星系统(Global Navigation Satellite System, GNSS),但GNSS存在不稳定、易受干扰等缺点,导致在GNSS拒止环境中无人机无法定位。针对这一问题,本研究提出了一种基于卫星影像全局和局部深度学习特征的无人机视觉检索定位方法,旨在解决GNSS拒止环境下的无人机定位问题。
研究流程
本研究分为以下几个主要步骤:
1. 全局特征提取与检索
使用ConvNext作为主干网络,结合广义平均池化(Generalized-Mean Pooling, GeM)构建检索特征提取算法,提取卫星和无人机影像的全局特征。针对检索定位任务,设计了考虑影像间重叠面积的三元损失函数,并建立了相应的训练数据集。通过提取的全局特征,对一定范围内的卫星影像进行检索,获得初步检索结果。
2. 基于局部特征的重排序
为了提高检索准确率,使用基于深度学习的LoFTR算法进行局部特征匹配,并结合RANSAC算法筛选匹配结果。对检索结果中的前k张影像进行重新排序,以提高目标影像的准确率。
3. 实验数据与评价指标
研究建立了面向无人机检索定位任务的训练和试验数据集。实验数据包括无人机模拟影像和实拍影像,以及不同季节和年份的卫星影像。评价指标采用top@k,即排名前k的影像中包含查询影像的概率。
4. 实验结果与分析
通过模拟影像和实拍影像的实验,验证了方法的有效性和适应性。实验结果表明,在完全重叠的无人机模拟影像检索中,平均准确率达到90.9%,平均耗时为2.22秒。在无人机实拍影像测试中,准确率为87.5%,能够满足无人机导航定位需求。
主要结果
1. 模拟影像检索结果
实验结果表明,本文方法在不同季节和年份的卫星影像检索中均表现出较高的准确率,尤其是在时间跨度较大和低纹理区域的情况下,依然能够保持良好的适应性。影像重叠率对检索准确率影响较大,随着重叠率的降低,准确率逐渐下降,但在极端情况下(重叠率25%),top@500仍能达到90%以上。
2. 重排序结果
重排序方法显著提高了检索准确率,尤其是在完全重叠的情况下,平均top@1达到90.9%。重排序方法能够有效克服地物阴影遮挡和局部变化对检索结果的影响。
3. 无人机实拍影像结果
在无人机实拍影像测试中,重排序前的top1正确率为50%,重排序后提升至87.5%,表明本文方法在实际应用中也具有较好的适应性。
结论
本研究提出了一种基于卫星影像全局和局部深度学习特征的无人机视觉检索定位方法,解决了GNSS拒止环境下的无人机定位问题。实验结果表明,该方法在时间跨度较大、低纹理区域以及不同季节和年份的影像检索中均表现出较高的准确率和适应性。该方法仅需无人机搭载一个俯视光学相机,基于已知的卫星正射影像进行检索定位,具有较高的实用价值。
研究亮点
1. 高准确率与适应性
本研究在完全重叠的无人机模拟影像检索中,平均准确率达到90.9%,在无人机实拍影像测试中准确率为87.5%,表现出较高的准确率和适应性。
2. 创新性方法
本研究结合了ConvNext网络和广义平均池化,设计了考虑影像重叠面积的三元损失函数,并提出了基于LoFTR和RANSAC的重排序方法,显著提高了检索准确率。
3. 实际应用价值
该方法仅需无人机搭载一个俯视光学相机,基于已知的卫星正射影像进行检索定位,具有较高的实际应用价值,尤其是在GNSS拒止环境下。
未来研究方向
本研究在影像重叠率较低的情况下,检索准确率显著下降,未来需要进一步提高方法在特殊情况下的适应性。此外,深度学习全局特征容易忽略影像细节,局部特征匹配过程耗时较长,未来可以探索更有效的特征提取算法,以实现机上实时定位。
这篇报告详细介绍了研究的背景、方法、实验、结果和结论,突出了研究的创新性和应用价值,为相关领域的研究人员提供了全面的参考。