分享自:

基于综合海洋信息的自主水下航行器路径规划研究

期刊:IEEE Internet of Things JournalDOI:10.1109/JIOT.2022.3155697

该文档属于类型a,即报告了一项原创性研究。以下是对该研究的学术报告:


主要作者与机构
本研究的主要作者包括Meng Xi、Jiachen Yang(IEEE高级会员)、Jiabao Wen、Hankai Liu、Yang Li以及Houbing Herbert Song(IEEE高级会员)。他们分别来自天津大学电气与信息工程学院、天津大学智能与计算学院以及美国Embry-Riddle航空大学。该研究于2022年9月15日发表在《IEEE Internet of Things Journal》第9卷第18期上。

学术背景
本研究的主要科学领域是水下物联网(Internet of Underwater Things, IoUT)中的自主水下航行器(Autonomous Underwater Vehicle, AUV)路径规划。AUV因其探测范围广、机动性强、续航时间长以及智能化程度高,已成为海洋探测的重要工具。然而,现有的AUV路径规划研究存在两大挑战:一是环境模型的真实性不足,传统方法仅依赖海洋流模拟模型,缺乏真实海洋数据的支持;二是路径规划算法的灵活性不足,传统算法对环境变化敏感,难以适应复杂的海洋环境。为解决这些问题,本研究提出了一种基于综合海洋信息与强化学习(Reinforcement Learning, RL)的AUV路径规划方案,名为COID(Comprehensive Ocean Information-enabled D3QN)。

研究流程
本研究包括以下三个主要步骤:
1. 综合海洋数据的引入与海洋流生成
研究首先引入了包括天气、温度、盐度、海洋流等在内的真实海洋数据,并利用区域海洋建模系统(Regional Ocean Modeling System, ROMS)生成可靠的3D海洋流数据。ROMS结合了物理和数学约束,能够生成高精度的海洋流模型。研究区域为南海的一部分(东经118.5°至120°,北纬20.75°至22.25°,海平面以下3600米),通过ROMS生成50×50×50的网格化3D海洋环境模型。

  1. 强化学习环境的构建
    在3D海洋环境模型的基础上,研究设计了一个强化学习环境,主要包括状态转移函数和奖励函数。状态转移函数描述了AUV在海洋流和动作策略共同作用下的位置变化,而奖励函数则指导AUV学习目标,加速网络收敛。奖励函数包括距离奖励、海洋流奖励、步数奖励和目标奖励,通过加权组合引导AUV利用海洋流缩短路径长度和减少能耗。

  2. 路径规划算法的设计与实现
    研究提出了一种基于双决斗深度Q网络(Double Dueling Deep Q Network, D3QN)的路径规划算法COID。该算法将局部海洋流信息与位置特征结合,作为神经网络的输入,并通过优先级采样加速网络收敛。D3QN通过解耦状态值和动作值,有效避免了传统Q学习中的过估计问题,提高了算法的稳定性和收敛速度。

主要结果
1. 训练过程与路径规划效果
实验结果表明,COID在训练过程中表现出更快且更稳定的收敛性。与传统的DQN和D3QN相比,COID规划的路径更短、更平滑,且能够更好地利用海洋流。例如,在从起点(48, 2, 3)到终点(3, 47, 49)的路径规划任务中,COID规划的路径长度明显短于其他算法,且路径更加平滑。

  1. 海洋流方向与强度的影响
    研究进一步分析了海洋流方向和强度对路径规划的影响。实验表明,当AUV运动方向与海洋流方向一致时,路径规划的效率显著提高;反之,当AUV运动方向与海洋流方向相反时,路径规划的效率下降。此外,随着海洋流强度的增加,COID能够更好地适应环境变化,表现出更强的鲁棒性。

结论
本研究提出了一种基于综合海洋信息与强化学习的AUV路径规划方案COID,首次将真实海洋数据引入海洋环境模型,显著提高了路径规划的真实性和实用性。通过结合D3QN框架和优先级采样,COID有效解决了传统算法中的过估计问题,提高了算法的稳定性和适应性。实验结果表明,COID在复杂海洋环境中表现出优异的路径规划性能,具有较高的科学价值和应用潜力。

研究亮点
1. 真实海洋数据的引入
本研究首次将包括天气、温度、盐度、海洋流等在内的真实海洋数据引入AUV路径规划,显著提高了环境模型的真实性。

  1. D3QN框架的应用
    通过结合D3QN框架,COID有效解决了传统Q学习中的过估计问题,提高了算法的稳定性和收敛速度。

  2. 优先级采样的使用
    优先级采样加速了网络收敛,进一步提高了算法的效率。

其他有价值的内容
本研究还探讨了海洋流方向和强度对路径规划的影响,为未来在动态和时变环境中的AUV路径规划研究提供了重要参考。


以上是对该研究的详细学术报告,全面介绍了其背景、流程、结果、结论及亮点。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com