分享自:

基于数字孪生和边缘计算的水下智能互联网车辆路径规划系统

期刊:digital communications and networksDOI:10.1016/j.dcan.2022.05.005

该文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


基于数字孪生(Digital Twins)与强化学习(Reinforcement Learning)的水下智能互联网车辆路径规划系统研究

1. 研究作者、机构及发表信息

本研究由Jiachen Yang(天津大学电气与信息工程学院)、Meng Xi(通讯作者,天津大学)、Jiabao Wen(天津大学)、Yang Li(天津大学)和Houbing Herbert Song(美国安柏瑞德航空大学)合作完成,发表于期刊《Digital Communications and Networks》,具体发表日期为2022年。

2. 学术背景与研究目标

研究领域:本研究属于水下机器人路径规划领域,结合了数字孪生(Digital Twins)、边缘计算(Edge Computing)和强化学习(Reinforcement Learning)技术。

研究背景
- 水下自主滑翔器(Autonomous Underwater Glider, AUG)因其低能耗、长续航能力,广泛应用于海洋探测。然而,海洋环境的复杂性和不确定性(如洋流、地形变化)使得传统路径规划方法(如Dijkstra算法、A*算法)难以适应动态环境,且依赖精确的数学模型,灵活性不足。
- 数字孪生技术可通过传感器数据构建虚拟海洋环境,提高模拟的真实性;边缘计算可减少云端通信延迟;强化学习能通过试错机制优化路径规划策略。

研究目标
1. 构建基于数字孪生的虚拟海洋环境,提升环境建模的完整性和可靠性。
2. 设计基于边缘计算的终端闭环控制模型,减少云端依赖。
3. 开发基于强化学习的路径规划算法,提高动态环境下的适应性。

3. 研究流程与方法

研究分为以下关键步骤:

(1)虚拟数字空间构建
  • 数据来源:利用AUG搭载的传感器采集真实海洋数据(如地形、洋流),研究区域为东经142°–142.5°、北纬11°–11.5°、海平面以下10000米。
  • 建模方法:采用网格法(Grid Method)将三维海洋环境划分为40×40×40的网格空间,并通过数字孪生技术映射为虚拟环境(图2)。
  • 创新点:传统方法依赖数学函数拟合洋流(如公式1-2),而本研究通过真实数据建模,更贴近实际场景。
(2)终端闭环交互模型
  • 边缘计算部署:将数据采集、处理、建模和路径规划集成到AUG终端,避免云端通信干扰(图3)。
  • 状态输入设计:状态向量为6维连续变量,包括当前位置、目标点坐标和洋流值(公式4)。
  • 动作空间设计:分为方向控制(经度/纬度)和浮潜控制两层离散动作。
  • 奖励函数设计:结合时间奖励(rt)、距离奖励(rd)和目标奖励(rgoal),加速收敛(公式5)。
(3)强化学习路径规划算法
  • 算法选择:对比了四种算法——DQNDouble Q-learningDueling DQNDouble Dueling DQN(算法1-4)。
  • 网络结构优化:通过实验确定最佳参数:
    • 网络宽度:64个神经元(图4)。
    • 批量大小(Minibatch Size):64(图5)。
    • 更新频率:每128次训练更新一次目标网络(图6)。
  • 创新改进
    • Double Dueling DQN结合了动作选择与状态值分离的优势,缓解了DQN的过估计问题。
    • 探索衰减策略(公式10)平衡探索与利用,避免局部最优。

4. 主要研究结果

(1)算法性能对比
  • 训练收敛性:Double Dueling DQN表现最佳,奖励值稳定且收敛速度快(图7)。
  • 路径可视化:在虚拟网格空间中,算法成功规划出避开洋流障碍的Z字形路径(图8)。
(2)不同洋流强度下的适应性
  • 步骤数(Steps):随着洋流强度增加(0.7–1.2),Double Dueling DQN的步骤数稳定下降,而DQN和Double Q-learning在高强度下性能退化(图9)。
  • 路径长度(Length):Double Dueling DQN的路径长度波动最小,表明其对动态环境的鲁棒性(图10)。

5. 研究结论与价值

科学价值
- 提出了首个结合数字孪生、边缘计算和强化学习的水下路径规划系统,解决了传统方法依赖环境模型、灵活性差的问题。
- 通过真实数据驱动的虚拟环境建模,缩小了仿真与实际的差距。

应用价值
- 可应用于海洋资源勘探、环境监测等场景,提升AUG在复杂海洋环境中的自主性。
- 边缘计算架构降低了通信成本,适合大规模水下物联网(IoUT)部署。

6. 研究亮点

  1. 数字孪生环境建模:首次将真实海洋数据融入虚拟空间,提高模拟可靠性。
  2. 终端闭环控制:通过边缘计算实现本地化路径规划,减少云端依赖。
  3. 强化学习算法创新:Double Dueling DQN结合了动作分离和双网络优势,显著提升性能。

7. 其他补充

  • 实验数据来自中国国家海洋数据中心,确保了环境模型的真实性。
  • 未来可扩展至多AUG协同任务,进一步优化群体路径规划效率。

该研究为水下智能载具的路径规划提供了创新性解决方案,其方法框架亦可推广至其他动态环境下的自主系统研究。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com