分享自:

面向多层级水下计算的环境感知AUV轨迹设计与资源管理

期刊:IEEE Journal on Selected Areas in CommunicationsDOI:10.1109/JSAC.2022.3227103

IEEE Journal on Selected Areas in Communications 2023年2月刊研究报道:面向多层级水下计算的环境感知AUV轨迹设计与资源管理

作者与发表信息

本研究的通讯作者为Beihang University的Jingjing Wang(高级会员,IEEE),研究团队包括清华大学侯祥旺(学生会员,IEEE)、王晶晶、白桐(会员,IEEE)、邓燕莎(高级会员,IEEE)、任勇(高级会员,IEEE)以及南安普顿大学的Lajos Hanzo(终身会士,IEEE)。该成果于2023年2月发表在《IEEE Journal on Selected Areas in Communications》(第41卷第2期)。

学术背景

本研究属于水下物联网(Internet of Underwater Things, IoUT)与边缘计算交叉领域。由于水下电磁波衰减严重,传统射频通信技术难以适用,自主水下航行器(Autonomous Underwater Vehicle, AUV)成为水下数据收集的关键载体。然而,现有研究存在三个关键局限:
1. 固定轨迹问题:传统AUV采用椭圆等固定轨迹,导致远离轨迹的IoUT设备需通过多跳通信汇聚数据,增加能耗(如文献[7]);
2. 环境因素忽略:现有轨迹优化仅考虑设备位置,未纳入水流速度、涡旋等动态环境影响(文献[8-10]);
3. 资源协同不足:AUV、水面站与IoUT设备的计算、通信、存储资源缺乏系统级整合。

针对这些问题,研究团队提出多层级水下计算(Multi-Tier Underwater Computing, MTUC)框架,旨在通过环境感知的AUV轨迹设计与资源管理最大化系统经济效益。

研究流程与方法

1. 系统建模

研究构建了包含水面站、AUV群和IoUT设备的三层网络架构:
- 通信模型:采用浅水声学信道,综合考虑多径效应、多普勒效应和环境噪声。噪声模型包含湍流噪声(turbulence noise)、船舶噪声(shipping noise)、波浪噪声(waves noise)和热噪声(thermal noise),其功率谱密度通过公式(1)-(4)量化。
- 缓存模型:水面站通过缓存热门任务数据(如公式(22)-(23))减少回传延迟,约束条件为存储容量上限$Ce$。
- 计算模型:任务$w
{ki}$可本地处理或卸载至水面站,计算时间$t{ki}$包含传输时间$t^{da}{ki}$(设备→AUV)和$t^{as}{ki}$(AUV→水面站),以及水面站处理时间$t^{m}{ki}$(公式(24)-(30))。

2. 轨迹优化

AUV轨迹设计转化为马尔可夫决策过程(Markov Decision Process, MDP),创新点包括:
- 流体动力学模型:基于Navier-Stokes方程构建涡流场模型(公式(43)-(47)),量化水流速度$v_c(p^a_j)$对AUV推进力的影响(公式(48)-(50));
- 能耗模型:AUV能耗分为悬停(公式(55)-(56))和移动(公式(57)-(60))两部分,其中移动能耗通过三段式平均流速近似计算(公式(57))。

3. 问题求解

联合优化问题被建模为高维NP难问题(命题1证明见附录),研究采用异步优势演员-评论家(Asynchronous Advantage Actor-Critic, A3C)算法
- 状态空间(公式70):包含AUV坐标、卸载策略、缓存策略等;
- 动作空间(公式71):联合优化卸载决策$o{ki}$、缓存策略$h{ki}$、带宽分配$r_{ki}$等;
- 奖励函数(公式73):以系统利润(收益-成本)为目标,收益来自延迟与能耗降低,成本包含计算与AUV运动能耗。

主要结果

  1. 环境感知轨迹优势
    仿真显示,环境感知轨迹(图4(e)-4(h))相比传统设计(图4(a)-4(d))可避免涡流区域,系统利润提升23.6%(图5)。当AUV数量从1增至4时,利润提升显著,但超过5台后因边际效益递减而回落(图6)。

  2. 资源分配方案比较

  • 任务卸载:优化卸载方案(Proposed)比全卸载(Full Offloading)和随机卸载(Random Offloading)利润分别高38.2%和72.5%(图7);
  • 数据缓存:智能缓存策略通过热点数据预存减少58%重复传输(图8);
  • 计算-通信协同:联合优化带宽与计算资源分配(Scheme 1)比单独优化方案(Scheme 2-3)利润高19.4%(图9)。
  1. 算法性能
    A3C在收敛速度与解质量上优于遗传算法(GA)、粒子群优化(PSO)和深度确定性策略梯度(DDPG)(图10)。自适应学习率策略(图11)进一步加速收敛。

结论与价值

本研究首次提出MTUC框架,其科学价值体现在:
1. 方法论创新:将流体动力学与强化学习结合,解决动态环境下的AUV轨迹优化;
2. 系统级优化:首次联合考虑AUV轨迹、计算卸载、缓存与资源分配,突破传统设备中心或AUV中心设计的局限;
3. 工程指导:为水下计算网络部署提供AUV数量配置准则(如300台设备需5台AUV)。

研究亮点

  1. 环境感知建模:通过Lamb涡流模型量化水下环境对AUV能耗的影响;
  2. 经济驱动目标:以利润最大化为目标平衡服务质量与运营成本;
  3. 分布式求解:A3C算法支持高维问题的高效并行求解,代码开源促进领域发展。

其他价值

研究者指出未来可拓展方向:
- 水下设备故障概率建模;
- 联邦学习降低声学通信开销;
- 任务成功率的保障机制设计。

(报告字数:约1800字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com