面向多层级水下计算的环境感知AUV轨迹设计与资源管理

分享自：
面向多层级水下计算的环境感知AUV轨迹设计与资源管理

船舶与海洋工程
电子科学与信息系统
期刊:IEEE Journal on Selected Areas in CommunicationsDOI:10.1109/JSAC.2022.3227103
【点击此处】阅读全文、收藏及针对性提问
IEEE Journal on Selected Areas in Communications 2023年2月刊研究报道：面向多层级水下计算的环境感知AUV轨迹设计与资源管理作者与发表信息本研究的通讯作者为Beihang University的Jingjing Wang（高级会员，IEEE），研究团队包括清华大学侯祥旺（学生会员，IEEE）、王晶晶、白桐（会员，IEEE）、邓燕莎（高级会员，IEEE）、任勇（高级会员，IEEE）以及南安普顿大学的Lajos Hanzo（终身会士，IEEE）。该成果于2023年2月发表在《IEEE Journal on Selected Areas in Communications》（第41卷第2期）。
学术背景本研究属于水下物联网（Internet of Underwater Things, IoUT）与边缘计算交叉领域。由于水下电磁波衰减严重，传统射频通信技术难以适用，自主水下航行器（Autonomous Underwater Vehicle, AUV）成为水下数据收集的关键载体。然而，现有研究存在三个关键局限：
 1. 固定轨迹问题：传统AUV采用椭圆等固定轨迹，导致远离轨迹的IoUT设备需通过多跳通信汇聚数据，增加能耗（如文献[7]）；
 2. 环境因素忽略：现有轨迹优化仅考虑设备位置，未纳入水流速度、涡旋等动态环境影响（文献[8-10]）；
 3. 资源协同不足：AUV、水面站与IoUT设备的计算、通信、存储资源缺乏系统级整合。
针对这些问题，研究团队提出多层级水下计算（Multi-Tier Underwater Computing, MTUC）框架，旨在通过环境感知的AUV轨迹设计与资源管理最大化系统经济效益。
研究流程与方法1. 系统建模研究构建了包含水面站、AUV群和IoUT设备的三层网络架构：
 - 通信模型：采用浅水声学信道，综合考虑多径效应、多普勒效应和环境噪声。噪声模型包含湍流噪声（turbulence noise）、船舶噪声（shipping noise）、波浪噪声（waves noise）和热噪声（thermal noise），其功率谱密度通过公式(1)-(4)量化。
 - 缓存模型：水面站通过缓存热门任务数据（如公式(22)-(23)）减少回传延迟，约束条件为存储容量上限$Ce$。
 - 计算模型：任务$w{ki}$可本地处理或卸载至水面站，计算时间$t{ki}$包含传输时间$t^{da}{ki}$（设备→AUV）和$t^{as}{ki}$（AUV→水面站），以及水面站处理时间$t^{m}{ki}$（公式(24)-(30)）。
2. 轨迹优化AUV轨迹设计转化为马尔可夫决策过程（Markov Decision Process, MDP），创新点包括：
 - 流体动力学模型：基于Navier-Stokes方程构建涡流场模型（公式(43)-(47)），量化水流速度$v_c(p^a_j)$对AUV推进力的影响（公式(48)-(50)）；
 - 能耗模型：AUV能耗分为悬停（公式(55)-(56)）和移动（公式(57)-(60)）两部分，其中移动能耗通过三段式平均流速近似计算（公式(57)）。
3. 问题求解联合优化问题被建模为高维NP难问题（命题1证明见附录），研究采用异步优势演员-评论家（Asynchronous Advantage Actor-Critic, A3C）算法：
 - 状态空间（公式70）：包含AUV坐标、卸载策略、缓存策略等；
 - 动作空间（公式71）：联合优化卸载决策$o{ki}$、缓存策略$h{ki}$、带宽分配$r_{ki}$等；
 - 奖励函数（公式73）：以系统利润（收益-成本）为目标，收益来自延迟与能耗降低，成本包含计算与AUV运动能耗。
主要结果环境感知轨迹优势
 仿真显示，环境感知轨迹（图4(e)-4(h））相比传统设计（图4(a)-4(d））可避免涡流区域，系统利润提升23.6%（图5）。当AUV数量从1增至4时，利润提升显著，但超过5台后因边际效益递减而回落（图6）。
资源分配方案比较
任务卸载：优化卸载方案（Proposed）比全卸载（Full Offloading）和随机卸载（Random Offloading）利润分别高38.2%和72.5%（图7）；
 
数据缓存：智能缓存策略通过热点数据预存减少58%重复传输（图8）；
 
计算-通信协同：联合优化带宽与计算资源分配（Scheme 1）比单独优化方案（Scheme 2-3）利润高19.4%（图9）。
 
算法性能
 A3C在收敛速度与解质量上优于遗传算法（GA）、粒子群优化（PSO）和深度确定性策略梯度（DDPG）（图10）。自适应学习率策略（图11）进一步加速收敛。
 
结论与价值本研究首次提出MTUC框架，其科学价值体现在：
 1. 方法论创新：将流体动力学与强化学习结合，解决动态环境下的AUV轨迹优化；
 2. 系统级优化：首次联合考虑AUV轨迹、计算卸载、缓存与资源分配，突破传统设备中心或AUV中心设计的局限；
 3. 工程指导：为水下计算网络部署提供AUV数量配置准则（如300台设备需5台AUV）。
研究亮点环境感知建模：通过Lamb涡流模型量化水下环境对AUV能耗的影响；
 
经济驱动目标：以利润最大化为目标平衡服务质量与运营成本；
 
分布式求解：A3C算法支持高维问题的高效并行求解，代码开源促进领域发展。
 
其他价值研究者指出未来可拓展方向：
 - 水下设备故障概率建模；
 - 联邦学习降低声学通信开销；
 - 任务成功率的保障机制设计。
（报告字数：约1800字）
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问