基于卫星助力的6G广域边缘智能:面向远程物联网服务的动态感知任务卸载与资源分配

基于卫星助力的6G广域边缘智能

卫星支持的6G宽域边缘智能,面向远程物联网服务的动态感知任务卸载与资源分配

背景介绍

随着6G移动通信网络的到来,传统的物联网(IoT,Internet of Things)体系结构正逐渐向集成全球连接与广泛人工智能(AI)能力的智能万物互联(IoE,Internet of Everything)新范式转变。然而,地面网络在覆盖范围上存在局限性,尤其是在复杂地形和偏远地区无法实现全面覆盖。近地轨道(LEO,Low Earth Orbit)卫星的快速技术发展为解决这一问题带来了新的希望。通过非地面网络(NTN,Non-Terrestrial Networks)的支持,LEO卫星能够为全球用户提供无缝连接、大容量通信和高效计算服务,满足远程环境监控、智能农业等应用的需求。

但是,广域物联网应用带来了计算密集型任务处理的挑战,特别是当这些任务需实时响应时。传统方法涉及通过卫星将任务卸载到地面数据中心,然而,卫星与数据中心之间的传输延迟显著增加,不足以满足紧急任务的实时需求。多接入边缘计算(MEC,Multi-Access Edge Computing)的引入,为LEO卫星加装边缘计算服务器提供了可能性,从而通过在轨计算将任务计算能力移动到边缘侧以减少延迟。然而,LEO卫星网络的高动态时空特性(如卫星节点的高运动性和通信链路的间歇性)给任务卸载与资源分配带来了极大挑战。如何高效优化LEO支持的IoT网络中的任务卸载与资源分配,成为学术界亟待解决的重要问题。

正是在这样的背景下,Di Zhao, Rui Ding 和 Bin Song 等研究者提出了本文研究,并发表于《Science China Information Sciences》。通过引入时空注意力机制并结合深度强化学习(DRL,Deep Reinforcement Learning)技术,研究团队为任务卸载和资源分配问题设计了一种名为基于时空注意力的近端政策优化(STA-PPO,Spatio-Temporal Attention-Based Proximal Policy Optimization)算法,旨在动态环境下实现高效决策。


研究来源

本文标题为“Satellite-assisted 6G wide-area edge intelligence: Dynamics-aware task offloading and resource allocation for remote IoT services”,由Di Zhao(西安电子科技大学)、Rui Ding(China Satellite Network Group Co., Ltd.)和Bin Song(西安电子科技大学)共同撰写。论文发表于2025年2月《Science China Information Sciences》第68卷第2期,并于2025年1月初在线出版。

研究由国家重点研发项目和国家自然科学基金支持,涉及中国物联网与LEO卫星网络的前沿研究。


研究方法与工作流程

系统架构与模型设计

研究者提出了一个集成“云-边-设备”协作架构的动态LEO卫星支持的远程IoT网络。具体网络包括四层结构:

  1. 设备层:由传感器、控制器、执行器等IoT设备组成,负责执行实时监控或数据分析等计算密集型任务。
  2. 边缘层:由支持灵活负载和边缘计算服务器的LEO卫星组成,提供计算能力和网络接入。
  3. 云层:通过地面站连接核心网络,用于支持远程的大量数据计算。
  4. 服务层:支持多类型应用,如环境监控、智能农业等场景。

研究将任务卸载与资源分配问题视为一个混合整数非线性规划(MINLP,Mixed Integer Non-linear Programming)问题,结合强化学习的方法转化为顺序决策问题,并进一步定义为一个马尔科夫决策过程(MDP,Markov Decision Process)。

工作流程细节

  1. 时空动态建模
    论文定义了任务到达的时间动态(如任务到达频率的泊松分布特性)与LEO网络在空间上的拓扑动态(如卫星位置与覆盖范围的变化)。

  2. 问题分解与建模转化
    为了描述延迟控制约束,研究者分别建模了以下限制条件:

    • 覆盖延迟
    • 通信延迟与链路传输率
    • 计算延迟与任务分配计算能力的分布。

针对问题复杂性,研究者将联合优化问题转化为时间片中的序列决策问题,基于深度强化学习设计了解决框架。

  1. STA-PPO算法设计

    • 时序注意力机制(Temporal Attention Mechanism, TAM):用于分析任务到达的时间依赖性,从而动态决策任务卸载策略。
    • 空间注意力机制(Spatial Attention Mechanism, SAM):用于捕获LEO卫星的拓扑关系,评估基于空间动态的信息状态值。
    • 多Actor-Critic架构:分别针对覆盖、任务卸载、数据传输以及任务计算进行网络设计并嵌入注意力机制。
  2. 仿真实验
    模拟场景覆盖对星链(Starlink)卫星的覆盖区域,共1584颗卫星均匀分布于72个轨道平面,观测从不同IoT设备启动到任务完成的系统效率。关键参数(如星载设备的CPU性能、IoT设备的任务大小与频率)经过精细设计并分析。


实验结果与研究发现

  1. 系统延迟表现
    STA-PPO算法达到最低平均系统延迟,与随机基线算法相比减少约66%,与普通PPO算法相比减少23%以上,显示其处理任务动态波动的适应能力。

  2. 任务卸载比的优化
    最优算法在任务到达局部装置的比例减少的同时,显著增加了边缘侧和云计算侧的卸载比例,成功缓解了设备的计算压力。

  3. 链路吞吐量与网络吞吐量提升
    该算法最大化了带宽资源利用率,显著提高了上下行链路吞吐量,尤其在高负载任务到达率(λ=7或8时)下,表现出色,网络吞吐量最高提升至原有策略的19%左右。

  4. 动态场景的鲁棒性验证
    不同卫星覆盖场景的仿真表明,即使面临大规模动态变化(如卫星拓扑频繁切换或者任务流量爆发增高),STA-PPO仍能保持优异性能,基本满足先进6G网络对实时性和高效性的要求。


研究意义与亮点

  1. 新颖算法设计
    STA-PPO算法首次将时空注意力机制与强化学习相结合,为Highly-Dynamic的LEO网络提供了高效任务卸载与资源分配策略。

  2. 低延迟优势
    本研究成功回应了物联网高负载任务实时计算的挑战,大幅提升系统效率。

  3. 大规模应用潜力
    研究结果为未来基站结构从地面到“天基协作”演变,尤其是农业监控或偏远环境灾害应急响应等领域的数据处理与网络部署提供了坚实理论支持。

通过考虑LEO卫星网络的动态特性,本研究进一步推动了6G宽域边缘智能的发展,为远程IoT服务提供了高效的技术解决方案。未来的研究或可与无人机轨迹优化、多载波网络协作等多维技术进行整合,探讨更全面的天基边缘计算方法。