分享自:

基于SCMA的空天地一体化网络中联合动态计算卸载与资源分配研究

期刊:IEEE Transactions on Cognitive Communications and NetworkingDOI:10.1109/TCCN.2026.3662334

基于SCMA的空天地一体化网络动态计算卸载与资源联合优化研究学术报告

一、 作者、机构与发表信息

本项研究的主要作者包括Pengtao Liu、Kang An、Jing Lei(通讯作者)、Yifu Sun、Wei Liu以及Symeon Chatzinotas (IEEE Fellow)。研究团队主要来自中国国防科学技术大学电子科学与技术学院(Pengtao Liu, Jing Lei, Wei Liu)和第六十三研究所(Kang An, Yifu Sun),以及希腊“Demokritos”国家科学研究中心(Symeon Chatzinotas)。这项研究成果以题为《Joint Dynamic Computation Offloading and Resource Allocation in SCMA-Aided Space–Air–Ground Integrated Network》的论文形式,发表于IEEE Transactions on Cognitive Communications and Networking期刊,于2026年2月9日在线发表,2026年2月17日出版当前版本(第12卷)。

二、 研究背景与目的

本研究的核心科学领域是第六代移动通信(6G)背景下的空天地一体化网络(Space-Air-Ground Integrated Network, SAGIN)与移动边缘计算(Mobile Edge Computing, MEC)的融合。SAGIN通过整合卫星(空间)、无人机(Uncrewed Aerial Vehicles, UAVs, 空中)和地面节点,旨在为全球,尤其是偏远或地面基础设施受损的区域(如灾区),提供无缝的广域无线连接和强大的计算服务。与此同时,物联网(Internet of Things, IoT)设备产生的计算密集型应用(如图像识别)受限于自身有限的计算能力,亟需通过计算卸载(Computation Offloading)到网络边缘(如UAV或卫星上的MEC服务器)来高效处理。

然而,在动态的SAGIN环境中实现高效计算卸载面临多重挑战。首先,IoT设备任务到达、卸载和处理的过程具有动态时变性,需要从长期性能角度进行优化,这导致了长期任务队列稳定性约束与短期卸载决策之间的强耦合。其次,由于IoT用户和UAV的动态移动性,设计合理的用户-UAV关联至关重要。再者,为提升网络连接密度并缓解频谱稀缺,论文采用了稀疏码多址(Sparse Code Multiple Access, SCMA)这一非正交多址(Non-Orthogonal Multiple Access, NOMA)技术。SCMA码本分配和功率分配对于控制干扰、提升能效具有关键作用。最后,UAV和卫星平台上的计算资源需要与任务卸载决策和通信资源进行有效协同优化。

因此,本研究的主要目标是:在动态的SCMA辅助SAGIN框架下,通过联合优化动态计算卸载与多维资源(包括用户-UAV关联、SCMA码本、发射功率、边缘计算资源)分配,在保证长期任务队列稳定的约束下,最大化所有IoT设备的长期能量效率(定义为系统任务吞吐量与总能耗之比)。

三、 研究方法与详细流程

本研究将上述复杂的长期随机优化问题分解为一系列可在线处理的单时隙确定性子问题,并提出了层次化的解决方案。整体工作流程可概括为以下几个核心步骤:

  1. 问题建模与李雅普诺夫(Lyapunov)优化框架构建

    • 研究对象与模型:系统模型包含一个低地球轨道(Low Earth Orbit, LEO)卫星(作为广域覆盖的MEC服务器)、多个搭载MEC服务器的UAV以及大量随机移动的IoT设备。研究在离散时隙(n = 1, 2, …, N)上进行。
    • 动态过程建模:为每个IoT用户建立了本地、UAV卸载、卫星卸载三个任务队列,并分别为UAV和卫星端建立了对应的计算队列。模型考虑了部分卸载,即每个任务可分割为本地计算、卸载至UAV计算和卸载至卫星计算三部分。
    • 问题形式化:将长期能量效率最大化问题形式化为一个随机优化问题,约束条件包括用户-UAV关联变量、任务卸载比例、SCMA码本分配、发射功率限制、本地及边缘计算资源限制,以及关键的长期平均任务时延(等价于所有队列稳定)约束。
    • 问题转化:为解决长期队列稳定性约束带来的挑战,研究采用李雅普诺夫随机优化方法。通过定义包含所有任务队列的Lyapunov函数及其漂移,将原始长期优化问题转化为每个时隙最小化“漂移加惩罚”(Drift-plus-Penalty)函数上界的单时隙确定性优化问题。这一转化成功地将复杂的长期约束解耦,使得算法仅需当前时隙的队列状态信息即可做出决策。
  2. 基于交替优化(Alternating Optimization, AO)的联合算法设计(TORA-AO): 由于优化变量(如任务卸载决策与资源分配)相互耦合,论文提出了一个交替优化的框架,依次求解以下子问题:

    • 步骤A:动态UAV-用户关联。此步骤相对独立,目标是使每个UAV服务于离它最近的一组用户,同时考虑SCMA码本数量限制每个集群的最大用户数。论文创新性地提出了一个带约束的K均值聚类算法(Constrained K-means Clustering)。该算法在标准K均值的基础上,加入了动态噪声点检测机制(基于“三西格玛法则”),并引入了UAV位置周期性更新与轨迹平滑策略(结合当前聚类中心和历史位置信息加权),以在提升服务效率与避免UAV无效能耗间取得平衡。
    • 步骤B:SCMA码本分配。在给定用户-UAV关联和任务卸载决策后,码本分配问题简化为最大化用户总传输速率。为此,论文提出了一种基于交换匹配博弈(Swap Matching Games, SMG)的算法。算法将用户和码本视为双边匹配参与者,用户偏好于能提供更高传输速率的码本。通过允许配对的用户交换其码本,并以提升总速率为接受准则,迭代地进行交换操作直至无法改善,从而获得高效的码本分配方案。
    • 步骤C:功率与计算资源分配。在给定其他变量的情况下,论文通过数学推导,分别得到了IoT设备向UAV发射功率、向卫星发射功率、本地计算频率、UAV计算资源分配、卫星计算资源分配的闭式解或准闭式解。例如,发射功率的最优解呈现为分段函数形式,存在一个由队列状态和信道条件决定的阈值功率。对于UAV和卫星的计算资源分配,论文将其建模为一个凸优化问题,并利用拉格朗日乘子法求解,进而设计了一个队列感知的边缘计算资源分配迭代算法,根据用户队列是否饱和来分类优化。
    • 步骤D:任务卸载决策。在给定资源分配方案后,任务卸载决策的优化目标关于卸载比例是线性的,且约束为单纯形。论文指出最优解必然在顶点处取得,并提出了一种高效的顶点切换算法(Vertex-Switching Algorithm)。该算法从一个可行顶点开始,探索其相邻顶点(即仅一个卸载比例分量不同的顶点),若相邻顶点能改善目标函数则切换过去,如此迭代直至找不到更优的相邻顶点,从而快速找到最优卸载决策。
    • 交替优化流程:以上步骤B、C、D相互依赖(例如,计算卸载决策需要已知传输速率,而速率又取决于功率和码本分配)。因此,TORA-AO算法在一个时隙内,固定一些变量,优化另一些变量,如此交替迭代(B->C->D->C->B…)直至收敛或达到最大迭代次数。
  3. 基于深度强化学习(Deep Reinforcement Learning, DRL)的高效算法设计(TORA-TD3): 虽然TORA-AO能提供高质量的解决方案,但其交替迭代过程带来了较高的计算复杂度。为显著降低运行时间,论文进一步提出了一种基于双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient, TD3)的DRL算法(TORA-TD3)。

    • 马尔可夫决策过程(MDP)建模:将每个IoT设备视为一个智能体(Agent)。状态(State) 为归一化的本地、UAV、卫星三个任务队列的积压以及当前任务的数据量和计算密度。动作(Action) 为两个连续值,通过映射转换为满足求和为1的三个卸载比例。奖励(Reward) 设置为与单时隙优化目标(-obj(n))对齐的归一化值。
    • 网络结构与训练:采用Actor-Critic框架,每个智能体有一个Actor网络(输出动作)和两个Critic网络(评估Q值,TD3使用双Critic以缓解Q值高估)。智能体通过与仿真环境交互(离线训练)来学习最优的任务卸载策略。训练完成后,在每个时隙,智能体只需根据当前状态前向通过一次Actor网络即可做出决策,无需迭代。
    • 与AO的协同:在TORA-TD3中,DRL仅负责学习任务卸载决策。一旦卸载决策确定,资源分配(步骤A、B、C)仍使用论文推导出的高效闭式解或快速算法。这种“DRL决策 + 模型驱动资源分配”的混合架构,既利用了DRL处理复杂决策的能力,又保证了资源分配部分的效率和可解释性。

四、 主要研究结果与分析

研究通过大量仿真实验验证了所提算法的性能,并与多种基准方案进行了对比。

  1. 算法组件有效性验证

    • 提出的带约束K均值算法能有效将用户动态分簇,并服务于最近邻用户,同时通过调整UAV位置更新间隔实现了轨迹平滑。
    • 基于SMG的SCMA码本分配算法在动态时隙内持续优于Gale-Shapley、双向匹配、固定用户顺序和随机分配等基准方案,平均和速率提升显著(例如,比随机分配高6.74%)。
    • Lyapunov框架下的队列稳定性:仿真显示,所有任务队列(本地、UAV卸载、卫星卸载、UAV计算、卫星计算)的积压长度随时间先增长后趋于平稳,且呈现交替增减的趋势,证明了所提算法能有效平衡各队列负载,确保长期稳定性。
  2. 整体方案性能对比: 将所提的Lyapunov引导的SAGIN框架(采用TORA-AO或TORA-TD3)与七种基准方案对比,包括:仅UAV方案、仅卫星方案、仅本地计算、全卸载方案、随机资源分配、随机任务卸载、以及使用正交多址(Orthogonal Multiple Access, OMA)替代SCMA的方案。

    • 任务队列稳定性:所提方案的总任务队列积压最终趋于稳定,而其他基准方案(尤其是仅本地计算和全卸载方案)的队列持续增长,表明其无法处理动态任务负载,系统不稳定。
    • 任务吞吐量:所提方案在100个时隙后达到的平均任务吞吐量(7.93×10^6 bits)显著高于所有基准方案。例如,比随机卸载高10.6%,比OMA方案高25.3%。
    • 能量消耗:所提方案实现了较低的总能量消耗(54.23 J),比随机资源分配方案低13.6%,比随机卸载方案低9.2%,证明了联合优化的有效性。
    • 能量效率:这是核心优化目标。所提方案的能量效率(1.46×10^5 bits/J)远超其他方案,最高可达基准方案的近三倍,清晰地证明了其在权衡吞吐量与能耗方面的优越性。
  3. 参数影响与权衡分析

    • Lyapunov参数V的影响:参数V控制着优化目标(能量效率)与队列稳定性之间的权衡。仿真表明,随着V增大,平均能量效率提升,但代价是任务队列积压(以及相应的平均服务时延)增加。这验证了理论分析中关于O(1/V)和O(V)的权衡关系。通过调整V,可以使平均任务时延满足预设的截止时间要求。
    • TORA-TD3与TORA-AO的性能与效率对比
      • 性能接近性:TORA-TD3在训练收敛后,其能量效率中位数达到1.429×10^5 bits/J,仅比TORA-AO的最优解(1.463×10^5 bits/J)低约2.3%。在其他指标如任务吞吐量和能耗上也表现相近。
      • 运行时间大幅降低:TORA-TD3的平均运行时间(1.122秒处理100时隙)比TORA-AO(3.914秒)减少了约71.3%。这意味着每个策略生成时间从约39.1毫秒降至11.2毫秒,更适合实际部署。
      • 收敛性与稳定性:TORA-TD3在训练过程中能量效率稳定上升并收敛,且其性能波动小于另一种对比的DRL算法(TORA-DRL),显示了TD3算法的优越性。

五、 研究结论与价值

本研究成功设计并优化了一个动态的、基于SCMA的空天地一体化网络框架,旨在最大化IoT设备的长期能量效率。通过引入李雅普诺夫优化理论,将复杂的长期随机优化问题解耦为可在线求解的单时隙问题。针对解耦后的子问题,论文创新性地提出了一系列高效算法:基于约束K均值的动态用户关联、基于交换匹配博弈的SCMA码本分配、具有闭式解的功率与计算资源分配、基于顶点切换的任务卸载决策,并集成为交替优化算法(TORA-AO)。为进一步降低复杂度,论文还提出了基于TD3深度强化学习的混合算法(TORA-TD3),该算法以一次前向传播替代多次迭代,在保持接近最优性能的同时,显著减少了约70%的运行时间。

本研究的科学价值在于为动态、资源受限的SAGIN-MEC系统提供了一套完整的、理论支撑的联合优化方法论。它深刻处理了长期队列稳定性与短期决策、通信与计算资源、正交与非正交接入等多维度耦合挑战。所提出的混合优化方法(模型推导与数据驱动结合)对相关领域的研究具有借鉴意义。

应用价值突出体现在为未来6G网络中,在应急通信、偏远地区覆盖等场景下,部署高效、节能、稳定的海量物联网计算服务提供了可行的技术方案和算法支撑。仿真结果证明了该方案在提升网络吞吐量、降低设备能耗、保障服务质量方面的显著优势。

六、 研究亮点

  1. 问题新颖性与系统性:率先在动态SCMA辅助的SAGIN框架下,研究长期能量效率最大化问题,系统性地考虑了从用户关联、多址接入、功率控制到边缘计算资源调度的全链路联合优化。
  2. 理论方法的创新:巧妙运用李雅普诺夫优化处理长期队列稳定性约束,将原问题转化为可跟踪的单时隙问题。在资源分配子问题上推导出大量闭式或准闭式解,保证了算法的效率和最优性。
  3. 算法设计的精巧性:提出的带约束K均值基于交换匹配的SCMA分配队列感知的边缘资源分配顶点切换卸载决策等一系列算法,各自针对子问题特点设计,兼具高效与性能。
  4. 混合架构的高效性:提出的TORA-TD3算法创新性地采用“DRL学习卸载决策 + 模型驱动执行资源分配”的混合架构,在几乎不损失性能的前提下,极大提升了决策速度,为实际系统的在线应用提供了可能。
  5. 详实的验证与深入分析:通过全面的仿真,不仅验证了所提方案相对于多种基准方案的全面优势,还深入分析了关键参数(如V)的影响,揭示了能量效率与延迟之间的内在权衡,并定量比较了AO与DRL两种方法在性能与效率上的差异。

七、 其他有价值内容

论文在附录中提供了定理1(Lyapunov漂移上界)和定理2(算法性能界)的详细证明。定理2从理论上保证了所提算法解与最优解之间的间隙为O(1/V),且所有队列稳定并有明确的上界,这为算法的可靠性提供了坚实的理论基石。此外,论文还展望了未来的研究方向,如开发更高效的SCMA子载波分配策略、建立更大时间尺度下的LEO卫星动态模型、优化UAV轨迹以降低飞行能耗,以及应用多智能体强化学习和图神经网络进行网络拓扑优化等,为后续研究指明了潜在路径。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com