分享自:

基于DRL的无线供电多AP边缘计算计算速率最大化

期刊:IEEE Transactions on CommunicationsDOI:10.1109/TCOMM.2023.3325905

本文档属于类型a,即报告了一项原创研究。以下是基于文档内容生成的学术报告:


作者及机构
本文的主要作者包括Shubin Zhang、Senlei Bao、Kaikai Chi(IEEE高级会员)、Keping Yu(IEEE会员)和Shahid Mumtaz(IEEE高级会员)。Shubin Zhang、Senlei Bao和Kaikai Chi来自浙江工业大学计算机科学与技术学院;Keping Yu分别隶属于日本法政大学研究生院与日本理化学研究所先进智能项目中心;Shahid Mumtaz则来自波兰西里西亚工业大学应用信息学系与英国诺丁汉特伦大学工程学院。该研究发表于2024年2月的《IEEE Transactions on Communications》第72卷第2期。

学术背景
本研究的主要科学领域为无线供电边缘计算(Wireless Powered Edge Computing, WPEC)与深度强化学习(Deep Reinforcement Learning, DRL)。随着5G和6G时代的到来,物联网(Internet of Things, IoT)设备在工业生产和日常生活中扮演着越来越重要的角色。然而,受限于电池容量和计算能力,传统的IoT设备难以满足数据驱动的人工智能技术带来的高计算需求。无线能量传输(Wireless Power Transfer, WPT)与边缘计算(Mobile Edge Computing, MEC)的结合被视为解决这一困境的有效方案。然而,在多个混合接入点(Hybrid Access Points, HAPs)的网络中,如何高效地进行任务卸载决策和资源分配仍然是一个挑战。本研究旨在解决这一问题,提出了基于DRL的算法以最大化无线供电IoT网络的总计算速率(Sum Computation Rate, SCR)。

研究流程
研究流程主要包括以下几个步骤:

  1. 问题建模
    研究首先将SCR最大化问题建模为一个混合整数非线性规划问题(Mixed-Integer Nonlinear Programming, MINLP)。为了高效求解,该问题被分解为两个子问题:任务卸载决策优化问题(Top-Problem)和给定卸载决策下的时间分配优化问题(Sub-Problem)。

  2. 任务卸载决策优化
    研究者提出了一种基于DRL的算法来生成近优的任务卸载决策。具体而言,设计了一个深度神经网络(Deep Neural Network, DNN)框架,输入为当前时隙的信道增益,输出为每个IoT设备的卸载决策概率分布。通过随机采样,确定每个设备是本地计算还是将数据卸载到某个HAP。为了训练DNN,研究者设置了一个基线效用值,用于评估卸载决策的好坏,并采用策略梯度方法更新DNN参数。

  3. 时间资源分配优化
    在给定卸载决策的情况下,研究者设计了一种基于拉格朗日对偶方法(Lagrangian Duality Method)的低复杂度算法,以优化时间分配。该算法通过二分搜索法求解拉格朗日乘子,并进一步计算最优的时间分配方案。

  4. 仿真验证
    研究者通过仿真验证了所提算法的性能。仿真参数包括HAP的发射功率、能量捕获效率、带宽等。仿真结果表明,所提算法能够以低复杂度实现超过95%的最大计算速率,并且在收敛速度、计算速率和运行时间方面优于常见的Actor-Critic算法。

主要结果
1. 任务卸载决策优化结果
基于DRL的算法能够快速收敛,并在多个HAP和IoT设备的场景下生成近优的卸载决策。仿真结果显示,该算法在收敛速度和计算速率方面优于传统的Actor-Critic算法。

  1. 时间资源分配优化结果
    所提的拉格朗日对偶方法能够高效地求解时间分配问题,确保每个设备获得最优的时间资源。仿真结果表明,该算法在复杂度和计算效率方面表现优异。

  2. 整体性能
    与穷举搜索(Exhaustive Search, ES)方法相比,所提算法能够实现超过95%的最大计算速率,同时显著降低了计算复杂度。此外,随着HAP数量的增加,网络的计算速率显著提升,验证了多HAP方案的有效性。

结论
本研究提出了一种基于DRL的算法,用于解决无线供电边缘计算网络中多个HAP和IoT设备的SCR最大化问题。通过将问题分解为任务卸载决策优化和时间资源分配优化,研究者设计了一种高效的算法框架。仿真结果表明,该算法在计算速率、收敛速度和运行时间方面具有显著优势。本研究的科学价值在于为多HAP场景下的任务卸载和资源分配问题提供了一种新的解决方案,具有重要的应用价值,特别是在大规模IoT网络中。

研究亮点
1. 创新性方法
本研究首次将DRL应用于多HAP场景下的任务卸载决策优化,显著降低了决策空间的复杂度。

  1. 高效算法
    提出的拉格朗日对偶方法在时间资源分配优化中表现出色,能够在低复杂度下获得最优解。

  2. 广泛适用性
    所提算法适用于大规模IoT网络,能够有效提升网络的计算效率和资源利用率。

其他有价值的内容
1. 仿真验证的全面性
研究者通过大量仿真实验验证了算法的性能,涵盖了不同HAP数量、IoT设备数量以及信道条件下的场景。

  1. 与现有算法的对比
    本研究与监督学习(Supervised Learning)、深度Q网络(Deep Q-Network, DQN)和Actor-Critic算法进行了对比,进一步凸显了所提算法的优势。

  2. 未来研究方向
    研究者指出,未来可以进一步改进DRL算法以提升性能,并探索更复杂的场景,如考虑反馈、边缘处理延迟和长期优化等问题。


以上为基于文档内容生成的学术报告,详细介绍了研究的背景、流程、结果及其意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com