基于贝叶斯优化的深度学习应用多模型边缘计算卸载框架学术研究报告
一、 主要作者、所属机构及发表信息
本研究由河北大学网络安全与计算机学院的Zidi Zhao、Hong Zhang(通讯作者)、Haijun Huang以及美国中佛罗里达大学计算机科学系的Liqiang Wang合作完成。研究成果以题为“A Multimodel Edge Computing Offloading Framework for Deep-Learning Application Based on Bayesian Optimization”的论文形式,发表于国际权威期刊《IEEE Internet of Things Journal》第10卷第20期,发表日期为2023年10月15日。文章的数字对象标识符为10.1109/JIOT.2023.3280162。
二、 研究的学术背景与目标
本研究隶属于物联网与边缘计算交叉领域,具体聚焦于人工智能应用在异构边缘计算环境中的任务卸载问题。随着物联网设备数量和种类的爆炸式增长,以及5G等技术的推动,海量、时敏的数据(如流媒体视频)不断产生。传统的云计算模式在处理这些任务时,面临网络资源有限、传输延迟高、隐私泄露等挑战。边缘计算通过将计算资源从云端下沉到网络边缘,有效缓解了上述问题。与此同时,深度学习应用的普及使得越来越多的终端设备嵌入了人工智能处理器,提升了边缘端的处理能力。
然而,在异构的边缘计算环境中(包含不同计算能力的终端设备和边缘服务器),如何为深度学习任务(如人脸检测)做出高效的卸载决策,仍然是一个尚未充分研究的复杂问题。当前研究存在几个关键挑战:1)模型选择:单一的深度学习模型难以适配所有异构计算平台;2)精度与效率的权衡:任务负载动态变化时,难以在模型精度和处理效率间取得平衡;3)卸载算法复杂:随着计算规模扩大,元启发式、深度强化学习等算法变得复杂且调参耗时;4)能量供应:如何在多个时间槽之间维持能量队列的稳定是一个关键问题。
针对这些挑战,本研究旨在提出一个创新的解决方案。其核心目标是:构建一个多模型边缘计算卸载框架,为深度学习应用(以人脸检测为例)制定二进制计算卸载决策,在保证任务精度的前提下,最小化系统的总成本(包括响应时间和能耗),并确保长时间运行过程中能量队列的稳定性。
三、 研究详细工作流程
本研究的工作流程可以系统地分为以下几个主要步骤:
第一步:构建异构边缘计算实验环境与模型准备。 研究团队首先搭建了一个模拟真实边缘计算环境的实验平台。该平台包含两类硬件:嵌入式边缘设备(即终端设备),采用NVIDIA Jetson系列的Jetson TX2, Jetson Xavier NX, 和Jetson Nano;边缘服务器,采用GeForce RTX系列的RTX 3080和RTX 2080 GPU服务器。这些设备在计算性能和功耗上存在显著差异,构成了一个典型的异构计算环境。
在软件和模型层面,研究选择了基于RetinaFace的单发人脸检测模型,并为其配备了五种不同的骨干网络:MobileNet0.25, MobileNetV3, GhostNet, ShuffleNetV2和ResNet50。这些模型的复杂度和精度各不相同。研究人员在RTX 3080服务器上使用WIDER FACE数据集对所有模型进行了训练和评估,获取了每个模型在简单、中等、困难三种任务难度级别下的精度数据。同时,在实际的Jetson设备和RTX服务器上,详尽测试并记录了每个模型在不同硬件上执行单张图片人脸检测推理的响应时间。此外,根据设备额定功率和实测数据,设定了本地计算功率、边缘服务器计算功率和数据传输功率。
第二步:建立系统模型与问题形式化。 研究提出了一个包含多台边缘服务器和多个嵌入式终端设备的多对多卸载框架。框架中,终端设备可以本地执行任务,也可以将任务卸载到任一边缘服务器上,而每台服务器部署了全部五种模型可供选择。任务在时间槽内随机生成。
研究定义了两个关键的二进制卸载指示变量:a_n表示任务是在终端设备n本地执行还是卸载到服务器m;b_m_n^k表示如果任务卸载到服务器m,具体选择使用哪个模型k。这些变量构成了一个二进制卸载决策矩阵。基于此,可以计算出在特定决策下,所有任务在单个时间槽内的总响应时间和总能耗,并将它们加权合并为需要最小化的总成本目标函数。该优化问题受到一系列约束,包括:每个任务只能在一个位置执行、模型选择需满足不同任务负载下的最低精度要求、任务完成时间和能耗不能超过上限等。
第三步:提出并实施改进的贝叶斯优化算法(MTPE)。 为了解决上述复杂的离散优化问题,本研究没有采用参数多、训练慢的深度强化学习方法,而是引入了改进的树状结构Parzen估计器算法。标准的TPE算法是一种序列化的基于模型的贝叶斯优化方法,它通过历史观测值构建概率模型来指导下一次采样点的选择,特别适合黑箱优化问题。
本研究对标准TPE进行了两项关键改进,形成了MTPE算法(算法1): 1. 智能初始化:考虑到边缘服务器通常比终端设备快得多,在初始化候选解时,不是完全随机生成,而是设定一个策略(基于实验的50-50策略),让一定比例(50%)的任务默认卸载到服务器。这极大地减少了找到较优解所需的迭代次数。 2. 动态量化调整:为了避免算法过早陷入局部最优,让划分“好”解与“坏”解的分位数γ动态变化。如果当前迭代找到的解优于前一次,则按一定比例降低γ,使得算法在后续迭代中能以更严格的标准筛选“好”解,从而增强全局探索能力。
MTPE算法将卸载决策矩阵的配置视为需要优化的超参数,通过不断迭代评估目标函数值,寻找使总成本最小化的最优卸载策略。
第四步:设计跨时间槽的能量队列稳定算法。 为了确保系统在连续多个时间槽运行过程中的能量可持续性,研究引入了李雅普诺夫优化理论。研究人员构建了一个动态能量队列模型,其中每个时间槽结束时的剩余能量等于上一时刻能量减去本时间槽总能耗再加上本时间段内补充的能量。
目标是最小化李雅普诺夫漂移函数的上界,从而保持能量队列的稳定。通过数学推导(见原文公式21),该问题被转化为一个以补充能量为自变量的一元二次函数求最小值问题。最终,得到了一个闭式解(公式22),用于计算在每个时间槽结束时需要补充的最优能量值,以及为了在整个处理周期内保持能量充足所需的初始能量范围。这一部分工作被总结为动态能量调整算法(算法2),它与MTPE算法协同工作,分别处理单个时间槽内的成本优化和跨时间槽的能量稳定问题。
第五步:进行综合实验与对比分析。 研究设计了一系列实验来验证所提框架和算法的有效性。实验变量包括:终端设备数量(从12到60)、部署在服务器上的模型数量(从1到5)、任务复杂度(简单、中等、困难)、以及目标函数中时间和能耗的权重α。对比的基线算法包括:随机搜索、标准TPE算法、双重深度Q网络算法、两种元启发式算法(EGAPSO和模拟退火SA)。
四、 研究的主要结果
结果1:模型性能基准测试。 在WIDER FACE数据集上的测试证实,不同骨干网络的模型在精度和速度上存在显著权衡。ResNet50在三种难度级别下都保持最高精度(尤其是困难任务下仍达84.43%),但其在Jetson等终端设备上的推理延迟极高(超过2秒),不适合本地部署。轻量级模型(如MobileNet0.25)速度最快,但精度,尤其在困难任务下,下降明显。在RTX服务器上,所有模型的推理速度都很快且差异较小,使得ResNet50在边缘侧具备了高精度与低延迟的双重优势。这支撑了在多模型框架中,在终端部署轻量级模型,在服务器部署包括ResNet50在内的多种模型的合理性。
结果2:多模型框架与边缘协同的有效性。 实验表明,随着终端设备数量增加,所有方案的总成本都会上升。但“终端-边缘协同” 计算方案的总成本,显著低于“全部本地计算”或“全部卸载到服务器”的方案,分别平均降低了54.03%和36.10%。这强有力地证明了边缘计算在降低系统总成本方面的价值。此外,增加服务器端部署的模型数量能进一步降低成本。与仅部署单模型(ResNet50)的框架相比,部署5个模型的框架平均降低了17.94%的总成本,在设备数为60时降低幅度最大(达21.86%)。这表明辅助部署轻量级模型能有效分担计算负担,尤其在任务繁重时效果更明显。
结果3:MTPE算法的优越性能。 收敛性实验显示,MTPE算法比标准TPE收敛更快,且能找到更优的解。权重α实验揭示了时间和能耗的权衡关系:α较大(侧重时间)时,边缘服务器更有助于降低成本;α较小(侧重能耗)时,本地计算更有优势;而MTPE算法指导下的协同方案能在各种权重设置下保持稳定且较低的总成本。最重要的对比实验结果显示,MTPE算法在求解卸载决策问题时表现最佳。与随机搜索、DDQN、TPE、EGAPSO和SA相比,MTPE平均分别降低了37.79%、23.01%、3.14%、20.09%和19.90%的总成本。这证明了MTPE能以更少的初始化参数和迭代次数,高效地找到接近全局最优的卸载策略。
结果4:模型选择与能量管理的有效性。 在不同任务复杂度下,MTPE算法能智能地选择模型。在简单任务级别,所有5个模型都可能被选用;随着任务变复杂,为满足精度阈值,可选的模型数量减少;在困难任务级别,基本上只有高精度的ResNet50被选用。这实现了精度与效率的动态平衡。同时,结合李雅普诺夫优化的能量调整算法,能够理论计算出维持系统长期稳定运行所需的能量补充策略。
五、 研究的结论与价值
本研究的结论是:所提出的基于MTPE算法的多模型边缘计算卸载框架,能够有效解决异构边缘环境中深度学习任务的卸载决策问题。该框架通过在边缘服务器部署多种模型,实现了任务精度与处理效率的智能权衡;通过改进的贝叶斯优化算法,以较低的迭代成本找到了最小化系统响应时间和能耗的近似最优解;通过李雅普诺夫优化,确保了系统能量队列在长期运行中的稳定性。实验验证了该框架在降低总成本、保证任务精度和提升算法效率方面的显著优势。
本研究的价值体现在: 1. 科学价值:为解决边缘计算中复杂的多目标、离散化、动态卸载决策问题提供了一种新颖且高效的思路。将多模型部署、改进的贝叶斯优化(MTPE)与李雅普诺夫能量管理三者结合,构成了一个理论严谨、方法创新的系统化解决方案,丰富了边缘智能任务调度的理论体系。 2. 应用价值:研究基于真实的硬件平台(NVIDIA Jetson和RTX GPU)和实际AI应用(人脸检测),使得方案具有很强的实用性和可复现性。该框架可广泛应用于智能监控、自动驾驶、移动医疗等对延迟、精度和能耗有严格要求的物联网场景,助力构建更智能、更高效、更可持续的边缘计算环境。
六、 研究的亮点
七、 其他有价值的要点
研究在相关工作综述部分,清晰地将现有研究分为“边缘智能”(AI应用在边缘)和“智能边缘”(边缘系统的智能调度)两大类,并指出当前工作大多只关注单模型或未充分考虑精度与效率的权衡,这为本研究的创新点提供了清晰的定位。此外,研究明确指出了未来工作方向,如关注边缘设备上的容器调度与迁移以实现负载均衡,这为进一步研究指明了有价值的路径。