分享自:

SDN中基于模型划分的云边协同推理算法

期刊:兰州工业学院学报

学术研究报告:SDN中基于模型划分的云边协同推理算法

作者及发表信息
本研究由安徽理工大学计算机科学与工程学院的许浩(硕士生)与朱晓娟(副教授、博士)合作完成,论文《SDN中基于模型划分的云边协同推理算法》发表于《兰州工业学院学报》2023年12月第30卷第6期,文章编号为1009-2269(2023)06-0031-07。


学术背景

研究领域与动机
随着深度神经网络(Deep Neural Network, DNN)在计算机视觉、自然语言处理等领域的广泛应用,其计算密集性导致单一云端或边缘节点推理时存在时延高、资源利用率低等问题。传统云边协同方案(如分布式推理算法)虽能缓解云端负载,但难以应对动态网络环境和任务需求的变化。因此,本研究提出结合软件定义网络(Software Defined Network, SDN)与深度强化学习(Deep Reinforcement Learning, DRL)的协同推理算法(SDN-CEP),旨在优化时延与资源分配。

背景知识
1. 云边协同:通过将部分计算任务卸载到边缘节点,减少云端压力,但需解决动态环境下的任务划分与资源调度问题。
2. SDN技术:通过集中控制器实现网络状态全局感知,为动态资源分配提供支持。
3. 模型划分:将DNN模型按层拆分,结合边缘节点算力分布实现协同推理。

研究目标
开发一种自适应算法,在动态网络环境下实现低时延、高资源利用率的DNN推理,同时避免模型精度损失。


研究流程与方法

1. 系统架构设计

研究构建了基于SDN的云边协同框架(图1),包含以下核心模块:
- 任务预测器:通过复杂度评分函数( q(x) \in [0,1] )判断输入数据复杂度,若评分超过阈值δ则卸载至云端,否则由边缘节点处理(式1)。
- 模型划分与卸载:采用深度Q网络(Deep Q-Network, DQN)算法,将DNN模型划分为多个层,根据网络带宽、边缘节点资源等状态动态选择最优划分点(图3)。
- SDN全局视图:通过南向接口屏蔽设备差异,北向接口按需配置资源,实现任务与资源的全局调度。

2. 算法实现

  • 状态空间建模:定义为( S = {b, es, d} ),包含网络带宽( b )、边缘节点资源( es )及模型层输出数据大小( d )。
  • 动作空间:包括模型划分点选择与边缘节点分配(式2)。
  • 奖励函数:以时延和计算成本为优化目标,设计( r = -((1-\omega)t{all} + \omega c{all}) ),权重因子( \omega )通过时延与代价上界动态调整。
  • 训练过程:使用双网络结构的DQN算法,通过均方误差损失函数(式4)更新策略,结合SDN全局视图实时调整网络状态。

3. 实验验证

  • 平台与参数:基于EdgeCloudSim仿真环境,测试ResNet、AlexNet、GoogLeNet等模型,对比以下方法:
    • 仅云计算(OC)、仅边缘计算(OE)
    • Neurosurgeon(NN,基于模型划分的动态选择)
    • DPTO(基于DRL的按需划分算法)
  • 评估指标:推理时延(式5-9)、计算成本(式10-13)。

主要结果

  1. 时延优化

    • 在网络带宽变化时,SDN-CEP的时延显著低于NN与DPTO(图5a)。例如,AlexNet模型在带宽50Mbps时,SDN-CEP时延降低约23%。
    • 任务数量增加时,SDN-CEP通过动态调度保持稳定性能,而OE和OC分别因算力不足或传输开销导致时延飙升(图5b)。
    • 在WiFi动态网络中,SDN-CEP因全局视图的实时更新能力,时延波动幅度最小(图5c)。
  2. 计算成本
    SDN-CEP通过任务复杂度预测与资源协同分配,系统总成本较OC和OE分别降低35%和28%(图7)。

  3. 模型适应性
    对于计算密集型模型(如ResNet),协同环境的时延优化效果尤为显著(图6),验证了算法在复杂任务中的鲁棒性。


结论与价值

科学价值
1. 提出了一种结合SDN与DRL的协同推理框架,解决了动态环境下模型划分与资源调度的耦合问题。
2. 通过任务复杂度预测器与全局视图机制,实现了时延与成本的均衡优化。

应用价值
适用于智能物联网(AIoT)、自动驾驶等低时延场景,为边缘计算中的DNN部署提供了可扩展方案。


研究亮点

  1. 创新方法:首次将SDN全局资源感知与DQN模型划分结合,实现了动态环境下的自适应卸载。
  2. 多目标优化:通过奖励函数设计同时优化时延与成本,避免了传统方法中精度损失的缺陷。
  3. 实验验证全面:覆盖多种DNN模型及网络场景,验证了算法的普适性。

其他贡献

  • 开源了仿真平台代码,支持后续研究复现与扩展。
  • 提出了边边协同异常中断的后续研究方向,为领域发展提供新思路。

参考文献
文中引用了包括EdgeCloudSim仿真工具、ResNet等经典模型在内的15篇文献,涵盖协同计算、SDN、DRL等领域的最新进展。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com