本文由 Aristide Tanyi-Jong Akem (IMDEA Networks Institute, Universidad Carlos III de Madrid), Michele Gucciardo (IMDEA Networks Institute) 和 Marco Fiore (IMDEA Networks Institute) 联合完成,发表在 IEEE INFOCOM 2023 上。这项研究的主要贡献是开发了一种名为 “FlowRest” 的创新方法,这是一种基于随机森林 (Random Forest, RF) 模型,在可编程交换机中实现流级别推断的解决方案。
近年来,网络架构的复杂性和灵活性快速增长,对网络操作自动化的需求也随之增加。这种趋势催生了 “自驱动网络” (Self-driving Networking) 和 “零触点网络与服务管理” (Zero-Touch Network and Service Management, ZSM) 等新概念。这些概念旨在依赖控制器和协调器自动收集测量数据并分析,从而做出实时或甚至预测性的管理决策。
然而,目前大多数智能网络功能主要集中在控制平面 (Control Plane) 上,如流量分类、服务质量 (QoS) 预测、路由优化和安全增强等。这些解决方案因需要与用户平面 (User Plane) 通信而带来了结构性延迟,无法满足下一代网络中子毫秒级别的端到端延迟需求。因此,低延时的流级别推断需要纯用户平面的机器学习模型实现。
在这种背景下,本研究的目标是解决当前随机森林模型在可编程交换机中部署时因内存、计算操作和操作次数受限而面临的设计、扩展性和实用性问题。作者提出了一种完整的随机森林实现方案 FlowRest,旨在流级别实现推断,支持复杂模型,并适配真实硬件。
本研究的工作流程包括以下几部分:
模型植入框架和架构设计: FlowRest 依赖可编程的协议无关交换架构 (Protocol-Independent Switch Architecture, PISA)。整个系统主要运行在以 P4 语言编写的 Intel Tofino 交换机上。其关键设计分为以下几个模块:
硬件适配的模型设计:
模型的映射与推断实现: 作者采用先进的 RF 模型映射技术 (如 “Planter”),将 RF 树节点映射到硬件的多个 Match-Action-Unit (MAU)。这通过预先为特征值定义的范围匹配逻辑来构建查询路径,从而在流水线的最终阶段确定分类结果。这种方法优于以往基于决策树深度限制的映射方案。
实验与性能评估: 作者在真实硬件平台 (Intel Tofino) 和多个公开数据集上测试了 FlowRest,包括以下三个任务:
实验结果表明,FlowRest 在精度 (Precision)、召回率 (Recall) 和 F1-score 上均优于基于数据包的推断框架: 1. 准确性: - 在 IoT 识别的 26 类分类任务中,FlowRest 的 F1-score 达到了 0.86,而基于数据包的基准模型仅为 0.62。 - 在服务分类和异常检测任务中,FlowRest 同样显示了更高的准确性和性能稳定性,尤其是复杂分类任务中,FlowRest 的召回率优势尤为突出。
可扩展性:
资源利用:
FlowRest 是首个完整实现流级别随机森林推断的硬件系统。其在真实网络环境中进行了扎实的检测任务验证,不仅在任务复杂性上取得了良好的扩展性,还在硬件资源紧张的情况下保持了显著性能优势。这项研究的重要意义包括: - 推动了 用户平面机器学习(User-Plane Machine Learning) 的发展,使得智能网络功能真正能够部署到网络设备级别。 - 提供了一种高效的 RF 模型设计与映射方法,为更多复杂的网络管理任务打开了可能。 - 为未来基于 AI 的联网设备开发提供了系统性参考,尤其是在程序化交换机 ASIC 中的实际实现方面。
本研究的代码和数据集已公开,可通过 GitHub 获取。这大幅提升了研究的再现性及方法可用性,为领域内进一步扩展和应用提供了宝贵的基础。