分享自:

赋能边缘智能:边缘AI模型的全面调查

期刊:ACM Comput. Surv.DOI:10.1145/nnnnnnn.nnnnnnn

这篇文档是一篇综述论文(survey),属于类型b。以下是生成的学术报告:


作者与机构
本文由Xubin Wang(Hong Kong Baptist University和Beijing Normal University)、Zhiqing Tang(Beijing Normal University)、Jianxiong Guo(Beijing Normal University和Beijing Normal Hong Kong Baptist University)、Tianhui Meng(Beijing Normal Hong Kong Baptist University)、Chenhao Wang(Beijing Normal University和Beijing Normal Hong Kong Baptist University)、Tian Wang(Beijing Normal University)以及Weijia Jia(Beijing Normal University和Beijing Normal Hong Kong Baptist University,通讯作者)合作完成。论文题为《Empowering Edge Intelligence: A Comprehensive Survey on On-Device AI Models》,发表于2025年3月的《ACM Computing Surveys》。

主题
本文全面综述了设备端人工智能(On-Device AI)模型的当前研究进展、技术挑战及未来趋势,旨在为研究者和工程师提供一个结构化视角,帮助理解设备端AI模型的关键问题与解决方案。


主要观点与论述

  1. 设备端AI模型的定义与特征
    设备端AI模型(On-Device AI Models)是指直接在边缘或终端设备上设计、训练和部署的AI模型,无需依赖云端处理。其核心特征包括:

    • 实时性(Real-time Performance):适用于需即时反馈的应用场景(如自动驾驶)。
    • 资源受限(Resource Constraints):受限于计算能力、存储和能耗,需针对设备硬件优化(如模型压缩)。
    • 数据隐私(Data Privacy):本地处理数据,减少传输风险(如医疗设备中的敏感信息)。
      *支持依据*:文献[44, 248]提出,设备端AI通过本地化处理降低了带宽依赖和隐私泄露风险;Gartner预测到2025年,75%的企业数据将在传统数据中心外生成[60],凸显设备端处理的必要性。
  2. 设备端AI的应用场景
    设备端AI模型已广泛应用于以下领域:

    • 智能手机:语音助手(如Siri)、图像识别(如人脸检测)和健康监测。
    • 物联网(IoT)设备:智能家居(如温控系统)、工业自动化(如预测性维护)。
    • 边缘计算:实时视频分析(如安防摄像头)、智能交通管理(如信号灯优化)。
    • 自动驾驶:环境感知(如行人检测)与路径规划(如V2X通信)。
    • 医疗设备:疾病诊断(如医学影像分析)和远程监护(如可穿戴设备)。
      *支持依据*:文献[43, 115]指出,设备端AI在工业4.0中通过实时数据处理优化工厂运营;案例研究显示,智能农业传感器通过本地AI模型提升灌溉效率[147]。
  3. 技术挑战
    设备端AI面临以下关键技术挑战:

    • 计算资源有限:需通过模型轻量化(如MobileNet系列[183])和硬件加速(如TPU)解决。
    • 存储与内存限制:采用剪枝(Pruning)和量化(Quantization)技术减少模型体积[20]。
    • 能耗管理:动态能耗算法(如基于AI的控制器[195])和专用硬件(如FPGA)可优化能效。
    • 通信带宽限制:边缘缓存(Edge Caching)和本地计算(On-Device Computation)减少数据传输[246]。
      *支持依据*:文献[18]指出,复杂模型(如GPT-3)的部署需800GB存储,而设备端模型需压缩至几MB;实验表明,Deep Compression技术可缩减DNN模型大小90%[71]。
  4. 优化与实现策略
    论文系统总结了设备端AI的优化方法:

    • 数据优化:包括数据过滤(Data Filtering)、特征提取(Feature Extraction)和量化(Quantization)[237]。
    • 模型优化:如知识蒸馏(Knowledge Distillation)[77]、低秩分解(Low-Rank Factorization)[253]和硬件感知神经网络搜索(Hardware-Aware NAS)[137]。
    • 系统优化:软件框架(如TensorFlow Lite)与硬件加速器(如ASIC)的协同设计[246]。
      *支持依据*:对比实验显示,MobileNetV3在ImageNet上以219 MFLOPs实现75.2%准确率[80];EdgeBERT通过早期退出机制(Early Exit)节省7倍能耗[204]。
  5. 未来趋势
    论文提出设备端AI的未来研究方向:

    • 新兴技术影响:边缘计算(Edge Computing)与基础模型(Foundation Models)的融合[284]。
    • 跨学科应用:在智慧城市和医疗等领域拓展实时AI解决方案[43]。
    • 标准化需求:需统一框架以解决异构设备的部署问题[158]。

论文的价值与意义
1. 学术价值:首次系统梳理了设备端AI的“数据-模型-系统”协同优化框架[27, 284],填补了现有综述的空白(如Dhar等人[44]仅聚焦算法层面)。
2. 实践意义:为工业界提供了部署指南(如模型压缩技术选型),助力AI在边缘环境的规模化应用[11]。
3. 社会影响:通过隐私保护(如联邦学习[196])和低延迟(如自动驾驶[275]),推动AI技术普惠化。

亮点
- 全面性:覆盖设备端AI从理论(如量化算法)到实践(如硬件加速器)的全链路。
- 前瞻性:提出“边缘智能”(Edge Intelligence)作为下一代AI基础设施的核心范式[284]。


其他有价值内容
- 表6对比了PyTorch Mobile在不同设备上的推理性能(如ResNet50在Galaxy S10e的延迟为333ms)[132],为开发者提供基准参考。
- 图4展示了模型压缩技术的层级关系(如剪枝与量化协同作用),增强读者对技术路径的理解。

(注:术语翻译首次出现时保留英文原词,如“剪枝(Pruning)”;机构与期刊名未翻译。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com