这篇文档是一篇综述论文(survey),属于类型b。以下是生成的学术报告:
作者与机构
本文由Xubin Wang(Hong Kong Baptist University和Beijing Normal University)、Zhiqing Tang(Beijing Normal University)、Jianxiong Guo(Beijing Normal University和Beijing Normal Hong Kong Baptist University)、Tianhui Meng(Beijing Normal Hong Kong Baptist University)、Chenhao Wang(Beijing Normal University和Beijing Normal Hong Kong Baptist University)、Tian Wang(Beijing Normal University)以及Weijia Jia(Beijing Normal University和Beijing Normal Hong Kong Baptist University,通讯作者)合作完成。论文题为《Empowering Edge Intelligence: A Comprehensive Survey on On-Device AI Models》,发表于2025年3月的《ACM Computing Surveys》。
主题
本文全面综述了设备端人工智能(On-Device AI)模型的当前研究进展、技术挑战及未来趋势,旨在为研究者和工程师提供一个结构化视角,帮助理解设备端AI模型的关键问题与解决方案。
主要观点与论述
设备端AI模型的定义与特征
设备端AI模型(On-Device AI Models)是指直接在边缘或终端设备上设计、训练和部署的AI模型,无需依赖云端处理。其核心特征包括:
设备端AI的应用场景
设备端AI模型已广泛应用于以下领域:
技术挑战
设备端AI面临以下关键技术挑战:
优化与实现策略
论文系统总结了设备端AI的优化方法:
未来趋势
论文提出设备端AI的未来研究方向:
论文的价值与意义
1. 学术价值:首次系统梳理了设备端AI的“数据-模型-系统”协同优化框架[27, 284],填补了现有综述的空白(如Dhar等人[44]仅聚焦算法层面)。
2. 实践意义:为工业界提供了部署指南(如模型压缩技术选型),助力AI在边缘环境的规模化应用[11]。
3. 社会影响:通过隐私保护(如联邦学习[196])和低延迟(如自动驾驶[275]),推动AI技术普惠化。
亮点
- 全面性:覆盖设备端AI从理论(如量化算法)到实践(如硬件加速器)的全链路。
- 前瞻性:提出“边缘智能”(Edge Intelligence)作为下一代AI基础设施的核心范式[284]。
其他有价值内容
- 表6对比了PyTorch Mobile在不同设备上的推理性能(如ResNet50在Galaxy S10e的延迟为333ms)[132],为开发者提供基准参考。
- 图4展示了模型压缩技术的层级关系(如剪枝与量化协同作用),增强读者对技术路径的理解。
(注:术语翻译首次出现时保留英文原词,如“剪枝(Pruning)”;机构与期刊名未翻译。)