本文由Hongbo Yin、Xiaoge Huang、Yuhang Wu、Chengchao Liang和Qianbin Chen共同撰写,发表于2023年11月的《IEEE Communications Letters》期刊。这些作者均来自重庆邮电大学通信与信息工程学院。该研究提出了一种多区域异步群体学习(Multi-Region Asynchronous Swarm Learning, MASL)框架,旨在解决大规模车联网(Internet of Vehicles, IoV)场景中的数据共享问题。研究得到了中国国家自然科学基金(NSFC)和重庆市自然科学基金的支持。
随着5G、物联网(IoT)和边缘计算(Edge Computing, EC)技术的发展,车联网(IoV)作为物联网的一个新兴分支,正在迅速扩展。车联网中的车辆通过传感器和通信设备生成大量数据,这些数据对于实现自动驾驶等智能应用至关重要。然而,车联网中的数据共享面临诸多挑战,包括网络带宽限制、计算资源不足以及用户数据隐私问题。传统的集中式云计算模式存在数据隐私泄露的风险,而联邦学习(Federated Learning, FL)作为一种分布式学习技术,能够在保护数据隐私的同时实现模型共享。然而,现有的联邦学习方法在可扩展性和安全性方面存在不足,尤其是在车联网这种动态网络拓扑环境中。
本研究旨在提出一种多区域异步群体学习(MASL)框架,通过结合分层区块链技术和异步模型训练,解决车联网中大规模数据共享的安全性和效率问题。具体目标包括: 1. 提出一种基于分层区块链的多区域异步群体学习框架,以应对车联网中的大规模数据共享挑战。 2. 设计一种异步模型训练方法,结合有向无环图(Directed Acyclic Graph, DAG)区块链,确保数据隐私的同时实现高效异步训练和共享。 3. 开发跨区域共享机制,缓解数据非独立同分布(Non-IID)问题,提升模型泛化能力。 4. 在硬件测试平台上开发并部署MASL应用程序,验证其有效性。
MASL框架的核心思想是通过分层区块链和异步模型训练,实现车联网中的安全数据共享。具体流程分为以下几个阶段:
车联网被分为两层:边缘层和用户层。边缘层包括路侧单元(Road Side Units, RSUs)和基站(Base Stations, BSs),负责提供通信、存储和计算资源。用户层则由参与数据共享的车辆组成。每个区域独立维护一个区块链,确保数据共享过程的安全性和隐私性。
MASL框架通过三个主要阶段实现数据共享:模型下载、本地训练和模型上传。每个车辆异步执行这些阶段。
模型下载阶段:车辆向RSU或BS发送模型下载请求,RSU或BS将最新的模型参数打包并返回给车辆。跨区域共享时,BS会从目标区域的DAG中获取模型参数。
本地训练阶段:车辆根据接收到的模型参数,使用本地数据进行训练。训练过程中,车辆通过基于准确性的加权选择算法(Accuracy-based Weighted TSA, AW-TSA)选择模型参数,确保模型的高效收敛。
模型上传阶段:训练完成后,车辆将更新后的模型打包并上传至RSU或BS。RSU或BS验证模型的有效性,并将其记录到区块链中。跨区域共享时,BS通过PBFT共识机制将模型记录到主链中。
研究对MASL框架的平均延迟和安全性进行了理论分析。结果表明,MASL在保证安全性的同时,能够有效降低通信延迟,尤其是在跨区域共享时表现出色。
通过仿真和硬件测试平台的验证,MASL框架在效率和安全性方面均优于现有的联邦学习算法。具体结果如下: 1. 模型泛化能力:跨区域共享显著缓解了数据非独立同分布(Non-IID)问题,提升了模型的泛化能力。 2. 通信成本:MASL在跨区域共享时的通信成本较低,且随着车辆数量的增加,通信成本增长缓慢。 3. 抗攻击能力:MASL能够有效抵御恶意攻击,尤其是在面对数据投毒攻击时表现出色。
本研究提出的MASL框架通过结合分层区块链和异步群体学习技术,成功解决了车联网中大规模数据共享的安全性和效率问题。MASL不仅能够有效保护用户数据隐私,还能通过跨区域共享机制提升模型泛化能力。仿真和硬件测试结果验证了MASL框架的优越性能,表明其在车联网等动态网络环境中具有广泛的应用前景。
本研究为车联网中的大规模数据共享提供了一种安全、高效的解决方案,具有重要的科学价值和应用价值。MASL框架不仅能够提升车联网中智能应用的性能,还为其他分布式网络环境中的数据共享问题提供了新的思路。