分享自:

面向协作感知的联邦学习框架研究

期刊:IEEE Robotics and Automation Letters

类型a:这篇文档报告了一项原创研究。

主要作者与机构及发表信息
本研究的主要作者包括张振荣(Zhenrong Zhang)、刘佳楠(Jianan Liu)、周曦(Xi Zhou)、黄涛(Tao Huang,IEEE高级会员)、韩庆龙(Qing-Long Han,IEEE会士)、刘景欣(Jingxin Liu,IEEE会员)和刘洪斌(Hongbin Liu,通讯作者)。研究由西安交通大学利物浦大学人工智能与先进计算学院、詹姆斯库克大学科学与工程学院、斯威本科技大学科学、计算与工程学院等多个机构合作完成。该研究发表于《IEEE Robotics and Automation Letters》期刊。

学术背景
本研究属于智能交通系统(Cooperative Intelligent Transportation System, C-ITS)和自动驾驶领域,重点探讨了联邦学习(Federated Learning)在协同感知(Cooperative Perception, CP)中的应用。协同感知是提升未来交通系统效率与安全性的关键技术,但其依赖车辆间的数据共享,这引发了隐私保护的重大挑战。联邦学习通过去中心化的模型训练方法解决了数据隐私问题,但在应用于C-ITS时,因客户端数据异构性(Data Heterogeneity)和非独立同分布(Non-IID)数据的存在,传统联邦学习框架面临收敛缓慢和模型精度下降的问题。为解决这些问题,本研究旨在提出一种新的联邦学习框架,以应对数据异构性和分布偏移的挑战,从而提高协同感知模型的准确性和鲁棒性。

研究流程
本研究主要包括以下步骤:

  1. 问题定义与框架设计
    研究目标是设计一个适用于鸟瞰图(Bird’s-Eye-View, BEV)语义分割任务的联邦学习框架。框架包含M个客户端,每个客户端拥有独特的标签m ∈ {1, 2, …, M}。第m个客户端的数据样本集表示为Nm = {(Nm,i, Ym,i)}i∈{1,2,…,|Nm|},其中Nm,i是从多视角相机系统捕获的图像集合,Ym,i是对应的BEV语义掩码集合。每个客户端独立训练本地模型Gm,并将更新后的模型参数发送至中央服务器进行全局模型聚合。

  2. 算法开发
    研究提出了两种创新方法:

    • 联邦动态加权聚合算法(Feddwa)
      Feddwa通过动态调整客户端权重来引导模型收敛,并使用Kullback-Leibler散度(KLD)评估全局模型与本地模型之间的分布差异。具体而言,算法根据KLD动态调整每个客户端对全局模型更新的贡献权重。
    • 动态调整损失函数(Daloss)
      Daloss是一种增强型本地训练损失函数,结合了标准交叉熵损失和基于KLD的动态控制项,用于缓解非IID数据对模型收敛的不利影响。
  3. 实验设计
    实验基于FedBEVT数据集展开,该数据集扩展自OpenV2V数据集,包含三种类型的车辆(公交车、卡车和轿车),每种车辆的传感器安装位置和角度不同,导致数据异构性显著。实验设置了四个客户端,分别代表不同的车辆类型,每个客户端的训练集和测试集规模分别为:

    • 客户端1(公交车):训练集1,398帧,测试集413帧;
    • 客户端2(卡车):训练集1,459帧,测试集356帧;
    • 客户端3(轿车A):训练集11,636帧,测试集3,546帧;
    • 客户端4(轿车B):训练集7,142帧,测试集10,191帧。
  4. 模型配置与数据分析
    模型采用基于Transformer的BEV分割网络,包含CNN编码器、BEV Transformer和BEV解码器三个主要模块。实验分析指标包括训练损失(Loss)、平均交并比(Intersection over Union, IoU)和通信轮次(Communication Rounds)。数据处理与分析均在PyTorch 2.0.1和CUDA 12.3环境下完成。

主要结果
实验结果表明,所提出的Feddwa算法和Daloss函数显著提升了联邦学习框架在协同感知任务中的性能:
1. 客户端1(公交车)
在235轮通信后,IoU达到10.72%,相比现有方法表现出更高的数据异构性管理能力和通信效率。
2. 客户端2(卡车)
IoU达到15.91%,较本地训练有显著提升,表明模型对客户端特定数据特性的适应能力更强。
3. 客户端3(轿车A)
IoU达到21.30%,为所有方法中最高值,显示了模型在复杂车辆环境中的优越性。
4. 客户端4(轿车B)
在仅100轮通信后,IoU达到19.35%,体现了模型的高效性和鲁棒性。

消融实验进一步验证了Daloss的有效性,当将其添加到FedBEVT框架中时,各客户端的IoU均有显著提升。例如,客户端2的IoU从14.88%提升至15.91%,而客户端3的IoU达到21.30%。这些结果表明,Feddwa和Daloss的结合能够显著改善联邦学习框架的性能。

结论与价值
本研究提出了一种专为协同感知设计的联邦学习框架,通过动态调整模型收敛方向和均衡整合不同客户端的本地模型,有效解决了数据异构性带来的挑战。研究结果不仅证明了该框架在提升模型精度和通信效率方面的潜力,还为智能交通系统中的隐私保护提供了新思路。此外,该框架可广泛应用于自动驾驶、交通流量预测等领域,具有重要的科学价值和实际应用前景。

研究亮点
1. 提出了联邦动态加权聚合算法(Feddwa),通过KLD动态调整客户端权重,有效应对数据异构性问题。
2. 设计了动态调整损失函数(Daloss),结合KLD和L2范数,显著提升了模型收敛速度和准确性。
3. 在FedBEVT数据集上的实验表明,所提框架在多个客户端场景中均优于现有方法,特别是在复杂车辆环境中表现突出。

其他有价值内容
研究还探讨了联邦学习在智能交通系统中的潜在应用场景,例如通过V2X通信实现车辆与基础设施之间的无缝数据交换。此外,研究强调了数据隐私保护的重要性,并指出联邦学习在这一领域的独特优势。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com