本文档属于类型a(单篇原创研究报告),以下是针对该研究的学术报告:
本研究由Peihua Deng(杭州电子科技大学)、Jiehua Zhang(西安交通大学)、Xichun Sheng(澳门理工大学)、Chenggang Yan(杭州电子科技大学)、Yaoqi Sun(北京理工大学)、Ying Fu(中国科学院计算技术研究所)等合作完成,发表于CVPR(计算机视觉与模式识别顶会)。
研究聚焦于类增量无监督域自适应(Class-Incremental Source-Free Unsupervised Domain Adaptation, CI-SFUDA)问题,属于迁移学习与持续学习的交叉领域。传统无监督域适应(UDA)依赖带标签的源域数据,而实际场景中目标域数据可能以增量形式动态到达且无法访问源数据(如隐私限制)。现有方法面临两大挑战:
1. 相似源类知识的干扰:目标域类别是源域类别的子集,未标记目标数据可能被错误分配到源域中相似但无关的类别。
2. 新旧知识的冲突:增量学习过程中,新类别的引入会干扰旧类别知识的保留。
提出多粒度类原型拓扑蒸馏算法(GROTO),通过以下模块解决上述问题:
- 多粒度类原型自组织模块:生成可靠伪标签,减少源域负类干扰。
- 原型拓扑蒸馏模块:利用源域全局拓扑结构缓解新旧知识冲突。
步骤1:混合知识驱动的正类挖掘(HKPCM)
- 源相似性引导:计算目标数据与源类中心的余弦相似度矩阵,筛选高于平均相似度的类作为正类。
- 目标概率引导:通过源模型预测目标数据的类别累积概率,筛选高概率类作为正类。
- 创新点:结合两种分布避免单一策略导致的漏选(如仅依赖预测会遗漏低置信度正类)。
步骤2:正类特征自组织(PTFS)
- 多粒度原型生成:
- 粗粒度原型:包括源分类器权重(稳定收敛点)和目标类中心(高相似度样本)。
- 细粒度原型:通过数据增强和不确定性评估(标准差阈值)筛选高置信度目标样本。
- 伪标签生成:基于多粒度原型的平均距离分配伪标签。
- 损失函数:结合交叉熵损失($L{ce}$)和对比损失($L{con}$),优化同类特征紧凑性和异类特征分离性。
性能优势:
模块有效性:
可视化分析:
科学价值:
应用价值:
方法创新:
实验全面性: