本文属于类型a,是一篇关于领域泛化(Domain Generalization, DG)的原创性研究论文。以下是针对该研究的学术报告:
该研究由Aodi Li(中国科学技术大学)、Liansheng Zhuang(中国科学技术大学)、Xiao Long(中国科学技术大学)、Minghong Yao(中国科学技术大学)和Shafei Wang(鹏城实验室)合作完成,发表于计算机视觉领域顶级会议CVPR(具体年份未明确标注,但根据文献引用推测为2023或2024年)。
科学领域:论文属于机器学习中的领域泛化(Domain Generalization, DG)方向,旨在解决模型在训练域(training domains)上学习后如何泛化到未知测试域(unseen test domains)的问题。
研究动机:现有方法(如基于平坦最小值(flat minima)的优化)虽能减少泛化误差,但忽略了不同域间损失景观(loss landscapes)的一致性(consistency),导致模型无法在所有域中同时达到最优平坦最小值,限制了泛化能力。
目标:提出一种迭代自反馈训练框架(Self-Feedback Training, SFT),通过动态优化损失景观的一致性,寻找跨域共享的平坦最小值,提升领域泛化性能。
框架分为两阶段迭代执行:
反馈阶段(Feedback Phase):
- 训练域分割:随机选择两个训练域(如域A和域B),一个用于模型训练,另一个用于评估损失景观差异。
- 不一致性度量:计算两域的尖锐度差异(|Lces-sl(A) - Lces-sl(B)|),作为反馈信号。
优化阶段(Refinement Phase):
- 景观优化器(Landscape Refiner):通过生成动态软标签(soft labels)调整损失景观几何形状,而非修改模型结构或设计新损失函数。
- 损失函数:结合投影交叉熵损失(Projection Cross-Entropy Loss, PCE)、尖锐度惩罚项和反馈信号,总损失为:
[ L{\text{refine}} = L{\text{pce}} + \lambda1 L{\text{ces-sl}} + \lambda2 |L{\text{ces-sl}}(A) - L_{\text{ces-sl}}(B)| ]
科学价值:
1. 理论创新:首次提出通过动态优化损失景观一致性提升领域泛化,揭示了平坦最小值一致性与泛化性能的关联。
2. 方法创新:SFT框架无需修改模型结构,通过标签视角优化损失几何,计算复杂度低。
应用价值:
- 在医疗影像、自动驾驶等存在域偏移的场景中,SFT可提升模型在未知环境下的鲁棒性。