学术研究报告:BLOgER——通过双层优化桥接生成式推荐中的标记化与生成过程
本研究由以下学者合作完成:
- Yimeng Bai(中国科学技术大学)
- Chang Liu*(北京航空航天大学)
- Yang Zhang†(新加坡国立大学)
- Dingxian Wang、Frank Yang、Andrew Rabinovich(Upwork, 美国)
- Wenge Rong(北京航空航天大学)
- Fuli Feng†(中国科学技术大学)
(*表示同等贡献,†表示通讯作者)
论文发表于2018年ACM Symposium on Neural Gaze Detection(会议论文),预印本发布于arXiv:2510.1242v1 [cs.IR]。
科学领域:本研究属于生成式推荐系统(Generative Recommendation)领域,结合了双层优化(Bi-level Optimization)、元学习(Meta-learning)和梯度手术(Gradient Surgery)技术。
研究动机:传统生成式推荐系统通常将项目标记化(Item Tokenization)和自回归生成(Autoregressive Generation)视为独立组件,分别优化(如序贯优化或交替优化),导致标记化过程缺乏推荐目标的直接指导,生成次优标识符(Suboptimal Identifiers),影响推荐性能。
研究目标:提出BLOgER框架,通过双层优化显式建模标记化与生成器的相互依赖关系,实现两者的协同优化,提升推荐性能。
研究将生成式推荐重构为双层优化问题:
- 内层优化:固定标记化器(Tokenizer)参数𝜙,训练推荐器(Recommender)参数𝜃,最小化推荐损失ℒ_rec。
- 外层优化:基于内层优化的推荐器𝜃*,联合优化标记化损失ℒ_token和推荐损失ℒ_rec,更新标记化器参数𝜙。
(1)标记化器(Tokenizer)
- 采用残差量化VAE(RQ-VAE)将项目映射为层级离散令牌序列。
- 输入:项目语义嵌入(如文本或协作嵌入);输出:L级令牌序列(如[𝑐₁, …, 𝑐_L])。
- 关键步骤:
- 量化:通过多级码本(Codebook)逐级残差量化,生成混合表示(Mixed Representation)。
- 重建:解码器重构原始嵌入,损失函数包含重建误差和量化误差。
(2)推荐器(Recommender)
- 基于Transformer架构(T5模型),输入为标记化交互历史,输出为目标项目的令牌序列概率。
- 创新点:混合表示(Soft + Hard Embedding)解决离散令牌的不可微问题,支持梯度回传。
(3)学习策略
- 元学习:通过虚拟更新(Meta-training)和测试(Meta-testing)模拟双层优化,计算元梯度。
- 梯度手术:当标记化与推荐目标梯度冲突时(余弦相似度为负),投影推荐梯度以消除冲突成分。
(注:专业术语如Bi-level Optimization首次出现时标注英文,后续统一用中文表述。)