分享自:

生成推荐的双层优化:连接标记化与生成

期刊:ACMDOI:https://doi.org/xxxxxxx.xxxxxxx

学术研究报告:BLOgER——通过双层优化桥接生成式推荐中的标记化与生成过程

一、作者与发表信息

本研究由以下学者合作完成:
- Yimeng Bai(中国科学技术大学)
- Chang Liu*(北京航空航天大学)
- Yang Zhang†(新加坡国立大学)
- Dingxian WangFrank YangAndrew Rabinovich(Upwork, 美国)
- Wenge Rong(北京航空航天大学)
- Fuli Feng†(中国科学技术大学)
(*表示同等贡献,†表示通讯作者)
论文发表于2018年ACM Symposium on Neural Gaze Detection(会议论文),预印本发布于arXiv:2510.1242v1 [cs.IR]。

二、学术背景

科学领域:本研究属于生成式推荐系统(Generative Recommendation)领域,结合了双层优化(Bi-level Optimization)、元学习(Meta-learning)和梯度手术(Gradient Surgery)技术。

研究动机:传统生成式推荐系统通常将项目标记化(Item Tokenization)和自回归生成(Autoregressive Generation)视为独立组件,分别优化(如序贯优化或交替优化),导致标记化过程缺乏推荐目标的直接指导,生成次优标识符(Suboptimal Identifiers),影响推荐性能。

研究目标:提出BLOgER框架,通过双层优化显式建模标记化与生成器的相互依赖关系,实现两者的协同优化,提升推荐性能。

三、研究流程与方法

1. 问题重构与双层优化框架

研究将生成式推荐重构为双层优化问题:
- 内层优化:固定标记化器(Tokenizer)参数𝜙,训练推荐器(Recommender)参数𝜃,最小化推荐损失ℒ_rec。
- 外层优化:基于内层优化的推荐器𝜃*,联合优化标记化损失ℒ_token和推荐损失ℒ_rec,更新标记化器参数𝜙。

2. 核心组件设计

(1)标记化器(Tokenizer)
- 采用残差量化VAE(RQ-VAE)将项目映射为层级离散令牌序列。
- 输入:项目语义嵌入(如文本或协作嵌入);输出:L级令牌序列(如[𝑐₁, …, 𝑐_L])。
- 关键步骤:
- 量化:通过多级码本(Codebook)逐级残差量化,生成混合表示(Mixed Representation)。
- 重建:解码器重构原始嵌入,损失函数包含重建误差和量化误差。

(2)推荐器(Recommender)
- 基于Transformer架构(T5模型),输入为标记化交互历史,输出为目标项目的令牌序列概率。
- 创新点:混合表示(Soft + Hard Embedding)解决离散令牌的不可微问题,支持梯度回传。

(3)学习策略
- 元学习:通过虚拟更新(Meta-training)和测试(Meta-testing)模拟双层优化,计算元梯度。
- 梯度手术:当标记化与推荐目标梯度冲突时(余弦相似度为负),投影推荐梯度以消除冲突成分。

3. 实验设计与数据集

  • 数据集:Amazon Beauty、Instruments、Arts(5-core过滤,序列长度固定为20)。
  • 基线模型:包括传统推荐(MF、LightGCN)和生成式推荐(TIGER、Letter、ETEGRec)。
  • 评估指标:Recall@K、NDCG@K(K=5,10),全排序评估。

四、主要结果

  1. 性能对比
    BLOgER在三个数据集上均超越基线模型(如表3所示):
  • Beauty:Recall@5提升4.7%(0.0444 vs. 0.0424),NDCG@5提升10.2%(0.0293 vs. 0.0264)。
  • Instruments:Recall@10达到0.1100,显著高于ETEGRec(0.1079)。
  • Arts:NDCG@10提升2.4%(0.0777 vs. 0.0759)。
  1. 消融实验
  • 梯度手术的贡献:移除后Recall@5下降25.9%(0.0329 vs. 0.0444)。
  • 双层优化的必要性:联合优化(Joint)性能低于BLOgER,验证了双层结构的有效性。
  1. 可视化分析
  • 码本利用率:BLOgER的一级码本密度提升至65%(TIGER为47%),熵值增至7.14(TIGER为6.05),显示推荐损失有效引入协作信号。

五、结论与价值

  1. 科学价值
  • 首次将生成式推荐建模为双层优化问题,通过元学习和梯度手术实现标记化与生成的直接对齐。
  • 提出混合表示和梯度冲突解决机制,为多任务学习提供新思路。
  1. 应用价值
  • 无需额外计算开销,可集成至现有生成式推荐框架(如TIGER)。
  • 适用于大规模工业场景,提升推荐多样性和长尾覆盖率。

六、研究亮点

  1. 方法创新
  • 双层优化框架显式建模组件依赖,超越传统序贯/交替优化。
  • 梯度手术技术解决多目标冲突,提升优化稳定性。
  1. 性能突破
  • 在稀疏数据集(如Beauty,稀疏度99.93%)上仍表现优异。
  1. 可扩展性
  • 支持与高级标记化器(如Letter)结合,进一步优化性能(Recall@5提升至0.0489)。

七、其他价值

  • 开源代码与实验细节完整,便于复现;未来计划探索推理能力与工业部署。

(注:专业术语如Bi-level Optimization首次出现时标注英文,后续统一用中文表述。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com