分享自:

深度推荐系统中的统一语义和ID表示学习

期刊:ACMDOI:10.1145/nnnnnnn.nnnnnnn

本文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


作者及机构
本研究由Guanyu Lin、Zhigang Hua、Tao Feng、Shuang Yang、Bo Long和Jiaxuan You共同完成。其中,Guanyu Lin、Tao Feng和Jiaxuan You来自University of Illinois at Urbana-Champaign,Zhigang Hua、Shuang Yang和Bo Long则来自Meta AI。该研究于2025年发表在ACM(Association for Computing Machinery)期刊上,标题为“Unified Semantic and ID Representation Learning for Deep Recommenders”。

学术背景
研究领域为推荐系统(Recommendation Systems),特别是在大规模在线平台(如YouTube、TikTok和Amazon)中,如何高效地为用户推荐符合其偏好的内容,同时过滤无关信息,是一个关键问题。传统的推荐系统主要依赖ID令牌(ID Tokens)来唯一标识物品,这种方法虽然能有效捕捉特定物品之间的关系,但在冷启动(Cold-start)场景下表现不佳,且存在冗余问题。近年来,研究者尝试使用语义令牌(Semantic Tokens)作为替代方案,但语义令牌也面临物品重复和性能提升不一致等挑战。因此,本研究旨在提出一种统一的语义和ID表示学习框架,结合两种令牌的优势,以提升推荐系统的泛化能力。

研究流程
研究流程包括以下几个主要步骤:

  1. 问题定义与数据集准备
    研究首先定义了序列推荐(Sequential Recommendation)的问题:给定用户的历史交互序列,预测用户下一步可能交互的物品。研究使用了三个来自Amazon产品评论的基准数据集(Beauty、Sports和Toys),并对数据进行了5-core过滤,确保每个用户和物品至少有五次交互记录。

  2. 统一语义与ID令牌化
    研究者提出了一种混合令牌化策略,结合了ID令牌和语义令牌。ID令牌用于捕捉物品的独特属性,而语义令牌则通过RQ-VAE(Residual Quantized Variational Autoencoder)模型学习物品的共享特征。具体来说,研究者将物品的文本描述(如标题、品牌、类别和价格)输入预训练的Sentence-T5模型,生成768维的文本嵌入(Text Embedding),然后通过RQ-VAE模型将其量化为64维的语义嵌入(Semantic Embedding)。

  3. 统一相似性与距离度量
    研究者在模型的不同层中结合了余弦相似度(Cosine Similarity)和欧氏距离(Euclidean Distance)。余弦相似度用于早期层,以解耦密集的嵌入(Embedding),而欧氏距离用于最后一层,以区分独特的物品。这种设计旨在最大化两种度量在嵌入搜索中的优势。

  4. 端到端联合优化
    模型通过端到端的方式进行训练,联合优化三个目标函数:推荐损失(Recommendation Loss)、RQ-VAE量化损失(RQ-VAE Loss)和文本重构损失(Text Reconstruction Loss)。推荐损失使用对数损失(Log Loss)计算,RQ-VAE损失用于确保有效的码本分配,文本重构损失则用于保持语义表示的质量。

  5. 实验与评估
    研究者在三个数据集上进行了实验,评估了模型的性能。评估指标包括命中率(Hit@K)、归一化折扣累积增益(NDCG@K)和平均倒数排名(MRR)。此外,研究者还进行了消融实验(Ablation Study),比较了不同令牌化方法和距离度量的效果。

主要结果
1. 性能提升
研究提出的方法在三个数据集上均显著优于现有的基线模型,性能提升范围为6%到17%。特别是在Hit@10指标上,表现尤为突出。

  1. 令牌大小减少
    通过将ID令牌的大部分维度替换为语义令牌,研究者的方法将令牌大小减少了80%以上,显著降低了模型的冗余。

  2. 消融实验结果
    消融实验表明,语义令牌在捕捉高层语义信息方面表现优异,但在区分物品位置时表现较差。而ID令牌则能有效捕捉物品的独特属性,但在冷启动场景下表现不佳。

  3. 超参数研究
    研究者还发现,ID令牌的维度对性能影响较小,仅需少量ID令牌即可捕捉物品的独特信息,进一步验证了ID令牌的冗余性。

结论
本研究提出了一种统一的语义和ID表示学习框架,成功结合了ID令牌和语义令牌的优势,显著提升了推荐系统的性能,同时大幅减少了令牌大小。该方法不仅在科学上具有创新性,还为实际应用中的推荐系统提供了更高效的解决方案。

研究亮点
1. 创新性框架
本研究首次全面探讨了ID令牌和语义令牌在推荐系统中的互补关系,并提出了一种统一的框架,成功结合了两种令牌的优势。

  1. 性能与效率的双重提升
    研究提出的方法不仅在性能上显著优于现有基线模型,还通过减少令牌大小大幅提升了模型的效率。

  2. 深入的理论分析与实验验证
    研究者通过详细的理论分析和广泛的实验验证,揭示了ID令牌的冗余性以及语义令牌在泛化能力上的优势。

其他有价值的内容
研究者还通过可视化方法展示了语义令牌和ID令牌的分布,进一步验证了方法的有效性。此外,研究还探讨了码本大小(Codebook Size)对性能的影响,发现码本大小超过256后,性能提升不再显著,且码本开始退化。


以上报告详细介绍了该研究的背景、流程、结果及其科学价值,旨在为其他研究者提供全面的参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com