分享自:

生成式推荐模型:进展与方向

期刊:Companion Proceedings of the ACM Web Conference 2025 (WWW Companion '25)DOI:10.1145/3701716.3715856

这篇文档是一篇即将在2025年ACM网络会议(WWW Companion ‘25)上发表的教程(Tutorial)论文,标题为《Generative Recommendation Models: Progress and Directions》。其作者团队包括来自加州大学圣地亚哥分校、新加坡国立大学和中国科学技术大学的研究人员,如Yupeng Hou、An Zhang、Leheng Sheng、Zhengyi Yang、Xiang Wang、Tat-Seng Chua和Julian McAuley。该论文并非报告一项单一原创研究的论文,而是一篇对新兴研究领域进行全面梳理、总结与展望的学术教程,旨在为相关领域的研究者提供系统性的知识概览和未来方向的指引。因此,本文档属于类型b

生成式推荐模型:进展与方向——一篇教程论文的学术报告

本文由Yupeng Hou、An Zhang、Leheng Sheng、Zhengyi Yang、Xiang Wang、Tat-Seng Chua和Julian McAuley共同撰写,计划于2025年4月28日至5月2日在澳大利亚悉尼举行的ACM网络会议2025(WWW Companion ‘25)上作为教程发布。论文聚焦于一个正在迅速崛起并深刻变革推荐系统领域的研究范式:生成式推荐模型。传统的推荐系统主要遵循判别式(Discriminative)范式,即预测用户与物品之间交互的可能性(如点击率、评分),然后从固定的物品库中检索或排序。尽管有效,但这种方法存在表达能力的局限:用户只能被动浏览系统推荐的项目,而无法主动地、以更自然的方式(如使用自然语言)表达复杂需求,并与系统进行动态、多轮的交互。随着以大型语言模型(Large Language Models, LLMs)为代表的生成式模型的突破性进展,推荐系统研究正经历一场范式转移。研究人员开始探索构建生成式推荐模型,其核心思想是让模型能够“生成”推荐内容,而非仅仅“判别”或“检索”。这篇教程论文旨在全面概述这一新兴领域的最新进展,深入探讨其面临的挑战与开放性问题,并展望未来的研究方向。

论文的核心内容围绕三大类生成式推荐模型及其面临的挑战展开,结构清晰,论点明确。

第一,基于大型语言模型的生成式推荐。 这是当前最受关注的方向,主要利用LLMs强大的语言理解、生成和世界知识来增强推荐系统。论文从多个子方向详细阐述了其进展。首先是零样本推荐,研究者尝试直接通过提示(Prompting)让预训练的LLMs执行评分预测、重排序、候选生成等任务。尽管LLMs展现出令人印象深刻的零样本能力,但其性能通常仍无法超越专门设计的传统推荐模型。这表明,直接将通用LLM用于推荐存在局限性。因此,第二个关键子方向是将LLMs与用户行为对齐。为了让LLMs能理解特定用户和物品的偏好,研究者采用了指令微调(Instruction Tuning)等技术,使LLM生成的文本能够被解析或“落地”为目标物品,或者将额外的物品标识符、协同过滤特征整合到LLM中,以增强其对推荐任务的理解和生成能力。第三个子方向是基于LLM的智能体在推荐中的应用。LLM驱动的智能体能够模拟人类用户行为,为推荐系统的评估提供了新的、可扩展的数据来源和测试环境。同时,它们也能扮演个性化的推荐助手角色,通过分析用户历史、调用外部工具(如搜索引擎、推荐引擎)来提供可解释的、交互式的推荐服务。第四个子方向是基于LLM的对话式推荐系统。LLMs天然的对话能力使其非常适合构建对话推荐系统。通过多轮对话,系统可以逐步细化对用户意图和偏好的理解,从而提供更精准的推荐。研究表明,即使是仅配备简单检索模块的预训练LLM,在对话推荐任务上的表现也能超越许多专门设计的对话推荐系统,这凸显了LLMs在交互式体验方面的巨大潜力。

第二,基于语义ID的生成式推荐。 这一方向旨在解决传统检索式推荐模型的内存效率和可扩展性问题。传统模型需要为海量物品存储嵌入向量,导致存储开销巨大。受生成式检索(Generative Retrieval)的启发,基于语义ID的方法将每个物品编码(或“分词”)为一串离散的标记序列,即“语义ID”。然后,模型被训练成一个序列到序列的神经网络,直接根据用户历史行为生成目标物品的语义ID序列,从而完成推荐。这种方法完全摒弃了与物品数量成正比的庞大嵌入表。论文详细介绍了该方向的几个关键方面。首先是语义ID的构建方法,其质量对模型性能有决定性影响。主流方法包括量化(Quantization)和层次聚类,也有研究探索通过神经网络直接学习生成语义ID,或联合学习语义ID的分配和后续的生成式推荐模型。其次是基于语义ID的推荐器架构,其学习目标和解码方式与LLMs相似,但研究者也设计了专门利用语义ID结构特性的模块,例如在优化过程中引入负样本,或开发基于语义ID结构进行路由的混合专家(Mixture-of-Experts)模块。这种架构具备易于扩展的特性,并能与LLMs进行集成,展现了良好的发展前景。

第三,基于扩散模型的生成式推荐。 扩散模型在图像、视频生成领域取得了巨大成功,其强大的生成能力也开始被引入推荐系统。早期的尝试主要利用扩散模型进行数据增强。而最新的研究则直接探索其作为生成式推荐核心架构的潜力。论文阐述了该方向的两个主要应用路径。一是ID嵌入生成。物品的ID嵌入在捕捉用户与物品的协同信息方面非常有效。扩散模型可以被用来生成目标物品的嵌入向量,其个性化引导信息通常由用户交互历史的物品嵌入序列来提供。二是个性化内容生成。这是扩散模型最具突破性的应用,即直接生成包含个性化内容的图像,例如为用户生成个性化的穿搭组合或广告图片。这可以通过使用个性化图像从头训练扩散模型,或对预训练模型(如Stable Diffusion)进行微调来实现。

在系统梳理了三大技术路径后,论文转而深入探讨了生成式推荐模型面临的核心挑战与开放性问题。这部分对于指导未来研究至关重要。第一个挑战是延迟与推理效率。生成式模型通常参数量更大,且依赖复杂的解码技术(如自回归生成),这显著增加了推荐延迟,影响了用户体验。如何提升推理效率将是长期挑战。第二个挑战是幻觉问题。由于生成式模型是从语义空间中“创造”物品,而非从固定池中检索,因此可能产生两种幻觉:一是生成不存在的物品(外部幻觉),二是生成的物品不符合输入提示中定义的用户偏好(内部幻觉)。这在推荐系统中是严重的问题,可能导致推荐不相关甚至错误的项目。第三个挑战是灾难性遗忘。许多大型生成式推荐模型是通过在预训练的生成模型(如LLM)上持续训练得到的。虽然这赋予了模型推荐能力,但往往会导致模型遗忘其原有的通用能力(如语言理解、常识推理)。这种权衡限制了开发在推荐和通用能力上都表现出色的模型。

最后,论文阐明了本教程的目标与意义。其首要目标是向对传统推荐系统和生成式模型有基本了解的受众,系统介绍生成式推荐模型的前沿技术。它不仅涵盖了LLM、语义ID、扩散模型等具体方法,还重点讨论了将生成模型应用于推荐系统时面临的独特挑战(如幻觉、效率),这些挑战与传统的内容生成任务(如语言或图像生成)有所不同。通过提供全面的技术概览和深入的挑战分析,本教程旨在激发听众的思考,为推荐系统乃至更广泛的信息检索领域的研究者提供新的视角和灵感,推动这一充满活力的交叉领域向前发展。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com