分享自:

多智能体协同过滤:面向智能体推荐的用户与项目协同编排

期刊:Proceedings of the ACM Web Conference 2026 (WWW '26)DOI:10.1145/3774904.3792931

本文介绍了一项发表于2026年ACM网络会议(WWW ‘26)的研究工作,题为《Multi-Agent Collaborative Filtering: Orchestrating Users and Items for Agentic Recommendations》。该研究由来自加州大学圣地亚哥分校的Yu Xia和Julian McAuley,以及来自Adobe Research的Sungchul Kim、Tong Yu和Ryan A. Rossi共同完成。这项研究属于信息科学领域,具体聚焦于推荐系统与大型语言模型(LLM)交叉的前沿方向——智能体推荐(Agentic Recommendation)。

研究的核心背景在于,随着大语言模型的发展,推荐系统正从静态的预测模型向能够规划、推理、使用工具并与用户交互的智能体(Agent)转变。现有的智能体推荐系统主要遵循两种模式:一种是使用单一LLM智能体进行“规划-执行”循环,另一种是组织多个LLM智能体进行通用的任务分解。然而,这些方法存在一个关键局限:它们未能有效利用用户-物品交互历史中的协同信号(Collaborative Signals),即传统协同过滤(Collaborative Filtering, CF)算法所依赖的“相似用户喜欢相似物品”或“用户喜欢与历史物品相似的物品”的核心思想。这导致现有智能体推荐系统的推荐结果往往不尽如人意。因此,本研究旨在解决这一问题,其核心目标是将传统协同过滤的思想与基于LLM的多智能体协作相结合,提出一个能够结构化利用协同信号的智能体推荐框架,以提升推荐的质量和可解释性。

为实现这一目标,研究团队提出了一个名为“多智能体协同过滤”(Multi-Agent Collaborative Filtering, MACF)的创新框架。该框架的详细工作流程是其核心贡献,可概括为以下几个关键步骤:

首先,问题定义与工具准备。研究将推荐任务定义为:给定一个目标用户u、其历史交互序列Hu和一个自然语言查询q,目标是生成一个排序列表Ru,q,该列表需同时反映查询q中的短期意图和Hu中体现的长期偏好。为实现此目标,框架预设了四种可调用的检索工具:getSimilarUsers(获取相似用户)、getRelevantItems(从用户历史中获取与查询相关的物品)、retrieveByQuery(基于查询检索物品)和retrieveByItem(基于物品检索相似物品)。这些工具为后续智能体的运作提供了数据基础。

其次,智能体实例化。MACF框架的核心创新在于创建了两类与协同过滤结构对应的LLM智能体:用户智能体(User Agent)和物品智能体(Item Agent),并由一个中央编排智能体(Orchestrator Agent)进行协调。对于给定的目标用户和查询,编排智能体会调用getSimilarUsersgetRelevantItems工具,分别选取一组与目标用户相似的用户(记为Nu)和一组与查询相关的用户历史物品(记为Hu,q)。随后,为Nu中的每个相似用户实例化一个用户智能体,为Hu,q中的每个历史物品实例化一个物品智能体。每个用户智能体被赋予一个包含其自身偏好模式和交互历史的简介,使其能够从“相似用户”的视角推断目标用户的偏好;每个物品智能体则被赋予其属性和元数据简介,使其能够从“相关历史物品”的视角分析用户偏好与当前查询的关联。这些智能体均能调用上述检索工具来搜索候选物品。

第三,动态多轮协作与编排。这是MACF工作流程中最复杂和关键的部分,它模拟了协同过滤中的动态信息聚合过程,而非简单的静态加权平均。 1. 动态智能体招募(Dynamic Agent Recruitment):在讨论开始(第0轮),编排智能体根据查询q筛选并确定初始参与讨论的用户和物品智能体集合A。 2. 个性化协作指令(Personalized Collaboration Instruction):在每一轮讨论开始,编排智能体会为集合A中的每个智能体生成个性化的指令。这些指令基于智能体的独特档案、目标用户信息以及当前轮次草案排序列表Rt的状态而定,指导智能体执行诸如提出新候选、优化先前建议、解决冲突等特定任务。例如,可能指示某个用户智能体“基于你对品牌时尚品的偏好,推荐一些流行的男士工装短裤”。 3. 用户-物品协作编排(User-Item Collaboration Orchestration):智能体们根据指令进行“讨论”,它们可以调用工具检索新物品,提出建议,并基于共享的讨论历史对其他智能体的观点进行支持、批评或反驳。这实质上是通过语言交互,将基于用户的协同过滤(User-based CF)和基于物品的协同过滤(Item-based CF)的证据动态结合起来。 4. 充分性测试与迭代(Sufficiency Test & Iteration):每一轮讨论结束后,编排智能体会根据所有智能体的输出生成一个更新的草案排序列表Rt,并对其进行“充分性测试”。该测试检查列表是否满足三个条件:(i) 包含足够数量(K个)且与查询明显相关的唯一物品;(ii) 物品与智能体提供的理由相符;(iii) 具有清晰的按相关性排序的顺序。如果测试通过或达到最大轮次Tmax,则讨论终止,当前Rt作为最终推荐列表输出。如果未通过,编排智能体会选择对改进当前列表最有用的一个智能体子集At ⊆ A,为它们生成新一轮的个性化指令,继续讨论。这个过程允许系统自适应地聚焦于解决推荐中的不确定性(如并列项、冲突或低相关性物品)。

该研究在三个亚马逊公开数据集(Clothing, Beauty, Music)上进行了实验,采用了用户模拟器驱动的评估协议,使用HitRate@10 (H@10) 和 NDCG@10 (N@10) 作为评估指标。

实验的主要结果有力地支持了MACF框架的有效性。如表1所示,MACF在三个数据集的所有指标上均 consistently(一致地)超越了多种强大的基线模型。这些基线包括传统的检索模型(BM25, BGE-M3, BGE-Reranker)、经典的协同过滤算法(ItemCF, UserCF),以及一系列最新的单智能体(ReAct, Reflexion, InterRecAgent)和多智能体(MACRec, MACRS, TaiRA)智能体推荐系统。例如,在Amazon Clothing数据集上,MACF的H@10达到了0.5238,显著高于最佳基线Taira的0.4447;在Amazon Music数据集上,其H@10达到0.5450,NDCG@10达到0.7668,均位列第一。这些结果表明,将协同过滤信号通过多智能体协作进行结构化利用,能够显著提升推荐的相关性和排序质量。

此外,研究还进行了深入的消融实验(Ablation Study)和额外分析,以验证框架中各个组件的必要性。如表2所示,当移除“个性化协作指令”(PCI)或“动态智能体招募”(DAR)模块时,模型在所有数据集上的性能均出现下降,这证实了结构化智能体选择和针对性指导的价值。当禁用“自适应工具使用”(ATU,即智能体仅在开始时调用一次工具)时,性能下降更为明显,尤其是在Music数据集上,这说明了在讨论过程中根据上下文动态调用工具的重要性。图2展示了MACF讨论轮数的分布情况,结果显示大多数查询在3轮内即结束讨论,很少达到预设的最大轮数5轮,这证明了“充分性测试”机制能够有效地判断推荐列表何时已准备就绪,从而在保证质量的同时控制了计算成本。

基于以上结果,本研究得出的核心结论是:所提出的多智能体协同过滤(MACF)框架成功地将传统协同过滤的思想与基于LLM的多智能体协作相结合,通过将相似用户和相关物品实例化为智能体,并利用中央编排器进行动态协调,能够将用户-物品交互证据转化为一种交互式的、查询感知的多智能体讨论过程,从而产生更高质量的推荐。实验在三个不同领域数据集上的一致提升,凸显了这种智能体建模方法在未来推荐系统中的潜力。

本研究的科学价值和应用价值显著。在科学上,它首次明确地在智能体推荐系统中构建了与传统协同过滤的类比,为理解和使用LLM智能体进行协同信号建模提供了新的理论视角和系统化方法。在应用上,MACF框架能够生成带有清晰推理过程(通过智能体讨论)的推荐,增强了推荐系统的可解释性和交互性,为构建下一代智能、透明、协作式的推荐助手(如购物助手、内容发现助手)提供了可行的技术路径。

本研究的亮点突出体现在以下几个方面:第一,重要的创新性方法:提出了首个明确借鉴协同过滤思想的多智能体推荐框架,通过“用户智能体”和“物品智能体”的具身化,将抽象的协同信号转化为具象的、可交互的智能体角色。第二,新颖的动态编排机制:设计了包含动态智能体招募、个性化协作指令和多轮充分性测试的中央编排器,使得多智能体协作不再是固定流程,而是能根据具体查询和上下文自适应调整的有机过程。第三,显著的性能提升:在多个数据集上全面超越了包括最新智能体推荐模型在内的各类基线,以扎实的实验数据证明了所提框架的有效性和优越性。第四,深入的分析验证:通过系统的消融研究和讨论轮数分析,不仅验证了核心组件的必要性,也揭示了框架高效、低成本运行的特性,增加了其实用价值。这项研究为推荐系统与大型语言模型的深度融合开辟了一条富有前景的新方向。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com