本文档属于类型a:单篇原创研究报告。以下为针对该研究的学术报告:
作者及发表信息
该研究由Yuhao Wang(香港城市大学)、Yichao Wang(华为诺亚方舟实验室)、Zichuan Fu(香港城市大学)、Xiangyang Li(华为诺亚方舟实验室)、Wanyu Wang(香港城市大学)、Yuyang Ye(香港城市大学)、Xiangyu Zhao(香港城市大学,通讯作者)、Huifeng Guo(华为诺亚方舟实验室)、Ruiming Tang(华为诺亚方舟实验室)合作完成,发表于2024年10月的ACM国际信息与知识管理会议(CIKM ‘24),论文标题为《LLM4MSR: An LLM-Enhanced Paradigm for Multi-Scenario Recommendation》。
学术背景
研究领域:该研究属于推荐系统(Recommender Systems)领域,聚焦多场景推荐(Multi-Scenario Recommendation, MSR)任务,即利用跨场景数据提升所有场景的推荐性能。
研究动机:现有MSR方法存在两大局限:
1. 场景知识整合不足:仅依赖领域标识符(domain indicator)区分场景,忽略场景描述的语义信息,导致场景间关联性建模不充分;
2. 跨场景个性化偏好缺失:现有模型多依赖多任务学习(Multi-Task Learning)的参数共享模式,未能显式学习用户跨场景兴趣。
此外,尽管大语言模型(Large Language Model, LLM)在推理和语义捕捉方面表现优异,但其高推理延迟和高调优成本阻碍了其在工业推荐系统中的落地。
研究目标:提出一种高效、可解释的LLM增强范式LLM4MSR,通过LLM挖掘多层级场景知识,并结合分层元网络(Hierarchical Meta Networks)显式提升多场景模型的场景感知与个性化推荐能力。
研究流程与方法
1. 多场景知识推理(Multi-Scenario Knowledge Reasoning)
- 输入设计:
- 场景级提示(Scenario-Level Prompt):整合场景统计信息(如交互数、用户/商品重叠率)和语义描述(如平台背景),通过LLM推理场景共性与差异。例如,在短视频平台KuaiSAR中,分析“搜索”与“推荐”场景的共性与区别。
- 用户级提示(User-Level Prompt):基于用户历史正向交互行为(如点击、转发),构造跨场景兴趣描述模板,由LLM生成用户共性及场景特异性兴趣摘要。
- LLM处理:采用冻结参数的ChatGLM2-6B模型,提取输出最后一层隐藏状态(4096维向量)作为知识表征,避免微调带来的计算开销。
2. 多层级知识融合(Multi-Level Knowledge Fusion)
- 分层元网络架构:
- 用户级元层(User-Level Meta Layers):位于模型底层,动态生成权重与偏置矩阵,调制嵌入向量以增强个性化。
- 场景级元层(Scenario-Level Meta Layers):与多场景主干模型(如STAR、PLE)并行,通过可学习参数α自适应融合LLM推理结果与协同信号。
- 训练流程:端到端优化二元交叉熵损失函数,联合更新元网络与主干模型参数。
3. 实验验证
- 数据集:KuaiSAR-small(短视频搜索与推荐场景)、KuaiSAR(扩展版)、Amazon(三个商品推荐场景),覆盖高稀疏性与多领域场景。
- 基线模型:对比动态网络(Dynamic Network)、EPNet及多场景主干模型(STAR、MMoE等)。
- 评估指标:AUC(Area Under ROC Curve),统计显著性检验(p<0.05)。
主要结果
性能提升:
- LLM4MSR在所有数据集上显著优于基线,例如在Amazon的Rec#1场景AUC提升40%(从0.6156至0.8720),验证其处理数据稀疏性的能力。
- 兼容性测试显示,LLM4MSR可适配不同主干模型(如STAR、PLE),平均AUC提升1.5%(KuaiSAR)至40%(Amazon)。
消融实验:
- 架构有效性:用户级元层置于底层、场景级元层并行于主干的“Bottom+Parallel”结构最优,AUC较其他组合提升0.5%~1.2%。
- 提示设计影响:场景级提示对KuaiSAR贡献更大(AUC提升0.7%),用户级提示对稀疏场景(如Amazon)更关键(AUC提升20%+)。
效率分析:
- 推理延迟仅增加0.05秒(原主干模型0.017秒),满足工业系统实时性需求(<0.1秒)。
- 用户级隐藏状态预存储策略进一步降低计算开销。
可解释性案例:
- LLM生成的场景关联分析(如“搜索场景用户主动查询,推荐场景基于行为推送”)与用户兴趣摘要(如“教育类内容跨场景共性兴趣”)为推荐决策提供语义依据。
结论与价值
科学价值:
1. 首次提出通过LLM推理多场景知识(场景关联与用户跨场景兴趣)增强推荐系统,突破传统MSR依赖协同信号的局限。
2. 设计分层元网络实现语义空间与推荐空间的高效对齐,为LLM与推荐系统的结合提供新范式。
应用价值:
1. 工业部署友好:无需微调LLM,通过提示工程与轻量级元网络实现低成本增强。
2. 可扩展性:支持动态融入专家知识(通过提示设计)及适配不同主干模型。
研究亮点
- 方法论创新:
- 提出“场景-用户”双层级提示设计,实现零样本(Zero-Shot)知识推理;
- 分层元网络解决LLM输出与推荐模型的结构异构问题。
- 实验贡献:
- 构建多场景评测基准(含高稀疏场景),验证泛化性;
- 开源代码与数据(GitHub链接),推动领域复现与拓展。
其他价值
- 跨学科意义:为自然语言处理(NLP)与推荐系统的交叉研究提供实践案例,证明LLM在非生成式任务中的潜力。
- 伦理考量:用户级提示仅使用正向交互数据,减少噪声引入,符合隐私保护趋势。
(注:原文中技术术语如“meta layers”首次出现时保留英文并标注中文翻译,后续统一使用中文表述。)