这篇文档属于类型a,是一篇关于推荐系统中生成式智能体(generative agents)研究的原创学术论文。以下是详细的学术报告:
该研究由以下学者合作完成:
- An Zhang*(新加坡国立大学)
- Yuxin Chen*(新加坡国立大学)
- Leheng Sheng*(清华大学)
- Xiang Wang†(中国科学技术大学,合肥综合国家科学中心数据空间研究所)
- Tat-Seng Chua(新加坡国立大学)
(*并列第一作者,†通讯作者)
论文发表于ACM SIGIR 2024(第47届国际信息检索研究与发展会议),标题为《On Generative Agents in Recommendation》,并获CC BY 4.0许可。
研究聚焦于推荐系统(Recommender Systems)与大语言模型(LLM)的交叉领域。传统推荐系统面临离线指标与在线性能脱节的问题,阻碍算法迭代。作者提出Agent4Rec,一种基于LLM的生成式智能体模拟器,旨在通过模拟真实用户行为,弥合这一鸿沟。
核心研究问题(RQ1):生成式智能体能否在推荐系统中真实模拟人类用户的独立行为?
目标:构建包含智能体与推荐环境的双核心模拟器。
- 智能体架构:
- Profile模块:初始化用户画像,包含社会特质(活跃度、从众性、多样性)和个性化偏好(基于MovieLens-1M等真实数据集)。
- Memory模块:记录事实记忆(如交互历史)和情感记忆(如满意度、疲劳度),支持基于情感的反思机制。
- Action模块:支持口味驱动(观看、评分)和情感驱动(退出系统、评价推荐列表)行为。
- 推荐环境:
- 采用页面式推荐(page-by-page)模拟真实平台(如Netflix),支持随机、热门、矩阵分解(MF)、LightGCN等算法。
研究对象:1,000个基于MovieLens-1M初始化的LLM智能体(GPT-3.5-turbo驱动)。
实验设计:
1. 用户偏好对齐测试:要求智能体区分用户历史交互与非交互项目,验证其偏好一致性。
2. 评分分布对齐:对比智能体与真实用户的评分分布(如高分占比、低分稀疏性)。
3. 社会特质验证:通过分层实验(高/中/低活跃度组)分析行为差异。
4. 推荐策略评估:测试不同算法(如MF vs. LightGCN)对智能体满意度的影响。
用户偏好对齐:
评分分布一致性:
社会特质影响:
推荐算法性能:
页面式推荐增强:
该研究为推荐系统与LLM结合提供了标杆性框架,其仿真能力与因果分析潜力或将成为未来研究的重要范式。