这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
《Prompt-enhanced Federated Content Representation Learning for Cross-domain Recommendation》研究报告
一、作者与发表信息
本研究由Lei Guo(山东师范大学)、Ziang Lu(山东师范大学)、Junliang Yu(昆士兰大学)、Quoc Viet Hung Nguyen(格里菲斯大学)和通讯作者Hongzhi Yin(昆士兰大学)合作完成,发表于2024年5月的ACM Web Conference (WWW ‘24),会议地点为新加坡。
二、学术背景与研究目标
研究领域为跨域推荐系统(Cross-domain Recommendation, CDR),旨在通过多领域知识迁移提升推荐质量。传统CDR方法存在三大局限性:
1. 隐私泄露风险:需集中聚合多领域数据,违反GDPR等隐私保护法规;
2. 特征空间割裂:依赖原子项ID(atomic item IDs)表示物品,难以统一建模;
3. 重叠用户依赖:需已知领域间重叠用户,实际场景中难以满足。
为此,作者提出PFCR(Prompt-enhanced Federated Content Representation)框架,目标是通过联邦学习(Federated Learning, FL)和自然语言通用性,实现非重叠用户场景下的隐私保护跨域推荐(Privacy-preserving CDR, PCDR)。
三、研究流程与方法
研究分为预训练与提示微调两阶段,核心流程如下:
预训练阶段:联邦内容表征学习
提示微调阶段:领域自适应
四、主要实验结果
在Amazon Office-Arts和OnlineRetail-Pantry数据集上的实验表明:
1. 性能优势:PFCR在Recall@10和NDCG@10指标上显著优于基线(如GRU4Rec、SASRec、VQRec),最高提升12.3%。
2. 消融实验:验证了VQIR、联邦内容表征(FCR)和提示调优(DP)的必要性。移除FCR导致性能下降9.7%,显示联邦学习对知识迁移的关键作用。
3. 隐私保护效果:加密策略在𝜖=0.5时平衡了隐私与性能,攻击者无法通过梯度反推用户数据。
五、研究结论与价值
1. 科学价值:
- 提出首个非重叠用户场景的联邦跨域推荐框架,通过自然语言通用性实现领域对齐。
- 创新性结合向量量化、联邦学习与提示调优,为隐私保护推荐系统提供新范式。
2. 应用价值:
- 可部署于电商、流媒体等多平台推荐场景,无需共享原始数据,符合GDPR要求。
- 代码已开源(GitHub仓库:https://github.com/ckano/pfcr)。
六、研究亮点
1. 方法创新:
- 首创“语义ID”替代传统原子ID,解决跨域物品表征统一问题。
- 设计复合加密梯度策略,兼顾隐私与模型效能。
2. 场景突破:首次实现非重叠用户跨域推荐,扩展了联邦学习的应用边界。
七、其他贡献
- 提出两种提示调优策略(Full/Light Prompting),为资源受限场景提供灵活选择。
- 实验部分对比了不同联邦算法(FedAvg、FedProx),证明FedAvg在代码嵌入表训练中的最优性。
此报告完整呈现了研究的逻辑链条与技术细节,突出了其在隐私保护与跨域推荐领域的突破性贡献。