分享自:

基于提示增强的联合内容表示学习的跨域推荐方法

期刊:ACM Web Conference 2024DOI:10.1145/3589334.3645337

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


《Prompt-enhanced Federated Content Representation Learning for Cross-domain Recommendation》研究报告

一、作者与发表信息
本研究由Lei Guo(山东师范大学)、Ziang Lu(山东师范大学)、Junliang Yu(昆士兰大学)、Quoc Viet Hung Nguyen(格里菲斯大学)和通讯作者Hongzhi Yin(昆士兰大学)合作完成,发表于2024年5月的ACM Web Conference (WWW ‘24),会议地点为新加坡。

二、学术背景与研究目标
研究领域为跨域推荐系统(Cross-domain Recommendation, CDR),旨在通过多领域知识迁移提升推荐质量。传统CDR方法存在三大局限性:
1. 隐私泄露风险:需集中聚合多领域数据,违反GDPR等隐私保护法规;
2. 特征空间割裂:依赖原子项ID(atomic item IDs)表示物品,难以统一建模;
3. 重叠用户依赖:需已知领域间重叠用户,实际场景中难以满足。

为此,作者提出PFCR(Prompt-enhanced Federated Content Representation)框架,目标是通过联邦学习(Federated Learning, FL)和自然语言通用性,实现非重叠用户场景下的隐私保护跨域推荐(Privacy-preserving CDR, PCDR)。

三、研究流程与方法
研究分为预训练提示微调两阶段,核心流程如下:

  1. 预训练阶段:联邦内容表征学习

    • 向量量化物品表征(VQIR)
      • 利用BERT将物品描述文本编码为语义向量,通过产品量化(Product Quantization, PQ)生成离散代码(item codes),构建全局代码嵌入表(code embedding table)。
      • 创新点:采用“文本→代码→表征”范式,避免文本特征过拟合,统一不同领域的语义空间。
    • 联邦学习框架
      • 本地训练:各领域作为客户端,基于用户交互序列训练Transformer编码器,生成序列嵌入。
      • 梯度加密与上传:仅共享物品相关梯度,采用量化(Quantization)与随机响应(Randomized Response)复合加密策略,保护隐私。
      • 服务器聚合:通过FedAvg算法聚合梯度,更新全局代码嵌入表并同步至客户端。
  2. 提示微调阶段:领域自适应

    • 全提示学习(Full Prompting):结合领域提示(Domain Prompt)与用户提示(User Prompt),通过多头注意力机制适配目标领域。
    • 轻量提示学习(Light Prompting):仅保留领域提示,降低计算开销。
    • 创新点:首次将提示调优(Prompt Tuning)引入联邦推荐场景,解决领域迁移问题。

四、主要实验结果
Amazon Office-ArtsOnlineRetail-Pantry数据集上的实验表明:
1. 性能优势:PFCR在Recall@10和NDCG@10指标上显著优于基线(如GRU4Rec、SASRec、VQRec),最高提升12.3%。
2. 消融实验:验证了VQIR、联邦内容表征(FCR)和提示调优(DP)的必要性。移除FCR导致性能下降9.7%,显示联邦学习对知识迁移的关键作用。
3. 隐私保护效果:加密策略在𝜖=0.5时平衡了隐私与性能,攻击者无法通过梯度反推用户数据。

五、研究结论与价值
1. 科学价值
- 提出首个非重叠用户场景的联邦跨域推荐框架,通过自然语言通用性实现领域对齐。
- 创新性结合向量量化、联邦学习与提示调优,为隐私保护推荐系统提供新范式。
2. 应用价值
- 可部署于电商、流媒体等多平台推荐场景,无需共享原始数据,符合GDPR要求。
- 代码已开源(GitHub仓库:https://github.com/ckano/pfcr)。

六、研究亮点
1. 方法创新
- 首创“语义ID”替代传统原子ID,解决跨域物品表征统一问题。
- 设计复合加密梯度策略,兼顾隐私与模型效能。
2. 场景突破:首次实现非重叠用户跨域推荐,扩展了联邦学习的应用边界。

七、其他贡献
- 提出两种提示调优策略(Full/Light Prompting),为资源受限场景提供灵活选择。
- 实验部分对比了不同联邦算法(FedAvg、FedProx),证明FedAvg在代码嵌入表训练中的最优性。


此报告完整呈现了研究的逻辑链条与技术细节,突出了其在隐私保护与跨域推荐领域的突破性贡献。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com