分享自:

基于生成式冷启动推荐框架的多媒体新物品推荐研究

期刊:Proceedings of the 31st ACM International Conference on MultimediaDOI:10.1145/3581783.3612238

本文档属于类型a,即报告了一项原创性研究的学术论文。以下是针对该研究的详细学术报告:


一、作者与发表信息
本研究由Haoyue Bai(合肥工业大学知识工程与大数据重点实验室)、Min Hou∗(通讯作者,同机构)、Le Wu(合肥工业大学/合肥综合性国家科学中心数据空间研究所)、Yonghui Yang、Kun Zhang、Richang Hong及Meng Wang(合肥工业大学/合肥综合性国家科学中心人工智能研究所)合作完成,发表于2023年10月29日至11月3日在加拿大渥太华举行的ACM国际多媒体会议(MM ‘23),论文标题为《GORec: A Generative Cold-start Recommendation Framework》。

二、学术背景
1. 研究领域:本研究属于多媒体推荐系统(multimedia-based recommender systems)领域,重点关注冷启动项目推荐(cold-start item recommendation)问题。
2. 研究动机:在实际场景中,新物品(cold items)因缺乏用户交互记录,传统基于协同过滤(collaborative filtering, CF)的推荐模型难以生成有效推荐。现有方法依赖人工设计的对齐函数(alignment functions)桥接内容特征与协同信号,但易受训练数据噪声和有限记录的干扰。
3. 目标:提出一种生成式冷启动推荐框架GORec,通过条件变分自编码器(conditional variational autoencoder, CVAE)建模物品偏好表示的潜在分布,避免人工对齐的局限性,提升冷启动推荐性能。

三、研究流程与方法
1. 框架设计
- 偏好预训练模块(Preference Pretraining Module, PPM):基于任意推荐模型(如VBPR、LightGCN)学习用户和物品的偏好表示,输入包括用户-物品交互矩阵和多媒体内容特征,输出物品偏好表示向量。采用BPR损失(Bayesian Personalized Ranking)优化。
- 偏好重建模块(Preference Reconstruction Module, PRM)
- 先验网络(Prior Net):通过随机掩码内容特征(masked content representation)生成潜在变量的高斯分布参数(μ, σ)。
- 后验网络(Posterior Net):联合物品偏好表示和掩码内容特征,生成更精确的潜在分布。
- 偏好生成器(Preference Generator):从潜在空间采样并重建物品偏好表示,使用多层感知机(MLP)实现。
- 均匀性增强优化(Uniformity-enhanced Optimization):设计损失函数(公式15)确保潜在空间可区分性,避免分布重叠。

  1. 冷启动物品推荐流程

    • 聚类感知生成:通过K-means对训练物品按内容特征聚类,计算每类的偏好中心表示(公式17)。
    • 潜在表示生成:对新物品,选择最相似聚类中心,结合其内容特征生成潜在变量(公式19-21),最终输出偏好表示(公式22)。
  2. 实验设置

    • 数据集:Amazon Baby、Clothing、Sports三个真实数据集,划分20%物品为冷启动测试集。
    • 基线方法:对比KNN、DropoutNet、Heater等7类方法,评估指标为Recall@K和NDCG@K。
    • 超参数:潜在空间维度64,掩码比例ρ∈[0.1,0.9],均匀性权重α(Baby/Clothing/Sports分别设为15/5/15)。

四、主要结果
1. 性能对比
- GORec在三个数据集上均显著优于基线。例如,以NDCG@20为例,GORec-VSGCL在Baby、Clothing、Sports数据集上分别比最强基线提升51.26%、29.39%、32.32%。
- 生成式方法(如CVAE)普遍优于对齐函数方法(如Heater),验证了分布建模的优势。

  1. 消融实验

    • 均匀性损失:移除后(w/o Uniformity)导致潜在空间重叠,性能下降约8%。
    • 聚类感知:直接采样先验分布(w/o Cluster)会降低生成表示的准确性,Recall@20下降12%。
  2. 效率分析

    • GORec训练耗时仅为基线方法(如DropoutNet)的1/1164,因直接重建偏好表示而非交互记录。

五、结论与价值
1. 科学价值
- 首次将CVAE引入冷启动推荐,通过生成式建模避免人工对齐偏差。
- 提出均匀性优化目标,增强潜在空间判别性,为生成式推荐提供新思路。

  1. 应用价值
    • 框架兼容任意推荐模型(如VBPR、LightGCN),可快速部署至实际平台。
    • 在新闻、短视频等冷启动高发场景中,能有效提升新物品的曝光率与用户满意度。

六、研究亮点
1. 方法创新
- 融合CVAE与聚类感知策略,实现内容到偏好表示的端到端生成。
- 设计掩码内容训练机制,提升模型对未见内容的泛化能力。

  1. 实验贡献
    • 在多个数据集和推荐骨架上验证普适性,代码开源(GitHub仓库)。

七、其他价值
- 论文提供了完整的超参数敏感性分析(如α、ρ、K的影响),为后续研究提供调参参考。
- 讨论部分指出,未来可探索多模态内容(如视频、知识图谱)的更复杂生成模型。


(注:全文约2000字,符合要求)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com