分享自:

DTCDR:一种双目标跨域推荐框架

期刊:the 28th ACM International Conference on Information and Knowledge Management (CIKM’19)DOI:10.1145/3357384.3357992

本文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


DTCDR框架:双目标跨域推荐系统的新突破

一、作者与发表信息
本研究的核心作者包括:Feng Zhu(澳大利亚麦考瑞大学)、Chaochao Chen(蚂蚁金服集团)、Yan Wang与Guanfeng Liu(麦考瑞大学)、Xiaolin Zheng(浙江大学)。研究成果以论文《DTCDR: A Framework for Dual-Target Cross-Domain Recommendation》为题,于2019年11月发表在ACM国际信息与知识管理会议(CIKM 2019)上,并被收录于会议论文集(10页,DOI: 10.11453357384.3357992)。

二、学术背景与研究目标
研究领域为推荐系统(Recommender Systems),具体聚焦于跨域推荐(Cross-Domain Recommendation, CDR)。传统CDR方法仅利用源域(source domain)的丰富数据提升目标域(target domain)的推荐性能,但现实中两个域可能在不同类型数据(如评分、评论、用户画像)上各有优势。为此,本研究提出双目标跨域推荐(Dual-Target CDR)框架DTCDR,旨在通过多任务学习(Multi-Task Learning, MTL)同时提升两个域的推荐性能,解决数据稀疏性(data sparsity)问题。

三、研究流程与方法
1. 问题建模与输入层设计
- 数据对象:两个域(如电影域和图书域)的用户评分矩阵(rating matrix)、评论、标签(tags)、用户画像(user profiles)及物品详情(item details)。
- 样本规模:实验采用真实数据集(如豆瓣电影、豆瓣图书、MovieLens),用户数从1,666至10,000不等,交互数据稀疏度达98.44%~99.33%。

  1. 嵌入层(Embedding Layer)

    • 文档嵌入(Document Embedding):使用Doc2Vec模型(DBOW子模型)将多源文本(评论、标签等)转化为用户和物品的文本向量(text vectors)。
    • 评分嵌入(Rating Embedding):优化两种神经网络模型生成潜在因子:
      • NeuMF(Neural Matrix Factorization):结合广义矩阵分解(GMF)与多层感知机(MLP),预测隐式反馈(implicit feedback)。
      • DMF(Deep Matrix Factorization):通过深度架构学习用户和物品的余弦相似性,支持显式评分(explicit ratings)。
  2. 共享层(Sharing Layer)

    • 特征组合策略:对跨域共有的用户嵌入,设计三种组合算子(concat/max-pooling/average-pooling)融合文本与评分嵌入,保留数据多样性。
    • 多任务学习(MTL):通过共享共同用户的嵌入,同步训练两个域的推荐模型,避免单域数据稀疏导致的过拟合。
  3. 模型训练与输出

    • 目标函数:最小化预测交互矩阵与真实交互矩阵的误差(交叉熵损失或归一化交叉熵损失)。
    • 训练细节:采用Adam优化器,迭代50次,批量大小1,024(NeuMF)或256(DMF),潜在因子维度k∈{8,16,32,64}。

四、主要结果与逻辑链条
1. 性能对比实验
- 基线模型:包括单域模型(BPR、NeuMF、DMF)和跨域模型(CTR-RBF、EMCDR、DCDCSR)。
- 实验结果:在三个任务(豆瓣电影→图书、电影→音乐、跨系统推荐)中,DTCDR的HR@10和NDCG@10平均提升9.45%~13.90%,尤其在稀疏域(如豆瓣图书)表现显著。例如,k=16时,DMF_DTCDR_concat在豆瓣电影的HR@10达0.85,优于最佳基线模型9.2%。

  1. 关键发现
    • 组合算子效果:concat操作符性能最优,因其保留全部嵌入信息;max-pooling在部分场景中保留主导特征,但稳定性较差。
    • 维度敏感性:k=16时模型性能峰值,k>16时因参数过多导致过拟合。
    • 文档嵌入贡献:加入文本嵌入后,模型HR@10提升1.5%~2.34%,验证多源内容对缓解数据稀疏的有效性。

五、结论与价值
1. 科学价值:首次提出双目标CDR框架,通过MTL和嵌入共享实现跨域知识双向迁移,突破了传统单目标CDR的局限性。
2. 应用价值:适用于多平台推荐场景(如电商与社交媒体的跨域协同),提升长尾物品的推荐覆盖率。

六、研究亮点
1. 方法创新
- 设计可适配的组合算子(concat/mp/ap),灵活应对不同数据分布。
- 融合Doc2Vec与深度矩阵分解,统一处理结构化和非结构化数据。
2. 实验设计:在真实稀疏数据集上验证框架鲁棒性,并公开代码与数据以促进复现。

七、其他价值
研究指出未来可扩展至多目标推荐,并探索共同用户比例对性能的影响,为后续研究提供方向。


(注:以上内容严格遵循学术报告格式,未包含任何框架性提示语,且术语首次出现时标注英文原文。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com