分享自:

协同跨域网络在跨域推荐中的应用

期刊:2018 ACM Conference on Information and Knowledge Management (CIKM’18)DOI:10.1145/3269206.3271684

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


跨域推荐的新方法:协作交叉网络(CoNet)

1. 作者与发表信息

本研究由Guangneng Hu, Yu Zhang, Qiang Yang(香港科技大学计算机科学与工程系)完成,发表于2018年ACM信息与知识管理会议(CIKM’18),论文标题为《CoNet: Collaborative Cross Networks for Cross-Domain Recommendation》。

2. 学术背景

研究领域:本研究属于推荐系统与迁移学习的交叉领域,聚焦于解决推荐系统中的数据稀疏性问题。传统协同过滤(Collaborative Filtering, CF)方法(如矩阵分解)和神经协同过滤(Neural CF)虽能建模用户-物品交互,但在数据稀疏时表现不佳。跨域推荐(Cross-Domain Recommendation)通过迁移相关领域的知识缓解这一问题,但现有方法(如集体矩阵分解CMF)多为浅层模型,难以捕捉复杂的非线性交互关系。

研究动机
- 跨域推荐中,传统迁移学习方法(如共享用户隐因子)仅能实现浅层知识迁移,且假设源域与目标域的网络层结构必须相同,限制了灵活性。
- 深度神经网络(如多层感知机MLP)虽能学习复杂交互,但缺乏针对跨域场景的迁移机制。

研究目标:提出一种深度迁移学习框架(CoNet),通过双向交叉连接实现跨域知识迁移,并自适应选择需迁移的表示,提升推荐性能。

3. 研究流程与方法

3.1 基础网络设计
  • 研究对象:两个稀疏的二元交互矩阵(如用户-应用安装矩阵和用户-新闻阅读矩阵),分别来自目标域(如应用推荐)和源域(如新闻推荐)。
  • 网络结构
    • 输入层:用户和物品的独热编码(One-Hot Encoding)。
    • 嵌入层:将独热编码映射为连续向量(用户嵌入矩阵P,物品嵌入矩阵Q)。
    • 隐藏层:采用塔式结构(如64→32→16→8),每层通过ReLU激活函数学习非线性交互。
    • 输出层:Sigmoid函数预测用户-物品交互概率。
3.2 协作交叉网络(CoNet)

核心创新:在基础网络上添加交叉连接单元(Cross Connection Unit),实现双向知识迁移:
- 交叉连接公式
- 目标域第*l*层输入:ã_app = W_app · a_app + H · a_news
- 源域第*l*层输入:ã_news = W_news · a_news + H · a_app
其中,H为可学习的迁移矩阵,控制知识迁移的方向和强度。
- 自适应稀疏变体(SCoNet):对H施加L1正则化(LASSO),稀疏化迁移矩阵,仅选择部分有用表示迁移。

3.3 训练与优化
  • 损失函数:联合优化两域的交叉熵损失(见公式10-12)。
  • 优化方法:Adam优化器,学习率0.001,批量大小128。
  • 数据集
    • Mobile:23,111用户,14,348应用(目标域),29,921新闻(源域)。
    • Amazon:80,763用户,93,799书籍(目标域),35,896电影(源域)。

4. 主要结果

4.1 性能对比
  • 基线模型:包括BPRMF(浅层单域)、CMF(浅层跨域)、MLP(深度单域)、CSN(深度跨域)。
  • 关键指标:NDCG、HR、MRR。
    • Mobile数据集:SCoNet比最佳基线(CSN)提升2.29%(NDCG)。
    • Amazon数据集:SCoNet比最佳基线(MLP++)提升7.84%(NDCG)。
4.2 稀疏迁移的必要性
  • 稀疏化效果:SCoNet中迁移矩阵H的零值比例达6.5%,表明仅部分表示需迁移,避免噪声干扰。
  • 消融实验:固定标量迁移(如CSN)在Amazon数据上性能甚至低于单域MLP,验证了自适应选择的重要性。
4.3 迁移学习的实际价值
  • 数据量减少实验:SCoNet在目标域训练样本减少2.05%(Mobile)和1.11%(Amazon)时,性能仍与非迁移方法相当,相当于节省数万标注样本的成本。

5. 结论与价值

科学价值
- 提出首个基于深度神经网络的跨域推荐框架,通过双向交叉连接和稀疏迁移矩阵,解决了传统方法无法灵活迁移深层表示的问题。
- 证明了跨域推荐中选择性迁移的必要性,为后续研究提供了方法论指导。

应用价值
- 在数据稀疏场景(如冷启动)下,可显著降低对目标域数据量的依赖,节省企业数据收集成本。
- 框架可扩展至多领域推荐(如电商与社交媒体的跨平台协同)。

6. 研究亮点

  1. 深度迁移机制:首次将交叉连接单元引入推荐系统,支持异构网络层的双向知识迁移。
  2. 自适应稀疏性:通过L1正则化实现迁移表示的动态选择,提升模型鲁棒性。
  3. 实证优势:在两大真实数据集上验证了性能提升和数据效率,结果具有可复现性。

7. 其他贡献

  • 开源代码实现(基于TensorFlow),为社区提供了可复用的工具。
  • 对迁移矩阵H的优化过程进行了可视化分析,揭示了知识迁移的动态规律。

这篇论文通过创新的网络设计和严谨的实验验证,为跨域推荐领域提供了兼具理论深度和实用价值的解决方案。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com