这篇文档属于类型a,是一篇关于跨领域推荐系统(Cross-Domain Recommendation, CDR)的原创性研究论文。以下是详细的学术报告内容:
一、作者与发表信息
本文由Lei Huang、Weitao Li、Chenrui Zhang、Jinpeng Wang、Xianchun Yi和Sheng Chen共同完成,作者均来自美团(Meituan)公司。论文标题为《EXIT: An Explicit Interest Transfer Framework for Cross-Domain Recommendation》,发表于CIKM ’24(第33届ACM国际信息与知识管理会议),会议时间为2024年10月21日至25日,地点为美国爱达荷州博伊西。
二、学术背景
研究领域与背景知识
研究领域为跨领域推荐系统(CDR),旨在通过源领域(source domain)的知识迁移解决目标领域(target domain)的数据稀疏性和兴趣偏差问题。传统CDR方法通常采用隐式建模(implicit paradigm),通过共享嵌入或模式学习实现知识迁移,但存在负迁移(negative transfer)风险,即源领域的不相关兴趣可能干扰目标领域的推荐效果。
研究动机与目标
在美团等工业场景中,不同业务领域(如外卖、酒店预订、团购)的服务功能和用户兴趣差异显著,隐式建模难以区分可迁移的兴趣信号。因此,本文提出显式兴趣迁移框架(EXIT),通过监督学习直接建模兴趣迁移过程,解决以下问题:
1. 负迁移控制:避免源领域不相关兴趣(如临时药品搜索)干扰目标领域推荐。
2. 场景感知迁移:根据细粒度场景(如时间、地点)动态调整兴趣迁移强度。
三、研究流程与方法
1. 框架设计
EXIT包含三个核心组件:
- 兴趣预测网络(Interest Prediction Network, IPN):分别建模用户对目标领域和源领域的兴趣((P{target})和(P{source}))。
- 兴趣组合标签(Interest Combination Label, ICL):构造监督信号,指导模型学习何时迁移兴趣。
- 场景选择器网络(Scene Selector Network, SSN):基于场景特征(如时间、用户画像)预测兴趣迁移概率((P_{trans}))。
2. 数据与实验设置
- 数据集:使用美团生产环境数据,包含主页推荐(目标领域)及搜索、频道板块(源领域)的用户行为日志。训练集样本量达10亿级,测试集约2.6亿。
- 基线模型:对比单领域模型(如DNN、DeepFM)和跨领域模型(如MINet、UniCDR)。
3. 关键技术细节
- ICL构造:
- 若用户同时在源和目标领域对某商品感兴趣((y^t=1, y^s=1)),ICL设为2,鼓励高迁移概率。
- 若兴趣不一致((y^t=0, y^s=1)),引入群体一致性兴趣(group consistency interest, (\eta)),通过协同过滤计算迁移合理性(公式5)。
- SSN设计:输入场景特征(如用户年龄、商品类别、时间),通过多层感知机(MLP)输出(P_{trans}),确保迁移强度与场景匹配。
4. 损失函数
采用多任务联合损失(公式10),结合交叉熵损失(目标/源领域兴趣预测)和L1损失(ICL监督)。
四、主要结果
1. 离线实验
- AUC提升:EXIT在测试集上AUC达0.9098,优于最佳基线UniCDR(0.9075)。
- 负迁移控制:通过ICL和SSN,EXIT的负反馈率(NFR)降低6.937%,显著优于其他模型。
2. 在线A/B测试
- 业务指标:在美团主页推荐系统中,EXIT带来1.23%的点击转化率(CTCVR)和3.65%交易总额(GTV)提升。
- 案例验证:如表5所示,EXIT成功迁移用户对火锅团购的兴趣((P{trans}=0.792)),同时抑制药品推荐((P{trans}=0.048))。
3. 消融实验
- ICL的作用:移除ICL后,NFR上升0.779%,验证其负迁移控制能力。
- SSN的作用:移除场景特征后,CTCVR下降0.244%,显示场景感知的必要性。
五、结论与价值
科学价值
- 显式范式创新:首次通过监督学习建模兴趣迁移过程,为CDR提供可解释性框架。
- 工业适用性:无需复杂网络结构,可快速部署于生产环境。
应用价值
- 业务提升:在美团主页推荐中实现显著收益,日均服务亿级流量。
- 用户体验优化:通过抑制负迁移,降低用户负面反馈。
六、研究亮点
- 显式兴趣迁移:通过ICL和SSN实现可控迁移,解决隐式范式的核心缺陷。
- 场景感知设计:首次将细粒度场景特征融入迁移强度建模。
- 高效部署:框架轻量,适合工业级推荐系统。
七、其他价值
- 开源工具:实验基于Spark实现群体兴趣计算,支持大规模数据处理。
- 跨领域扩展性:未来可探索无重叠用户/商品场景的迁移方法。
(报告总字数:约1500字)