这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
混合兴趣网络(MINET)在跨域点击率预测中的应用研究
作者及机构
本研究的核心团队来自阿里巴巴集团智能营销平台,主要作者包括Wentao Ouyang、Xiuwu Zhang、Lei Zhao、Jinmei Luo、Yu Zhang、Heng Zou、Zhaojie Liu和Yanlong Du。研究成果发表于2020年10月的ACM国际信息与知识管理会议(CIKM ‘20),论文标题为《MINET: Mixed Interest Network for Cross-Domain Click-Through Rate Prediction》。
学术背景
点击率预测(Click-Through Rate Prediction, CTR)是在线广告系统的核心任务,直接影响广告排序策略和收费模型。传统研究集中于单域(如仅广告数据)场景,通过特征交互(如Factorization Machines)、用户行为历史(如Deep Interest Network)或上下文信息(如Deep Spatio-Temporal Network)建模。然而,广告常与自然内容(如新闻)混合展示,这为跨域(Cross-Domain)CTR预测提供了机会。本研究的目标是通过利用源域(新闻)的辅助数据提升目标域(广告)的CTR预测性能,解决数据稀疏性和冷启动问题。
研究流程与方法
1. 问题定义与数据准备
- 数据集:研究使用UC头条(UC Toutiao)的新闻-广告日志(6天训练、1天验证、1天测试)和Amazon的书籍-电影评分数据(按时间划分训练/验证/测试集)。特征包括用户ID、年龄、新闻/广告标题等。
- 跨域挑战:需解决源域与目标域特征维度差异、噪声过滤、知识迁移等问题。
模型设计(MINET)
训练与优化
实验验证
主要结果
1. 性能提升:MINET在UC头条的在线A/B测试中,CTR提升4.12%,已部署至主流量服务。
2. 注意力机制有效性:项目级注意力能动态分配权重(如娱乐新闻对游戏广告的权重更高);兴趣级注意力可缓解维度差异(如长期兴趣( p_u )的权重随目标广告变化)。
3. 跨域知识迁移:通过联合训练和转移矩阵,新闻域的语义信息显著提升了广告冷启动场景的预测效果。
结论与价值
1. 科学价值:首次提出联合建模长/短期跨域兴趣的框架,为多域数据融合提供新思路。
2. 应用价值:解决了广告场景中的数据稀疏性问题,尤其适用于新闻feed等混合内容平台。
3. 方法论创新:双层注意力机制和动态权重设计可扩展至其他推荐系统任务。
研究亮点
1. 三层兴趣建模:首次同时捕获跨域长期兴趣、源域短期兴趣和目标域短期兴趣。
2. 可解释性:注意力权重可视化显示模型能捕捉新闻与广告的潜在关联(如娱乐新闻→游戏广告)。
3. 工程实践:通过矩阵分解和参数共享降低计算成本,适合工业级部署。
其他发现
- 在电商场景(Amazon数据)中,长期兴趣的贡献高于短期兴趣,与广告场景相反,说明领域特性需针对性建模。
- 开源代码(GitHub)和公开数据集促进了跨域研究的可复现性。
该研究通过创新的模型设计和严谨的实验验证,为跨域CTR预测树立了新的基准,兼具学术前瞻性和工业实用性。