广告领域中的自适应连体网络跨域LTV预测

分享自：
广告领域中的自适应连体网络跨域LTV预测

期刊:Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '24)DOI:10.1145/3637528.3671612
【点击此处】阅读全文、收藏及针对性提问
这篇文档属于类型a，是一篇关于广告领域客户终身价值（LTV）预测的原创研究论文。以下是详细的学术报告：
作者及发表信息本研究由Ruize Wang（腾讯）、Hui Xu（腾讯）、Ying Cheng（复旦大学）、Qi He（腾讯）、Xing Zhou（腾讯）、Rui Feng（复旦大学）、Wei Xu（腾讯）、Lei Huang（腾讯）、Jie Jiang（腾讯）合作完成，发表于KDD ‘24（第30届ACM SIGKDD知识发现与数据挖掘会议），会议时间为2024年8月25–29日，地点为西班牙巴塞罗那。论文标题为《ADSNet: Cross-Domain LTV Prediction with an Adaptive Siamese Network in Advertising》。
学术背景科学领域：本研究属于计算广告学（computational advertising）与跨域迁移学习（cross-domain transfer learning）的交叉领域，聚焦于客户终身价值（Lifetime Value, LTV）预测模型的优化。
研究动机：
 1. 问题背景：广告平台需通过LTV预测评估用户长期价值，但实际数据稀疏性严重（尤其是购买行为位于广告转化漏斗末端），导致模型性能受限。
 2. 现有局限：传统方法（如零膨胀对数正态分布ZILN）假设简单，难以捕捉真实场景中的多模态分布；跨域联合学习易因数据分布差异引发负迁移（negative transfer）。
 3. 研究目标：提出ADSNet框架，通过自适应孪生网络（Adaptive Difference Siamese Network）整合外部数据，解决数据稀疏性并抑制负迁移，提升LTV预测精度。
研究流程与方法1. 模型架构设计ADSNet包含以下核心模块：
 - 伪孪生网络（Pseudo-Siamese Network）：
 - Vanilla Network：仅使用广告平台内部数据训练。
 - Gain Network：同时接收内外部数据，通过增益评估策略（Gain Evaluation Strategy）计算外部样本对目标域的信息增益（Information Gain, ( W_G )），拒绝负增益样本（( W_G \leq 0 )）。
 - 域适应模块（Domain Adaptation Module）：
 - 使用适配器层（Adapter）和知识蒸馏（MSE损失）对齐嵌入层和塔层的特征分布，减少域间差异。
 - 多粒度预测塔（Tower Layer）：
 - 粗粒度：购买概率预测（二分类，交叉熵损失）。
 - 细粒度：购买金额预测（有序分类，Ordinal Classification），将连续LTV标签分段为等级标签，通过多个二元分类器建模累积分布函数。
2. 训练策略迭代对齐策略（Iterative Alignment Strategy）：
 预热阶段：仅用内部数据训练Vanilla Network。
 
联合训练阶段：同步更新Gain Network和Vanilla Network参数，每500步同步一次，防止两网络差异过大。
 
3. 实验设计数据集：来自腾讯广告系统的90天日志数据，包含4个内部业务域（Domain #1–#3）和授权外部数据，日均样本量从9k（Domain #1）到225k（外部数据），LTV均值差异显著（0.34–8.02）。
 
基线模型：
 单域模型：DeepFM、ZILN、FiBiNet、GateNet。
 
跨域模型：Share-Bottom、MMoE、STAR、CCTL。
 
评估指标：AUC（区分购买用户）和归一化基尼系数（Normalized Gini，衡量LTV排序一致性）。
 
主要结果性能对比：
ADSNet在全部域上显著优于基线，平均Gini提升1%–5%（Domain #3达0.9570 vs. STAR的0.9448）。
 
引入外部数据后，传统跨域模型（如Share-Bottom）因负迁移导致性能下降，而ADSNet通过增益评估策略有效缓解此问题。
 
消融实验：
增益评估策略：移除后Gini下降3.2%（0.856→0.824），证明其拒绝噪声样本的关键作用。
 
域适应模块：移除后Gini下降2.3%，显示特征分布对齐的必要性。
 
长尾预测改进：
在样本量极少区间（[0,15]），ADSNet的Gini较单域模型提升15.2%，表明外部数据显著增强对稀疏广告的预测能力。
 
在线A/B测试：
在腾讯广告平台部署后，LTV提升3.47%，GMV（Gross Merchandise Value）提升3.89%，验证了实际业务价值。
 
结论与价值科学价值：
提出首个面向LTV预测的跨域自适应框架，通过伪孪生网络和增益评估策略解决了负迁移问题。
 
创新性地将有序分类引入LTV金额预测，更贴合实际场景的多模态分布特性。
 
应用价值：
为广告平台提供了可扩展的LTV预测方案，通过整合外部数据突破数据稀疏性瓶颈。
 
在线测试证实其可直接提升广告投放ROI，具有商业化落地潜力。
 
研究亮点方法创新：
增益评估策略：动态量化外部数据贡献，实现选择性迁移。
 
迭代对齐：通过参数同步防止网络发散，稳定训练过程。
 
性能突破：
在稀疏数据和分布偏移场景下，ADSNet的Gini和AUC均达到SOTA，长尾预测性能尤为突出。
 
跨域通用性：框架可扩展至其他广告任务（如CTR预测），为跨域学习提供新思路。
其他有价值内容论文开源了行业级LTV预测数据集（尽管因隐私政策未公开完整统计），为后续研究提供了基准。此外，作者指出未来将探索强化学习优化增益评估策略，进一步提升自适应能力。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问