分享自:

广告领域中的自适应连体网络跨域LTV预测

期刊:Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '24)DOI:10.1145/3637528.3671612

这篇文档属于类型a,是一篇关于广告领域客户终身价值(LTV)预测的原创研究论文。以下是详细的学术报告:


作者及发表信息

本研究由Ruize Wang(腾讯)、Hui Xu(腾讯)、Ying Cheng(复旦大学)、Qi He(腾讯)、Xing Zhou(腾讯)、Rui Feng(复旦大学)、Wei Xu(腾讯)、Lei Huang(腾讯)、Jie Jiang(腾讯)合作完成,发表于KDD ‘24(第30届ACM SIGKDD知识发现与数据挖掘会议),会议时间为2024年8月25–29日,地点为西班牙巴塞罗那。论文标题为《ADSNet: Cross-Domain LTV Prediction with an Adaptive Siamese Network in Advertising》。


学术背景

科学领域:本研究属于计算广告学(computational advertising)与跨域迁移学习(cross-domain transfer learning)的交叉领域,聚焦于客户终身价值(Lifetime Value, LTV)预测模型的优化。

研究动机
1. 问题背景:广告平台需通过LTV预测评估用户长期价值,但实际数据稀疏性严重(尤其是购买行为位于广告转化漏斗末端),导致模型性能受限。
2. 现有局限:传统方法(如零膨胀对数正态分布ZILN)假设简单,难以捕捉真实场景中的多模态分布;跨域联合学习易因数据分布差异引发负迁移(negative transfer)。
3. 研究目标:提出ADSNet框架,通过自适应孪生网络(Adaptive Difference Siamese Network)整合外部数据,解决数据稀疏性并抑制负迁移,提升LTV预测精度。


研究流程与方法

1. 模型架构设计

ADSNet包含以下核心模块:
- 伪孪生网络(Pseudo-Siamese Network)
- Vanilla Network:仅使用广告平台内部数据训练。
- Gain Network:同时接收内外部数据,通过增益评估策略(Gain Evaluation Strategy)计算外部样本对目标域的信息增益(Information Gain, ( W_G )),拒绝负增益样本(( W_G \leq 0 ))。
- 域适应模块(Domain Adaptation Module)
- 使用适配器层(Adapter)和知识蒸馏(MSE损失)对齐嵌入层和塔层的特征分布,减少域间差异。
- 多粒度预测塔(Tower Layer)
- 粗粒度:购买概率预测(二分类,交叉熵损失)。
- 细粒度:购买金额预测(有序分类,Ordinal Classification),将连续LTV标签分段为等级标签,通过多个二元分类器建模累积分布函数。

2. 训练策略

  • 迭代对齐策略(Iterative Alignment Strategy)
    1. 预热阶段:仅用内部数据训练Vanilla Network。
    2. 联合训练阶段:同步更新Gain Network和Vanilla Network参数,每500步同步一次,防止两网络差异过大。

3. 实验设计

  • 数据集:来自腾讯广告系统的90天日志数据,包含4个内部业务域(Domain #1–#3)和授权外部数据,日均样本量从9k(Domain #1)到225k(外部数据),LTV均值差异显著(0.34–8.02)。
  • 基线模型
    • 单域模型:DeepFM、ZILN、FiBiNet、GateNet。
    • 跨域模型:Share-Bottom、MMoE、STAR、CCTL。
  • 评估指标:AUC(区分购买用户)和归一化基尼系数(Normalized Gini,衡量LTV排序一致性)。

主要结果

  1. 性能对比

    • ADSNet在全部域上显著优于基线,平均Gini提升1%–5%(Domain #3达0.9570 vs. STAR的0.9448)。
    • 引入外部数据后,传统跨域模型(如Share-Bottom)因负迁移导致性能下降,而ADSNet通过增益评估策略有效缓解此问题。
  2. 消融实验

    • 增益评估策略:移除后Gini下降3.2%(0.856→0.824),证明其拒绝噪声样本的关键作用。
    • 域适应模块:移除后Gini下降2.3%,显示特征分布对齐的必要性。
  3. 长尾预测改进

    • 在样本量极少区间([0,15]),ADSNet的Gini较单域模型提升15.2%,表明外部数据显著增强对稀疏广告的预测能力。
  4. 在线A/B测试

    • 在腾讯广告平台部署后,LTV提升3.47%,GMV(Gross Merchandise Value)提升3.89%,验证了实际业务价值。

结论与价值

  1. 科学价值

    • 提出首个面向LTV预测的跨域自适应框架,通过伪孪生网络和增益评估策略解决了负迁移问题。
    • 创新性地将有序分类引入LTV金额预测,更贴合实际场景的多模态分布特性。
  2. 应用价值

    • 为广告平台提供了可扩展的LTV预测方案,通过整合外部数据突破数据稀疏性瓶颈。
    • 在线测试证实其可直接提升广告投放ROI,具有商业化落地潜力。

研究亮点

  1. 方法创新

    • 增益评估策略:动态量化外部数据贡献,实现选择性迁移。
    • 迭代对齐:通过参数同步防止网络发散,稳定训练过程。
  2. 性能突破

    • 在稀疏数据和分布偏移场景下,ADSNet的Gini和AUC均达到SOTA,长尾预测性能尤为突出。
  3. 跨域通用性:框架可扩展至其他广告任务(如CTR预测),为跨域学习提供新思路。


其他有价值内容

论文开源了行业级LTV预测数据集(尽管因隐私政策未公开完整统计),为后续研究提供了基准。此外,作者指出未来将探索强化学习优化增益评估策略,进一步提升自适应能力。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com