这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
快手亿级用户生命周期价值预测的工业级解决方案:ODMN框架
一、作者与发表信息
本研究由Kunpeng Li、Guangcui Shao、Naijun Yang、Xiao Fang和通讯作者Yang Song(均来自北京快手科技有限公司)共同完成,发表于2022年10月的ACM国际信息与知识管理会议(CIKM ‘22),论文标题为《Billion-User Customer Lifetime Value Prediction: An Industrial-Scale Solution from Kuaishou》。
二、学术背景
研究领域:本研究属于用户价值预测与机器学习交叉领域,聚焦于客户生命周期价值(Customer Lifetime Value, LTV)的工业级建模。
研究动机:传统LTV预测方法面临两大挑战:(1)数据分布高度不平衡(长尾分布)且动态变化;(2)多时间跨度LTV(如30天、90天、365天)之间存在有序依赖关系(如LTV₃₀ ≤ LTV₉₀ ≤ LTV₁₈₀ ≤ LTV₃₆₅),但现有方法(如两阶段XGBoost、零膨胀对数正态模型ZILN)未充分利用这种依赖关系。
研究目标:提出一种端到端框架ODMN(Order Dependency Monotonic Network),通过结合多分布多专家模块(MDME)和有序依赖建模,实现高精度、可扩展的LTV预测。
三、研究流程与方法
1. 数据准备与特征工程
- 数据集:来自快手用户增长业务,包含1.8亿新用户的行为数据(注册后7天内的活跃时长、消费记录等)及用户画像。
- 标签定义:多时间跨度LTV(LTV₃₀、LTV₉₀、LTV₁₈₀、LTV₃₆₅),即用户未来30天至1年内为平台贡献的总收入。
- 特征处理:
- 类别型特征通过共享嵌入层(Shared Embedding Layer)转换为低维稠密向量。
- 数值型特征按等频分箱离散化,并引入周期性事件(如节假日)和渠道信息作为辅助特征。
2. 核心模型设计:ODMN框架
- MDME模块(Multi Distribution Multi Experts):
- 分布分割(DSM):将LTV分布划分为若干子分布(如高/低价值用户),通过分布分类塔(DCT)和分布序数回归塔(DOT)实现。
- 子分布建模(SDM):对每个子分布进一步分桶,通过桶分类塔(BCT)、桶序数回归塔(BOT)和桶偏置回归塔(BBT)预测桶内偏差系数。
- 优势:将不平衡分布问题转化为多个相对平衡的子问题,降低建模复杂度。
- 有序依赖建模(Mono Unit):
- 通过非负权重的多层感知机(MLP)捕获上游任务(如LTV₃₀)输出分布的变化趋势,并传递给下游任务(如LTV₉₀),强制满足LTV₃₀ ≤ LTV₉₀的约束。
- 校准损失(Calibration Loss):若预测违反有序依赖(如LTV₃₀ > LTV₉₀),则施加惩罚。
3. 评估指标创新
- 互基尼系数(Mutual Gini):基于洛伦兹曲线(Lorenz Curve)提出,量化预测分布与真实分布的差异面积,优于传统基尼系数(Gini Coefficient)的判别能力。
- 其他指标:归一化均方根误差(NRMSE)、归一化平均绝对误差(NMAE)、绝对平均偏差误差(AMBE)。
四、主要结果
离线实验:
- 对比基线:ODMN在LTV₃₀至LTV₃₆₅预测上均显著优于ZILN和两阶段XGBoost(见表1)。例如,LTV₃₆₅的Mutual Gini为0.0083,较ZILN(0.0558)提升85%。
- 消融实验:验证MDME和Mono Unit的有效性。完整ODMN的AMBE较基线降低90%以上,证明有序依赖建模对减少预测偏差的关键作用。
在线A/B测试:
- 在快手广告投放中,ODMN将ROI(投资回报率)提升11.9%-14.7%,验证其工业落地价值。
五、结论与价值
- 科学价值:
- 首次提出通过有序依赖网络建模多时间跨度LTV的约束关系,为序列依赖预测问题提供新思路。
- MDME模块的创新设计证明“分治策略”在长尾分布建模中的有效性。
- 应用价值:
- 已部署至快手用户增长业务,支持日级别全量用户预测,优化渠道选择和广告竞价策略。
- 框架可扩展至其他需处理不平衡分布和时序依赖的场景(如金融风控、医疗预后)。
六、研究亮点
- 方法论创新:
- ODMN首次将LTV的有序依赖显式建模为网络结构,而非后处理约束。
- MDME通过“分布分割→子分布分桶→桶内回归”三级细化,实现从粗粒度到细粒度的预测。
- 评估创新:Mutual Gini解决了传统基尼系数无法捕捉曲线交叉的问题。
- 工业规模验证:实验基于1.8亿用户真实数据,覆盖多业务场景。
七、其他价值
- 开源意义:虽未公开代码,但论文详细描述了MDME和Mono Unit的实现细节,可供社区复现。
- 跨领域潜力:框架可适配其他需处理高维稀疏性和分布偏移的预测任务。
(注:全文约2000字,符合要求)