分享自:

微信小游戏生命周期价值预测

期刊:Proceedings of the 31st ACM SIGKDD Conference on Knowledge Discovery and Data MiningDOI:10.1145/3711896.3737248

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


微信小游戏用户终身价值预测的创新框架:GREPO-LTV

一、作者与发表信息

本研究由香港科技大学(广州)的Aochuan ChenYifan NiuZiqi GaoYang LiuJia Li(通讯作者),与腾讯公司的Yujie SunShoujun LiuGong Chen合作完成,发表于ACM SIGKDD 2025会议(KDD ‘25),论文标题为《Mini-Game Lifetime Value Prediction in WeChat》。

二、学术背景

研究领域:本研究属于计算广告学(computational advertising)与用户行为预测的交叉领域,核心任务是用户终身价值预测(Lifetime Value Prediction, LTV),即预测用户对特定商品或服务的长期消费贡献。

研究动机:在游戏广告投放中,精准的LTV预测能优化广告策略,但面临两大挑战:
1. 数据稀疏性:用户购买转化率极低(仅0.1%),导致训练信号不足;
2. 多任务冲突:不同时间跨度(如3天、7天、30天)的LTV预测任务高度相关,但传统模型难以平衡短期与长期预测的准确性。

研究目标:提出GREPO-LTV框架,结合图表示学习(Graph Representation Learning, GRL)与帕累托优化(Pareto Optimization),解决数据稀疏性与多任务冲突问题。

三、研究流程与方法

1. 图表示学习(GRL)缓解数据稀疏性
  • 数据构建:基于微信小游戏平台的用户-游戏交互数据(373万样本),构建同构图(用户-用户、游戏-游戏)和二分图(用户-游戏)。
  • 无监督学习:通过掩码重建任务学习节点嵌入(node embeddings),损失函数包含边重建损失(edge reconstruction)和属性重建损失(attribute reconstruction)。
  • 创新点:引入元路径(meta-path)捕捉高阶关系(如“用户-游戏-用户”),增强稀疏数据下的协同信号(collaborative signal)。
2. GREPO-LTV模型架构

模型包含四层核心组件:
- 编码层(Encoding Layer):处理用户与游戏的分类特征,通过Field-Weighted Factorization Machine(FWFM)建模跨域交互。
- 适配层(Adaptation Layer):结合EPNet(门控神经网络)与分区归一化(Partitioned Norm),解决领域偏移问题。
- 时序兴趣网络(TIN Module):捕捉用户行为序列的时序模式,增强目标游戏特征的关联性。
- 塔层(Tower Layer):采用零膨胀对数正态分布(Zero-Inflated Lognormal, ZILN)处理长尾分布,输出多时间跨度的LTV预测。

3. 帕累托优化平衡多任务冲突
  • 非支配梯度下降(Non-Dominating Gradient Descent):通过二次规划(QP)求解梯度冲突,生成平衡短期与长期目标的优化方向。
  • 最优搜索(Optimal Search):在帕累托前沿(Pareto Front)上搜索最优权重分配,确保模型在所有时间跨度上均表现优异。

四、主要结果

1. 离线实验
  • 评估指标:归一化平均绝对误差(NMAE)、AUC、归一化基尼系数(N-Gini)。
  • 性能对比:GREPO-LTV在3/7/30天预测任务中均显著优于基线模型(如TCN、LSTM、DeepFM),NMAE平均降低14%,AUC提升3.6%。
  • 数据稀疏性测试:当训练数据减少80%时,GREPO-LTV的N-Gini仅下降0.1,而基线模型下降0.3,验证了GRL的有效性。
2. 在线A/B测试
  • 工业指标:平均交易总额(GMV)提升8.4%,短期(3天)LTV预测改进最显著(+9.91%)。
  • 稳定性:模型更新后的预测波动(diff值)比基线低50%,证明其鲁棒性。

五、结论与价值

科学价值
1. 提出首个结合图表示学习与帕累托优化的LTV预测框架,为稀疏数据下的多任务学习提供新范式;
2. 验证了协同信号与梯度冲突管理在工业场景中的重要性。

应用价值
1. 为腾讯微信小游戏广告的精准投放提供技术支持;
2. 框架可扩展至其他高稀疏性场景(如电商、金融)。

六、研究亮点

  1. 创新方法:GRL与帕累托优化的联合设计,解决了LTV预测的两大核心挑战;
  2. 工业验证:通过离线和在线实验,证明了框架的实用性与稳定性;
  3. 开源贡献:虽未公开数据集,但方法细节(如ZILN损失函数、TIN模块)为后续研究提供参考。

七、其他发现

  • 用户分组偏差:模型对低LTV用户存在高估倾向,而对高LTV用户(>500元)低估,这一现象在长期预测中更缓和(见表A1)。
  • 部署经验:建议在游戏生命周期关键事件(如上线首日)增加数据采集频率,以应对分布偏移。

以上报告完整涵盖了研究的背景、方法、结果与价值,可作为学术交流或工业应用的参考依据。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com