分享自:

基于树结构的渐进回归模型在短视频推荐中的观看时长预测

期刊:Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23)DOI:10.1145/3580305.3599919

这篇文档属于类型a,是一篇关于短视频推荐系统中观看时长预测的原创性研究论文。以下是针对该研究的学术报告:


作者及发表信息

该研究由Xiao Lin、Xiaokai Chen、Linfeng Song、Jingwei Liu、Biao Li和Peng Jiang(†通讯作者)共同完成,作者均来自快手科技(Kuaishou Technology)。论文标题为《Tree Based Progressive Regression Model for Watch-Time Prediction in Short-Video Recommendation》,发表于ACM SIGKDD 2023会议(KDD ‘23,2023年8月)。


学术背景

研究领域:该研究属于推荐系统与机器学习交叉领域,聚焦于短视频平台的用户观看时长预测问题。
研究动机:在短视频推荐中,观看时长是衡量用户参与度的核心指标,但现有方法存在四大局限:
1. 序数关系忽略:观看时长是连续但有序的变量,传统回归方法无法捕捉其序数特性;
2. 条件依赖性缺失:用户观看行为(如“看完一半视频”与“看完整个视频”)存在逻辑依赖,但现有模型未建模此类关系;
3. 预测不确定性:点估计方法无法量化模型预测的置信度,可能导致推荐结果不可靠;
4. 偏差放大问题:实际系统存在时长偏差(duration bias)等混淆因素,导致推荐结果偏离真实用户偏好。

研究目标:提出一种同时解决上述问题的框架——TPM(Tree-based Progressive Regression Model),通过树结构分解回归任务为条件依赖的分类问题,并引入不确定性建模与反事实调整(backdoor adjustment)。


研究流程与方法

1. 问题分解与树结构设计

  • 标签空间划分:将观看时长量化为有序区间(ordinal ranks),构建完全二叉树(如图1所示),每个非叶节点对应一个二元分类器,判断时长属于左子树或右子树区间。
  • 条件依赖性建模:父节点的输出作为子节点的条件输入,显式编码行为依赖(如“观看后半段”需以“观看前半段”为前提)。
  • 树构造方法:基于分位数划分区间,确保每个分类器的标签分布平衡。

2. 不确定性建模

  • 多变量分布:TPM将预测结果视为从多项式分布中采样的随机变量,通过计算方差(公式4)量化不确定性。
  • 损失函数设计:联合优化分类似然、回归误差(MAE)和标准差(公式5),权重参数(α₁, α₂, α₃)通过实验调整。

3. 反事实调整(Backdoor Adjustment)

  • 因果图分析:识别混淆因子(如视频时长𝐷),通过阻断𝐷→𝑋的路径消除偏差(公式8)。
  • 树结构适配:按𝐷分组构建子树(图5),每组独立训练分类器,最终预测为各组期望的加权和(公式12)。

4. 模型架构

  • 共享参数设计:所有分类器共享多层感知机(MLP)的隐藏层,输出层任务专用(图6),以降低参数量。
  • 训练算法:如算法1所示,逐样本分配至路径节点,反向传播更新分类器参数。

主要结果

1. 离线实验(表3)

  • 数据集:Kuaishou(1200万样本)和CIKM16(31万会话)。
  • 性能对比:TPM在MAE和XAUC(衡量序数一致性)上均优于基线(WLR、D2Q、OR)。例如,在Kuaishou上,TPM的MAE(4.741)比D2Q(5.426)降低12.6%。
  • 消融实验(表4):移除方差损失(w.t.o. var)导致MAE上升2.8%,验证不确定性建模的必要性;移除反事实调整(w.t.o. deconfounding)使XAUC下降3.8%,证实偏差缓解的有效性。

2. 在线A/B测试(表5)

  • 指标提升:在快手APP(3亿DAU)部署TPM后,观看时长提升0.23%,短播放率(short view)下降0.2%,且正向互动(如转发)无显著波动。
  • 业务价值:TPM的高置信度预测减少了“不良案例”(bad cases),提升用户体验。

结论与价值

科学价值
1. 方法论创新:首次将序数回归、条件依赖和不确定性建模统一于树结构框架;
2. 理论贡献:证明反事实调整可通过树分解自然实现,扩展了因果推理在推荐系统的应用。

应用价值
- TPM已部署于快手生产环境,支持日均3亿用户的高效推荐;
- 开源代码(GitHub)为业界提供可复现的解决方案。


研究亮点

  1. 多问题协同解决:TPM是首个同时处理序数性、依赖性、不确定性和偏差的观看时长预测模型;
  2. 树结构灵活性:支持任意分解模式(如线性搜索或二分搜索),适配不同数据分布;
  3. 轻量级部署:参数共享设计使TPM在工业级场景中计算高效。

其他价值

论文提供了详细的因果图分析(图4)和树构造示例(图2),为后续研究提供可扩展的理论框架。此外,实验部分对比了不同树深度(图8)和方差权重(图9)的影响,为超参数调优提供实证依据。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com