分享自:

深度网络与树模型的互补融合用于ETA预测

期刊:29th International Conference on Advances in Geographic Information Systems (SIGSPATIAL '21)DOI:10.1145/3474717.3488237

该文档属于类型a,是一篇关于ETA(Estimated Time of Arrival,预计到达时间)预测的原创性研究论文。以下是详细的学术报告内容:


作者及机构
本研究由南京理工大学的Yurui Huang、Yang Yang、Jian Yang,华泰证券的Jie Zhang以及百度的Hengda Bao合作完成,发表于2021年11月2日至5日举办的ACM SIGSPATIAL国际会议(会议全称:29th International Conference on Advances in Geographic Information Systems),论文标题为《Complementary Fusion of Deep Network and Tree Model for ETA Prediction》。


学术背景
ETA是交通系统中的核心指标,用于预测从起点到终点的行程时间,其准确性直接影响导航系统、网约车平台的用户体验及运营效率。传统ETA预测方法依赖单一模型(如树模型或神经网络),但存在泛化能力不足或特征提取不充分的问题。本研究的目标是通过深度融合树模型(Tree Model)与卷积神经网络(CNN),提出一种互补性集成方案,以提升预测精度与鲁棒性。研究背景基于以下关键点:
1. 领域需求:网约车平台需高精度ETA以优化路线规划、定价及用户决策。
2. 技术挑战:交通数据具有时空依赖性、序列性(如路段链接序列)和动态性(如潮汐交通现象),需多模态特征融合。
3. 方法创新:结合树模型的统计特征优势与CNN的序列建模能力,填补现有研究空白。


研究流程与方法
研究分为四个核心环节:特征工程、神经网络建模、树模型构建及集成策略。

  1. 特征工程

    • 神经网络特征
      • 密集特征(Dense Features):提取时间相关统计量(如路段时间总和、最大值)、路况状态量化指标(5种统计量)、预估平均速度。
      • 类别特征(Categorical Features):司机历史订单时间(如最近一次订单时间),缺失值填充为-999。
    • 树模型特征
      • 统计特征:路段时间、交叉口时间、路段数量的均值/总和。
      • 时空特征:日期(是否周末)、时间分箱(早/中/晚高峰)、拓扑特征(上下游路段数量统计)。
      • 嵌入特征:将路段序列视为文本,提取词向量(Word Embedding)和LDA主题特征,并融合神经网络的监督嵌入。
  2. 神经网络结构

    • CNN架构:将路段序列视为一维文本,采用多尺度卷积核(尺寸2/3/4/5,各32个滤波器)进行特征提取,通过全局最大池化生成128维特征。
    • 序列处理:对长序列进行截断(保留前200或后200),拼接路段描述特征(时间、比例、状态)形成$s \times (d+3)$矩阵。
    • 深度交互:类别特征(如司机ID)通过嵌入层与密集特征交互,最终输出经MLP(多层感知机)融合,损失函数为MAPE(平均绝对百分比误差)。
  3. 树模型方案

    • 算法选择:采用LightGBM和CatBoost两种梯度提升树(GBDT)算法,以MAE(平均绝对误差)为损失函数。
    • 特征输入:共构建371维特征,包括统计、时空及神经网络嵌入特征。
  4. 集成策略

    • 加权融合:训练8个CNN模型(不同嵌入尺寸与截断方式),与树模型预测结果通过验证集性能分配权重,最终加权平均输出。

主要结果
1. 模型性能:在SIGSPATIAL 2021 GIS Cup竞赛的A/B测试集上分别取得0.11981和0.11974的评分,排名第一,且A/B列表差异微小,表明模型泛化能力优异。
2. 特征贡献
- CNN有效捕捉路段序列的上下文信息(如拥堵传播模式)。
- 树模型补充了统计特征与时空规律(如高峰时段影响)。
3. 消融实验:双截断策略(前后截断)和嵌入尺寸多样性(9/15/20/30)显著提升模型稳定性。


结论与价值
1. 科学价值:提出首个CNN与树模型的互补性融合框架,证明异构模型集成能协同提升时空预测任务性能。
2. 应用价值:方案已应用于实际导航系统,优化网约车平台的ETA服务,提升用户满意度与平台效率。
3. 方法论创新
- 将路段序列建模为文本,扩展了CNN在非NLP领域的适用性。
- 设计了面向树模型的多模态特征构造方法(如LDA主题特征)。


研究亮点
1. 跨领域方法融合:首次将文本卷积技术(TextCNN)适配于交通序列建模。
2. 工程实践性:特征工程覆盖实际业务数据(如司机行为、天气),模型具备工业落地能力。
3. 竞赛验证:在权威竞赛中夺冠,结果可复现性强。


其他价值
论文开源了特征构造与模型集成代码,为后续研究提供基准工具。此外,提出的截断与嵌入策略可迁移至其他序列预测任务(如物流配送时间估计)。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com