分享自:

基于GPT架构的零售店内顾客轨迹与购买行为生成方法

期刊:Eur. Phys. J. BDOI:10.1140/epjb/s10051-024-00778-1

本文档属于类型a(单篇原创研究论文),以下是针对该研究的学术报告:


基于GPT架构的零售店铺顾客轨迹与购买行为生成方法研究

一、作者与发表信息
本研究由日本综合研究大学院大学(SOKENDAI)的Taizo Horikomi与东京国立情报学研究所(NII)的Takayuki Mizuno合作完成,发表于《The European Physical Journal B》2024年97卷144期(2024年9月26日在线发表)。研究聚焦统计与非线性物理领域,提出了一种基于Transformer架构的零售店铺内顾客轨迹与购买行为同步生成方法。

二、学术背景与研究目标
理解顾客在室内的行为模式对零售业优化布局、提升盈利至关重要。传统方法分为三类:
1. 物理模型(如Wang等人的马尔可夫模型)难以生成真实数据;
2. 基于代理的模拟(如Terano的ABISS方法)依赖已知行为,无法捕捉未知模式;
3. 机器学习方法(如RNN、LSTM)受限于短期记忆,难以生成完整轨迹。

本研究目标为:
- 将Mizuno等人提出的户外轨迹生成GPT模型迁移至零售场景;
- 首次实现轨迹与购买行为的同步生成;
- 探索预训练模型跨店铺微调的可行性,降低数据采集成本。

三、研究流程与方法
1. 数据准备
- 数据来源:日本连锁药店Tsuruha Holdings提供的2021年两家店铺(A店900㎡,B店500㎡)数据,包括:
- 顾客轨迹数据(Quuppa系统采集,精度50cm/5秒);
- 店铺布局图(A店61个区域,B店41个区域);
- 零售扫描数据(商品销售记录)。
- 数据匹配:通过收银时间戳关联轨迹与购买行为。

  1. 预训练模型构建(基于A店数据)

    • 位置信息文本化
      将30m×30m店铺划分为6层网格(最终50cm×50cm),每层用字母编码(如”agkpqw”表示绝对+相对坐标)。
    • 购买行为建模
      • 使用DBSCAN聚类(ε=2.5m)识别停留区域(如货架前);
      • 结合布局图与扫描数据,确定商品所在区域;
      • 若聚类点位于商品区域,则标记为购买行为(图1e)。
    • 文本生成与训练
      • 将轨迹与购买数量编码为文本(如”agkpqw.2”表示该位置购买2件商品);
      • 使用Byte-level BPE分词(词汇量50,000),训练GPT-2 Small架构(1亿参数,10轮次,学习率3e-4)。
  2. 跨店铺微调(基于B店数据)

    • 沿用A店的编码方法处理B店数据;
    • 比较不同训练数据量(8~20,000条)下的微调效果,仅需3轮次训练。

四、主要结果
1. 轨迹生成准确性
- 生成的轨迹热图与实际数据高度吻合(图3),JS散度仅0.00973;
- 对比LSTM模型(图4),避免了穿越货架或越界等不合理路径。

  1. 购买行为预测

    • 各区域购买数量分布与实际数据一致(图5),JS散度0.0100;
    • 优于SVM模型(JS散度0.0931),后者在部分区域偏差显著(图6)。
  2. 微调效果

    • 预训练模型微调后,仅需1%数据(约100条)即可达到与全数据训练相当的损失值(图7);
    • 训练数据量从2048条增至16384条时,JS散度从0.0374降至0.0161(图8)。

五、结论与价值
1. 科学价值
- 首次将Transformer应用于室内轨迹与购买行为的联合生成;
- 验证了预训练模型跨场景迁移的可行性,为人类行为动力学研究提供新工具。

  1. 应用价值
    • 帮助零售商优化布局与库存管理;
    • 大幅降低数据采集成本(微调数据需求减少99%)。

六、研究亮点
1. 方法创新
- 提出分层网格编码方法,适配室内小尺度空间;
- 结合DBSCAN聚类与商品区域映射,精准定位购买行为。
2. 技术突破
- 实现长序列轨迹与离散购买行为的端到端生成;
- 首次证明GPT架构在零售行为模拟中的优越性。

七、未来方向
作者计划引入顾客属性(性别、年龄)、环境信息(天气、人流)作为特殊标记,进一步提升生成精度;探索基于多模态输入的轨迹生成(如虚拟布局图像)。


(注:全文约1500字,完整覆盖研究背景、方法、结果与创新点,符合学术报告要求。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com