分享自:

基于大型语言模型的日常路径选择研究

期刊:transportation research part cDOI:10.1016/j.trc.2025.105307

大型语言模型赋能日常路径选择:LLMTraveler的创新框架与实证评估

作者及发表信息
本研究由Leizhen Wang(莫纳什大学数据科学与人工智能系)、Peibo Duan(莫纳什大学,通讯作者)、Zhengbing He(麻省理工学院信息与决策系统实验室)等8位作者合作完成,发表于2025年《Transportation Research Part C》第180卷,论文标题为《Agentic Large Language Models for Day-to-Day Route Choices》。


学术背景

研究领域与动机
路径选择建模是交通科学的核心问题,传统方法如随机效用理论(Random Utility Theory)和基于代理的模拟(Agent-Based Modeling, ABM)依赖静态假设,难以捕捉人类行为的动态适应性。近年来,大型语言模型(Large Language Models, LLMs)在模拟人类决策中展现出潜力,但其在交通行为模拟中的有效性尚未验证。本研究首次提出“LLMTraveler”框架,探索LLMs在路径选择建模中的应用价值。

科学问题
传统模型(如MNL、强化学习)无法解释实验室数据中观察到的路径切换波动现象,且缺乏自然语言解释能力。LLMs的适应性学习与推理能力为弥补这一缺口提供了新思路。


研究流程与方法

1. 框架设计

LLMTraveler代理架构
- 核心组件:以LLM为决策核心,集成记忆系统(存储历史路径成本、选择频率)和个性化特征(风险偏好、性格特质)。
- 决策流程
1. 信息接收:每日更新路径旅行时间(通过线性成本函数计算,如公式3:( \text{tt}_k^t = t_k^0 + \sigma \cdot x_k^t ))。
2. 经验反思:计算指数加权移动平均旅行时间(EWMATT,公式2),优先考虑近期体验。
3. LLM决策:通过结构化提示(图2)生成路径选择及自然语言解释,提示包含旅行者档案、历史数据和思维链引导。

创新方法
- 动态记忆系统:通过EWMATT量化路径偏好,替代传统静态效用函数。
- 混合决策机制:结合LLM的推理能力与经典交通理论(如动态用户均衡,DUE)。

2. 实验设计

单OD对场景(验证基础行为)
- 网络设置:对称与非对称双路径网络(图4),5种成本函数(表1),模拟16名旅行者的100天决策。
- 评估指标:路径切换率(Switching Rate)及其与成本差异的Logistic回归关系(公式5)。

多OD对场景(验证可扩展性)
- OW网络(图7a):4个OD对、1700名旅行者,代理代表20人群体(表12)。
- 评估指标:日均旅行时间、日切换率(DSR)。

对比方法
- 基准模型:完全理性选择(PRC)、多项式Logit(MNL)、强化学习(RL-IPPO)。
- LLM变体:测试GPT-4、GPT-3.5、Llama-3等开源与闭源模型(表2)。


主要结果

1. 单OD对行为匹配

  • 人类行为复现:LLMTraveler成功捕捉实验室数据中的三大路径切换模式(图6):
    1. 切换率随路径成本差增大而上升,即使当前路径更优仍存在切换(如GPT-4在成本差30分钟时切换率>0)。
    2. 非对称网络中,均衡点切换率( p{12} \neq p{21} )(如实验室数据差异显著,而LLMs差异较小)。
    3. 切换行为受路径特性影响(如高敏感路径的切换率更高)。
  • 模型对比:传统MNL无法解释非对称切换差异,而LLMs通过个性化档案(如风险偏好)实现更灵活的行为模拟(表9)。

2. 多OD对学习能力

  • 收敛性:所有LLMTraveler在100天内趋近用户均衡(UE),但保留合理波动(图9a),符合实证观察(如Iida et al., 1992)。
  • 三阶段学习
    • 探索阶段(1-20天):随机选择路径(表13示例)。
    • 探索-利用平衡(21-60天):结合历史EWMATT与有限探索。
    • 利用阶段(>60天):DSR降至0.2以下(图9b),GPT-4趋近零切换。

3. 开源模型可行性

轻量级模型(如Llama-3-8B)在行为模拟中表现接近闭源模型(表5),为低成本应用提供可能。


结论与价值

科学意义
1. 理论创新:首次将LLMs引入路径选择建模,突破传统模型的静态假设,通过记忆系统和自然语言推理实现动态适应性。
2. 方法突破:提出融合LLM与交通理论的混合框架,支持复杂决策解释(如路径切换的“惯性”效应)。

应用价值
- 政策模拟:在缺乏历史数据时,通过LLMTraveler预测政策干预(如拥堵收费)下的行为响应。
- 低成本替代:验证开源LLMs的实用性,降低技术门槛。

亮点
- 行为真实性:首次复现实验室中路径切换的非对称性等复杂模式。
- 可解释性:自然语言决策理由(如“选择路径2以探索新选项”)增强模型透明度。
- 跨模型验证:涵盖5种LLMs,证明框架普适性。

局限与展望
- 个性化敏感度:LLM对某些特征(如收入水平)响应不一致(表9),需进一步校准。
- 计算成本:闭源模型API调用费用较高,未来需优化轻量级部署。

(全文约2200字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com