大型语言模型赋能日常路径选择:LLMTraveler的创新框架与实证评估
作者及发表信息
本研究由Leizhen Wang(莫纳什大学数据科学与人工智能系)、Peibo Duan(莫纳什大学,通讯作者)、Zhengbing He(麻省理工学院信息与决策系统实验室)等8位作者合作完成,发表于2025年《Transportation Research Part C》第180卷,论文标题为《Agentic Large Language Models for Day-to-Day Route Choices》。
研究领域与动机
路径选择建模是交通科学的核心问题,传统方法如随机效用理论(Random Utility Theory)和基于代理的模拟(Agent-Based Modeling, ABM)依赖静态假设,难以捕捉人类行为的动态适应性。近年来,大型语言模型(Large Language Models, LLMs)在模拟人类决策中展现出潜力,但其在交通行为模拟中的有效性尚未验证。本研究首次提出“LLMTraveler”框架,探索LLMs在路径选择建模中的应用价值。
科学问题
传统模型(如MNL、强化学习)无法解释实验室数据中观察到的路径切换波动现象,且缺乏自然语言解释能力。LLMs的适应性学习与推理能力为弥补这一缺口提供了新思路。
LLMTraveler代理架构
- 核心组件:以LLM为决策核心,集成记忆系统(存储历史路径成本、选择频率)和个性化特征(风险偏好、性格特质)。
- 决策流程:
1. 信息接收:每日更新路径旅行时间(通过线性成本函数计算,如公式3:( \text{tt}_k^t = t_k^0 + \sigma \cdot x_k^t ))。
2. 经验反思:计算指数加权移动平均旅行时间(EWMATT,公式2),优先考虑近期体验。
3. LLM决策:通过结构化提示(图2)生成路径选择及自然语言解释,提示包含旅行者档案、历史数据和思维链引导。
创新方法
- 动态记忆系统:通过EWMATT量化路径偏好,替代传统静态效用函数。
- 混合决策机制:结合LLM的推理能力与经典交通理论(如动态用户均衡,DUE)。
单OD对场景(验证基础行为)
- 网络设置:对称与非对称双路径网络(图4),5种成本函数(表1),模拟16名旅行者的100天决策。
- 评估指标:路径切换率(Switching Rate)及其与成本差异的Logistic回归关系(公式5)。
多OD对场景(验证可扩展性)
- OW网络(图7a):4个OD对、1700名旅行者,代理代表20人群体(表12)。
- 评估指标:日均旅行时间、日切换率(DSR)。
对比方法
- 基准模型:完全理性选择(PRC)、多项式Logit(MNL)、强化学习(RL-IPPO)。
- LLM变体:测试GPT-4、GPT-3.5、Llama-3等开源与闭源模型(表2)。
轻量级模型(如Llama-3-8B)在行为模拟中表现接近闭源模型(表5),为低成本应用提供可能。
科学意义
1. 理论创新:首次将LLMs引入路径选择建模,突破传统模型的静态假设,通过记忆系统和自然语言推理实现动态适应性。
2. 方法突破:提出融合LLM与交通理论的混合框架,支持复杂决策解释(如路径切换的“惯性”效应)。
应用价值
- 政策模拟:在缺乏历史数据时,通过LLMTraveler预测政策干预(如拥堵收费)下的行为响应。
- 低成本替代:验证开源LLMs的实用性,降低技术门槛。
亮点
- 行为真实性:首次复现实验室中路径切换的非对称性等复杂模式。
- 可解释性:自然语言决策理由(如“选择路径2以探索新选项”)增强模型透明度。
- 跨模型验证:涵盖5种LLMs,证明框架普适性。
局限与展望
- 个性化敏感度:LLM对某些特征(如收入水平)响应不一致(表9),需进一步校准。
- 计算成本:闭源模型API调用费用较高,未来需优化轻量级部署。
(全文约2200字)