类型a:学术研究报告
本研究由来自多所国际知名高校的研究团队合作完成,主要作者包括:
- Leizhen Wang 与 Peibo Duan(莫纳什大学数据科学与人工智能系,澳大利亚)
- Zhengbing He(麻省理工学院信息与决策系统实验室,美国)
- Cheng Lyu(慕尼黑工业大学交通系统工程系,德国)
- Xin Chen(昆士兰大学土木工程学院,澳大利亚)
- Nan Zheng(莫纳什大学土木与环境工程系,澳大利亚)
- Li Yao(东南大学计算机科学与工程学院,中国)
- Zhenliang Ma(瑞典皇家理工学院土木与建筑工程系,瑞典)
研究论文《Agentic Large Language Models for Day-to-Day Route Choices》发表于期刊《Transportation Research Part C》2025年第180卷,论文编号105307,开放获取(CC BY 4.0许可)。
科学领域:交通行为建模、人工智能与城市交通交叉研究。
研究动机:传统路径选择模型(如多项式Logit模型、强化学习)依赖静态假设或固定训练分布,难以捕捉人类行为的动态适应性与复杂性。大语言模型(LLM, Large Language Model)在模拟人类决策中展现出潜力,但其在交通行为中的准确性尚未验证。
研究目标:
1. 提出首个基于LLM的交通行为代理“LLMTraveler”,整合记忆系统与个性化特征,模拟人类路径选择行为;
2. 验证LLMTraveler在单OD(Origin-Destination)和多OD场景下与传统模型(如MNL、RL)及实验室数据的匹配度;
3. 评估轻量级开源LLM作为低成本替代方案的可行性。
3.1 核心框架:LLMTraveler代理
- 决策流程:
1. 信息接收与更新:每日接收路径旅行时间信息并存储至记忆系统;
2. 路径选择反思:通过指数加权移动平均旅行时间(EWMATT, Exponential Weighted Moving Average Travel Time)量化历史经验;
3. LLM决策生成:基于记忆数据与个性化特征(如风险偏好、性格特质)生成自然语言解释的路径选择。
- 提示设计:融合旅行者档案(如收入、性格)、任务描述、历史经验、思维引导(Chain-of-Thought策略)及输出格式(JSON结构化响应)。
3.2 实验设计
- 单OD场景(5种成本函数配置):
- 网络结构:对称与非对称双路径网络,16名旅行者每日选择路径;
- 评估指标:路径切换率(Switching Rate)、与实验室数据及传统模型(PRC、MNL)的对比。
- 多OD场景(OW网络):
- 网络规模:13节点、48链路、4个OD对,1700名旅行者;
- 代理设置:每LLMTraveler代表20名旅行者,通过k最短路径算法生成候选路径集(k=5);
- 对比方法:MNL、强化学习(IPPO算法)。
3.3 数据分析方法
- Logistic回归:拟合切换率与路径成本差异的关系;
- 动态用户均衡(DUE, Dynamic User Equilibrium)验证:通过旅行时间波动与收敛性分析。
4.1 单OD场景:人类行为模式复现
- 行为一致性:LLMTraveler成功复现实验室观测的三种路径切换模式:
1. 切换率随路径成本差增大而上升(即使当前路径更优);
2. 非对称网络中,均衡点切换率介于0-0.5(传统PRC模型无法捕捉);
3. 切换行为受路径固有属性影响(如高敏感链路波动更大)。
- 模型差异:轻量级开源模型(如Llama-3.1-8B)与闭源模型(GPT-4)性能接近,但GPT-4对短期记忆信号更敏感,导致更高波动性(标准差达13.23分钟)。
4.2 多OD场景:学习行为模拟
- 三阶段学习:
1. 探索阶段(前20天):随机选择路径,日切换率(DSR, Day Switching Rate)高达0.4;
2. 探索-利用平衡阶段(20-60天):结合历史经验与少量探索;
3. 利用阶段(60天后):DSR稳定低于0.2,旅行时间收敛至均衡状态。
- 与传统模型对比:LLMTraveler与MNL、RL模型在均衡状态表现相当,但能生成自然语言解释(如“选择路径1因其历史可靠性”)。
4.3 轻量级LLM的可行性
- 开源模型(如Yi-Medium、Llama-3.1-70B)在成本效益比上表现优异,尤其适用于政策模拟等需大规模代理的场景。
科学价值:
- 首次将LLM引入交通行为建模,证明其能复现人类动态决策的复杂性;
- 提出融合记忆系统与个性化特征的代理框架,为ABM(Agent-Based Modeling)提供新范式。
应用价值:
- 政策模拟:在缺乏历史数据时,预测新政策(如拥堵收费)对路径选择的影响;
- 交通管理:通过自然语言解释增强决策透明度,支持个性化交通服务设计。
局限性:LLM对提示设计敏感,需进一步校准以减小个体行为偏差。
(全文约2000字)