分享自:

多智能体大语言模型作为调度优化的进化优化器

期刊:Computers & Industrial EngineeringDOI:10.1016/j.cie.2025.111197

这篇文档属于类型a,是一篇关于多智能体大语言模型(LLM)用于调度优化的原创研究论文。以下是针对该研究的学术报告:


多智能体大语言模型驱动的调度优化进化框架(MAEF)研究

一、作者、机构及发表信息

本文由Yidan WangJiayin Wang*(通讯作者)和Zhiwei Chu合作完成,作者单位包括:
1. 西安交通大学计算机科学与技术学院(School of Computer Science and Technology, Xi’an Jiaotong University)
2. 西安Visbody智能技术公司(Visbody Intelligent Technology)
研究发表于期刊《Computers & Industrial Engineering》2025年第206卷,论文标题为《Multi-agent large language models as evolutionary optimizers for scheduling optimization》。


二、学术背景

科学领域:本研究属于人工智能(AI)运筹学交叉领域,聚焦于组合优化(Combinatorial Optimization)中的调度问题(Scheduling Problems),如单机调度(SMSP)、流水车间调度(FSSP)、作业车间调度(JSSP)和资源受限项目调度(RCPSP)。

研究动机:传统调度优化方法依赖专家设计的模型和算法(如启发式、元启发式算法),需针对不同场景定制,灵活性差且成本高。大语言模型(LLM)的出现为自动化优化提供了新思路,但现有LLM驱动方法(如OPRO、LMEA)仍受限于单模型能力、提示工程(Prompt Engineering)的复杂性及上下文窗口限制。

研究目标:提出多智能体LLM驱动的进化框架(MAEF),通过多智能体协作实现调度问题的自动化优化,减少人工干预,提升泛化能力。


三、研究流程与方法

MAEF框架包含以下核心流程,各由专用LLM智能体执行:

  1. 问题定义智能体(Problem Definition Agent)

    • 输入:用户提供的自然语言问题描述(如“最小化完工时间”)。
    • 处理:通过链式推理(Chain-of-Thought, CoT)提取问题类型、约束条件、目标函数等结构化信息(图2示例)。
    • 输出:标准化的问题表述,避免人工建模。
  2. 初始种群生成智能体(Initial Population Generation Agent)

    • 输入:结构化问题描述。
    • 处理:生成多样化的可行解作为初始种群(如5-100个调度序列),覆盖解空间。
    • 创新点:动态生成优于传统静态初始化方法(附录图12)。
  3. 进化优化智能体(Evolutionary Optimization Agent)

    • 操作:基于遗传算法(GA)的交叉(Crossover)、变异(Mutation)等操作迭代优化种群。
    • 动态调整:通过温度参数(Temperature)控制探索与开发平衡:高温(>1)增加随机性,低温()聚焦局部优化(公式1)。
    • 反馈机制:若连续k代未改进,则提高温度以增强多样性(附录图13)。
  4. 结果评估智能体(Result Evaluation Agent)

    • 功能:评估解的质量(如完工时间、资源利用率),筛选最优解并提供反馈(附录图14)。
    • 约束验证:与调度验证与生成智能体协作,确保解满足约束条件(图7)。
  5. 多智能体协作机制

    • 通信协议:通过JSON/YAML格式交换数据,冲突时自动修复(如资源冲突调整)。
    • 专家参与:关键阶段引入人工验证,提升稳定性。

实验设计
- 测试问题:4类调度问题(SMSP、FSSP、JSSP、RCPSP),共70个实例(规模5-102个任务)。
- 基线算法:传统启发式(如NEH、Johnson)、元启发式(GA)及LLM驱动方法(LMEA、OPRO)。
- 评估指标:最优性差距(Optimality Gap)、收敛速度(#Steps)、成功率(#Successes)。


四、主要结果

  1. 性能优势

    • SMSP:MAEF在5-50任务规模下均找到最优解,而LMEA和OPRO在20任务后失效(表1)。
    • 复杂问题(RCPSP):MAEF在52任务实例中优于GA(最优性差距9.8% vs 47.9%),且收敛更快(图3-4)。
    • 收敛效率:MAEF在RCPSP中仅需3.2代(32任务)即收敛,传统方法需20代以上(表4)。
  2. 多智能体协作效果

    • 动态调整:温度机制有效避免早熟收敛(图5-6)。
    • 约束处理:验证智能体修复了LMEA和OPRO因缺乏约束检查导致的不可行解。
  3. 局限性

    • 规模限制:LLM上下文窗口限制了大规模问题(>100任务)的建模能力。
    • 成本:频繁调用GPT-4 API导致较高计算开销。

五、结论与价值

科学价值
- 首次将多智能体LLM框架应用于调度优化,证明了LLM在复杂组合优化中的潜力。
- 提出反馈驱动的进化机制,为AI驱动的自动化优化提供了新范式。

应用价值
- 制造业:实时响应机器故障或订单变更(图7案例)。
- 项目管理:动态调整资源分配,适应人员或预算变动。


六、研究亮点

  1. 方法创新

    • 多智能体分工协作,突破单LLM模型的性能瓶颈。
    • 温度参数动态调整策略,平衡探索与开发。
  2. 泛化能力:仅需修改问题描述即可适配不同调度场景,无需重新训练模型。

  3. 零样本(Zero-shot)优化:无需额外训练数据,直接处理新任务。


七、其他有价值内容

  • 开源与数据:实验数据可应要求提供,代码基于AgentScope框架实现。
  • 未来方向:扩展至多目标优化、多站点调度,并探索轻量化模型降低成本。

(全文约2000字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com