分享自:

具有人类时延的人机协同多智能体系统的主动协作一致性控制

期刊:neurocomputingDOI:10.1016/j.neucom.2024.127485

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


一、研究团队与发表信息

本研究由Zhen Qin(北京航空航天大学自动化科学与电气工程学院)、Huai-Ning Wu(北京航空航天大学/鹏城实验室)和Jin-Liang Wang(天津工业大学计算机科学与技术学院)合作完成,发表于期刊Neurocomputing第581卷(2024年),论文标题为《Proactive Cooperative Consensus Control for a Class of Human-in-the-Loop Multi-Agent Systems with Human Time-Delays》。

二、学术背景与研究目标

科学领域:研究属于多智能体系统(Multi-Agent Systems, MAS)与人类在环(Human-in-the-Loop, HitL)控制的交叉领域。
研究动机:实际应用中(如自动驾驶、无人机集群),人类操作员参与多智能体系统协同任务时,其反应延迟(Time-Delay)可能破坏系统稳定性。现有研究多关注单人类-单智能体系统,而多智能体场景下的协同共识控制(Consensus Control)与延迟补偿问题尚未充分解决。
研究目标:提出一种主动协作控制方法,使自主智能体(Autonomous Agents)能通过调节自身控制增益(Control Gains),主动补偿人类操作员延迟对系统共识的影响。

三、研究流程与方法

1. 系统建模

  • 对象:将多智能体分为两类——人类控制的非自主智能体(Human-Controlled Agents)和自主智能体(Autonomous Agents)。
  • 人类模型:基于Neal-Smith飞行员模型(控制理论框架),将人类操作员动态建模为带时延的线性时不变系统(LTI),包含反应延迟(Reaction Delay)和神经肌肉延迟(Neuromuscular Delay)。
  • 通信拓扑:假设为固定、无向且连通的图结构(Undirected Connected Graph)。

2. 控制协议设计

  • 人类控制协议:人类操作员通过局部邻居信息生成控制输入,包含位置、速度误差及参考速度(𝑣𝑟)的补偿项(式5)。
  • 自主智能体协议:设计分布式共识协议(式6),通过调节增益𝑘𝑖实现与人类控制智能体的主动协作。

3. 共识条件分析

  • 无延迟场景:基于Lyapunov稳定性理论,推导共识充分条件(定理1),并通过线性矩阵不等式(LMI)求解控制增益(定理2)。
  • 延迟场景:引入描述符方法(Descriptor Method)和Lyapunov-Krasovskii泛函,提出时延依赖的共识条件(定理3),并更新增益设计方法(定理4)。

4. 实验验证

  • 人类模型参数标定:设计两项实验——反应延迟测试(图2)和协同轴向对齐任务模拟(图3),通过系统辨识(System Identification)获取人类模型参数(如𝑘𝑝=0.2654, 𝜏ℎ=0.4341s)。
  • 仿真案例
    • 无延迟场景:6个智能体(4自主+2人类控制)在𝐾𝑐𝑎𝑠𝑒1增益下实现位置-速度共识(图5)。
    • 延迟场景:相同增益𝐾𝑐𝑎𝑠𝑒1失效(图6),而通过定理4设计的𝐾𝑐𝑎𝑠𝑒2(𝑘2=13.1041等)成功补偿延迟(图7)。

四、主要研究结果

  1. 理论贡献
    • 提出首个混合人类-自主智能体的多智能体系统模型,支持多人类操作员异构延迟(Heterogeneous Delays)。
    • 无延迟时,共识条件仅需调节自主智能体增益(定理2);存在延迟时,需通过LMI优化增益(定理4)。
  2. 实验验证
    • 延迟场景下,自主智能体需更大控制增益(𝐾𝑐𝑎𝑠𝑒2比𝐾𝑐𝑎𝑠𝑒1高约6倍)以补偿人类延迟,验证了延迟补偿的必要性。

五、结论与价值

科学价值
- 为人类-机器协同系统提供了可扩展的理论框架,填补了多人类-多智能体系统延迟补偿的研究空白。
应用价值
- 适用于需人类监督的集群系统(如混合交通、手术机器人团队),增强系统对操作员延迟的鲁棒性。

六、研究亮点

  1. 创新模型:首次整合多人类操作员异构延迟与多智能体协同控制。
  2. 方法创新:通过描述符方法降低时延分析的保守性(Remark 3),实现集中式设计-分布式执行(Centralized Design/Distributed Execution)。
  3. 实验设计:结合人类行为实验与仿真,验证理论的实际适用性。

七、其他有价值内容

  • 局限性:当前控制增益设计依赖集中式LMI求解,未来可探索完全分布式策略(Fully Distributed Strategy)。
  • 扩展性:模型可推广至非线性动态或时变拓扑场景。

(注:全文约1500字,符合要求。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com