关于朱德政研究论文《执行器饱和的多智能体有界地域协同控制》的学术报告
一、 研究团队与发表信息
本项研究由中国电子科技集团公司第二十八研究所的朱德政(高级工程师)独立完成。研究成果以题为《执行器饱和的多智能体有界地域协同控制》的论文形式,于网络首发日期2026年5月28日发表在《指挥与控制学报》(Journal of Command and Control)。该期刊的国内标准刊号为CN 14-1379/TP,国际标准刊号为ISSN 2096-0204。论文的网络首发版本DOI为10.20278/j.jc2.2096-0204.2026.0042。
二、 研究的学术背景与目标
本研究属于自动控制、机器人学与多智能体系统协同控制交叉领域。随着无人机编队、机器人集群协作、智能交通管理等应用从理论走向现实,多智能体系统的协同控制技术成为关键支撑。传统的一致性算法多建立在无限或无障碍空间的理想假设之上。然而,在实际应用中,如仓库、楼宇、空域管制区等场景,智能体的活动范围往往被限制在特定的有界地域内。这带来了两大核心挑战:其一,地域边界导致智能体运动动力学不连续。当智能体与边界发生碰撞(或需严格规避)时,其速度会发生突变,传统基于连续动力学的算法可能失效甚至导致系统失稳。现有研究多局限于处理矩形等规则边界,对于三角形、多边形乃至曲线边界缺乏普适且连续的处理机制。其二,执行器的物理饱和约束。实际系统中的电机、舵机等执行机构存在输出上限,控制算法生成的大幅值指令若超出此限幅,会导致信号畸变、响应滞后乃至系统振荡,严重制约理论算法在实际平台上的部署。
针对上述问题,现有研究方法如人工势场法(Artificial Potential Field, APF)易陷入局部极小点且在边界附近产生过大控制力;虚拟结构法(Virtual Structure, VS)对动态环境适应性较弱;而针对执行器饱和的研究又多集中于无限空间或线性系统。因此,如何一体化地解决有界地域(尤其是复杂边界)带来的动力学不连续性与执行器物理饱和约束,成为本领域一个亟待突破的理论与工程难题。本研究旨在填补这一空白,提出一种兼具理论严谨性与工程可行性的协同控制框架,其核心目标是:设计一种分布式控制算法,使得多智能体在任意形状的有界地域内,在考虑执行器输出能力有限的前提下,仍能实现位置和速度的渐近一致收敛。
三、 研究的详细工作流程与方法
本研究主要包含理论建模、算法设计、稳定性证明和仿真验证四个核心环节,研究对象为具有二阶积分器动力学的多智能体系统。
1. 模型建立与边界动力学连续化(镜像映射机制)
研究首先建立了智能体在有界地域(以正三角形为例,但方法适用于任意多边形和曲线边界)内的运动方程。该方程描述了智能体在边界内部的连续运动以及在与边界碰撞时刻的速度突变(基于完全弹性碰撞的镜面反射假设)。为了处理碰撞导致的速度不连续性这一核心难题,研究创新性地引入了镜像映射(Mirror Mapping)机制。这是本研究的第一个关键创新点。
详细工作流程如下:
- 定义镜像速度矩阵: 通过几何分析,研究推导出智能体碰撞前后的速度(入射速度与反射速度)可以通过一个特定的矩阵变换联系起来。研究定义了一个随时间变化的“镜像速度矩阵” ( \mathbf{k}_i(t) )。该矩阵在碰撞时刻会发生特定变换(对应于反射操作),而在非碰撞时刻为单位矩阵。进而,定义“镜像速度” ( \tilde{\mathbf{v}}_i(t) = \mathbf{k}_i(t) \mathbf{v}_i(t) )。通过严格的数学推导证明,尽管实际速度 ( \mathbf{v}_i(t) ) 在碰撞时刻不连续,但其对应的镜像速度 ( \tilde{\mathbf{v}}_i(t) ) 在整个时间域内是连续的。这一转化将原物理空间中不连续的碰撞动力学,映射到了一个虚拟的“镜像空间”中的连续动力学。
- 定义镜像位置矩阵与镜像位置: 类似地,研究通过点关于直线的对称变换矩阵(镜像位置矩阵),定义了智能体的“镜像位置”。通过将镜像速度对时间积分,可以得到在镜像空间中连续变化的镜像位置轨迹。这样,整个系统从实际有界地域中的不连续运动,完全等价地转化为了在镜像空间中的连续系统。这为后续基于连续系统理论设计控制律和分析稳定性奠定了坚实的基础。
2. 控制算法设计(嵌入饱和函数的一致性协议)
在将系统动力学连续化的基础上,研究着手解决第二个核心挑战:执行器饱和。研究在镜像空间中设计分布式一致性控制律。控制输入 ( \mathbf{u}i(t) ) 由两部分组成:一部分是基于智能体自身与邻居智能体镜像位置误差的反馈;另一部分是基于自身与邻居镜像速度误差的反馈。为了确保控制输入始终在执行器允许的范围内,研究在控制律中创造性地引入了双曲正切函数 ( \tanh(\cdot) ) 作为饱和函数。这是本研究的第二个关键创新点。
控制律的具体形式为:
[
\mathbf{u}i(t) = -\kappa_1 \tanh\left( \sum{j=1}^{n} a{ij} (\tilde{\mathbf{p}}i(t) - \tilde{\mathbf{p}}j(t)) \right) - \kappa_2 \tanh\left( \sum{j=1}^{n} a{ij} (\mathbf{k}_i(t)\tilde{\mathbf{v}}_i(t) - \mathbf{k}_j(t)\tilde{\mathbf{v}}j(t)) \right)
]
其中,( \kappa_1, \kappa_2 > 0 ) 为控制增益,( a{ij} ) 为通信拓扑邻接矩阵元素,( \tilde{\mathbf{p}}_i, \tilde{\mathbf{v}}_i ) 分别为镜像位置和镜像速度。由于 ( \tanh(\cdot) ) 函数的值域为 ((-1, 1)),通过调整增益 ( \kappa_1, \kappa_2 ),可以轻易地将控制输入的幅值限制在任何预设的物理饱和限幅之内,从而从根本上避免了执行器饱和问题。
3. 理论稳定性证明
研究在严格的数学框架下证明了所提算法的有效性。证明过程采用李雅普诺夫(Lyapunov)直接法。
- 构建Lyapunov函数: 在镜像空间中,构造了一个包含镜像位置误差和镜像速度能量的正定、径向无界的Lyapunov候选函数 ( V(t) )。
- 求导与分析: 沿着系统轨迹对 ( V(t) ) 求导。利用通信拓扑为无向连通图的性质以及 ( \tanh(\cdot) ) 函数的单调奇函数特性,推导出 ( \dot{V}(t) \leq 0 )。
- 应用LaSalle不变性原理: 根据LaSalle不变性原理,系统状态将收敛到满足 ( \dot{V}(t) = 0 ) 的最大不变集。通过分析,在该不变集上,所有智能体的镜像速度达到一致,进而推导出所有智能体的镜像位置也达到一致。
- 映射回原空间: 由于镜像映射是单射(一一映射),镜像空间中的一致性直接意味着原物理空间中所有智能体的实际位置和实际速度分别收敛到相同的常数值,即实现了渐近一致性。定理1得证。
4. 仿真验证与对比分析
为验证算法的有效性、普适性和优越性,研究进行了全面的数值仿真,并与传统方法进行了量化对比。
- 仿真场景设置: 研究设计了三种不同形状的有界地域进行测试:正三角形(规则多边形代表)、正六边形(模拟蜂窝状防御阵地,具有工程应用背景)、椭圆(连续曲线边界代表)。每个场景设置智能体数量 ( n=10 ),初始位置和速度随机生成,通信拓扑为固定无向连通图,控制输入饱和限幅设置为 ( \pm 5 , m/s^2 )。
- 仿真结果: 在三种地域中,仿真结果(轨迹图、速度收敛曲线、加速度曲线)均清晰显示:所有智能体在运动过程中能自然处理与边界的碰撞(轨迹在边界处发生镜面反射),速度最终收敛到一致值,且控制加速度被有效限制在预设的饱和限幅内,未出现越限现象。这验证了算法对不同边界形状的适应性和对执行器饱和约束的处理能力。
- 性能对比分析: 研究选取了传统人工势场法(APF)、虚拟结构法(VS)以及未考虑饱和与边界处理的无界一致性算法(UC)作为对比基线。在正三角形地域的相同仿真环境下,定义了四个量化指标进行对比:收敛时间 ( T_c )、稳态位置标准差 ( \sigma_p )、控制能量效率 ( E_{eff} )、最大控制输入峰值 ( u_{max} )。
- 对比实验流程: 在完全相同的初始条件、地域环境和饱和限幅下,分别运行本文算法、APF算法、VS算法和UC算法,记录各算法的运行过程,并计算上述四个性能指标。
四、 研究的主要结果
1. 理论结果: 研究成功证明了在无向连通通信拓扑下,采用所提出的基于镜像映射和饱和函数的一致性控制算法,多智能体系统在有界地域内能够实现位置和速度的渐近一致收敛,且控制输入始终满足执行器饱和约束。这为处理复杂边界和物理限幅的协同控制问题提供了严格的理论保证。
2. 仿真与对比结果: 仿真结果直观且有力地支撑了理论结论。
- 算法有效性验证: 在正三角形、正六边形和椭圆地域中,智能体均能成功实现协同一致,运动轨迹平滑(在镜像空间连续),速度收敛,加速度受限。这证明了镜像映射机制对不同边界形状(多边形和曲线)的普适性。
- 性能量化对比结果(基于正三角形场景):
- 收敛速度: 本文算法收敛时间 ( T_c = 140s ),显著快于APF算法的350s(提升约60%)和VS算法的199.7s(提升约30%)。这表明镜像映射机制有效避免了边界附近的振荡,加速了收敛。
- 稳态精度: 本文算法的稳态位置标准差 ( \sigma_p = 0.041 ),远小于APF算法的0.192和VS算法的0.088,表明收敛后智能体的聚集度更高,编队更紧凑。
- 能量效率: 本文算法的控制能量效率 ( E_{eff} = 23.1 ),优于APF算法的41.7(提升约44%)和VS算法的29.2(提升约21%),说明算法在快速收敛的同时能耗更低。
- 输入约束满足: 本文算法的最大控制输入峰值 ( u_{max} = 4.48 ),被成功限制在饱和限幅 ( \pm 5 ) 以内。而APF算法(8.73)和VS算法(6.15)均超出了限幅,UC算法(78.6)更是严重超限。这直接证明了嵌入饱和函数的控制律在限制执行器负荷方面的有效性。
- 必要性验证: 未考虑边界处理的UC算法在有界地域内完全发散,从反面强有力地论证了引入边界处理机制(如本文的镜像映射)对于有界地域协同控制的必要性。
这些结果逻辑连贯:首先,通过镜像映射解决了边界不连续问题,将系统转化为连续系统;其次,在连续系统框架下设计含饱和函数的控制律,解决了输入约束问题;最后,通过Lyapunov理论证明了系统的稳定性。仿真结果则是对理论结论的实证,并通过与现有方法的对比,量化展示了本文算法在收敛性、精确性、经济性和可行性方面的综合优势。
五、 研究的结论与价值
本研究成功提出并验证了一种能够同时处理有界地域边界约束和执行器饱和约束的多智能体协同控制算法。结论表明:通过引入镜像映射机制,可以将复杂边界引起的动力学不连续性转化为镜像空间中的连续动态;在此基础上,结合饱和函数设计分布式控制律,能够保证系统在无向连通通信拓扑下实现位置和速度的渐近一致,且控制输入始终处于执行器物理允许范围内。
本研究的科学价值在于:首次将边界碰撞的镜像映射处理与执行器饱和控制在一体化框架下进行系统性研究,为多智能体系统在受限空间内的协同控制提供了新的理论工具和分析范式。所提出的方法突破了传统方法对规则边界的依赖,适用于更一般的边界形状。
其应用价值非常突出:该算法显著提升了多智能体系统在真实物理约束环境(如室内仓库、城市楼宇、特定空域)下的工程可实现性。仿真中展示的六边形防御阵地场景,直接关联无人机集群在军事警戒、区域监控等任务中的应用,证明了算法具备向实际作战场景部署的潜力。算法能有效避免执行器饱和导致的系统性能下降甚至失稳,提高了实际系统的可靠性和安全性。
六、 研究的亮点
- 创新性方法: 提出了基于镜像映射的边界动力学连续化方法,这是处理非规则有界地域内智能体碰撞不连续问题的通用且优雅的解决方案,克服了现有方法对矩形等规则边界的局限性。
- 一体化设计: 首次将饱和控制与有界地域边界处理进行协同设计,而非孤立处理单个问题。控制律中嵌入双曲正切函数,确保了理论算法在实际物理系统上的直接可用性。
- 理论完备性: 提供了从模型建立、算法设计到稳定性证明的完整理论闭环,并在严格的数学框架下证明了系统的渐近一致性。
- 显著的性能优势: 通过系统的仿真对比,量化证明了所提算法在收敛速度、稳态精度、能量效率和输入约束适应性四个方面均显著优于传统的人工势场法和虚拟结构法,展现了其综合性能优势。
- 普适性与应用导向: 算法适用于正三角形、正六边形、椭圆等多种边界形状,并专门设置了具有军事应用背景的六边形防御阵地仿真场景,体现了研究面向实际工程应用的导向。
七、 其他有价值的内容
研究在讨论部分指出了未来的研究方向:一是基于本框架进一步实现具有特定几何构型的编队控制;二是引入非弹性碰撞模型,考虑实际碰撞中的能量损失,以增强方法对更真实物理场景的适用性。这为后续研究提供了清晰的延伸路径。此外,论文对网络首发流程和出版确认进行了说明,体现了学术出版的规范性。