本研究由Wei Xiao(Boston University)与Calin Belta(Boston University)合作完成,发表于 IEEE Transactions on Automatic Control,卷号为67,期号为7,出版日期为2022年7月。
该研究聚焦于自动控制领域,具体而言,旨在解决一类关于动态系统的优化控制问题,同时需满足安全约束与控制限制。近年来,如何在动态系统上实现期望的稳定性和安全性,一直是研究的热门方向,特别是在非线性系统和高维复杂系统中的应用。关键问题在于如何在稳定控制(convergence)和安全保障(safety)的平衡中设计有效的控制策略,研究人员提出了使用控制屏障函数(control barrier functions, CBFs)和控制李雅普诺夫函数(control Lyapunov functions, CLFs)的方法。然而,以往的研究存在两大主要局限性:1)它们多假定约束的相对阶数为1;2)在面对多重安全约束或严格的控制限制时,所衍生的问题极易失去可行性(例如二次规划问题可能无解)。为了解决上述问题,作者在本研究中提出了一种新型的高阶控制屏障函数(high-order control barrier functions, HOCBFs)的概念,并以复杂动态系统中的安全导航及自适应巡航控制问题为实例,验证了此方法的应用效果。
本研究的方法包含多个步骤,详细概述如下:
1. 提出高阶控制屏障函数(HOCBF)的定义与理论基础
屏障函数与控制屏障函数基础知识:作者首先总结了屏障函数(Barrier Functions, BFs)和控制屏障函数(Control Barrier Functions, CBFs)的传统定义,强调其通过Lyapunov-like技术方法进行安全性的数学描述。基于先前研究的延续,作者定义了一个m阶微分函数的递归公式,通过引入Class K函数来关联不同的约束阶层。这种递归设计使得屏障函数可以扩展至更高阶数。
高阶控制屏障函数的新定义:作者结合CBF的理念,提出了HOCBF用于描述相对阶数不为1的系统,并以多类数学推导及引理为基础,证明其方法理论上的前向不变性。
2. 构建基于HOCBF的优化控制问题
目标与数学形式化:将HOCBF结合控制Lyapunov函数(CLF)引入原优化控制问题(Optimal Control Problem, OCP)中。结合Quadratic Programming(QP),重新将时间离散化后,设计了序列化的QP求解。
可行性问题的解决:为了克服HOCBF可能导致问题无解的情况,作者创新性地提出了两种解决方法:惩罚法(Penalty Method)与参数化方法(Parameterization Method)。具体而言,惩罚法通过在递归设计中引入权值以调节问题的可解性;参数化方法则通过调整Class K函数参数使得约束边界最优化。
3. 典型案例与仿真方法
以两组复杂动态系统问题为例,验证提出方法的实际效果和适用性: - 自适应巡航控制(Adaptive Cruise Control, ACC):研究通过HOCBF方法确保车辆间的安全距离,同时最小化能源消耗。 - 机器人导航:研究通过HOCBF确保机器人在未知环境中避开障碍物并安全到达多目标点,同时在时间最优和能耗最优的要求下完成任务。
1. 高阶控制屏障函数的有效性
两种案例研究(ACC和机器人控制)均成功验证了HOCBF的理论有效性。对于ACC问题,论文表明,HOCBF可以处理二阶约束问题,并显著提升问题的可行性。在机器人避障问题中,HOCBF方法能灵活适应动态变化的复杂环境,并保证安全需求。
2. 仿真与数据分析
在ACC问题的实验中,仿真以具体速度、车辆间距等主要参数为输入,逐步验证了HOCBF方法的控制稳定性与安全性能。在机器人导航场景中,其涉及数值优化的实验结果表明: - 安全约束(例如碰撞规避)严格被满足。 - 能量消耗与路径规划显著优化。
此外,仿真还验证了不同方法(惩罚法与参数化法)的比较。结果表明,参数化方法虽然计算成本更高,但在寻找特定最优权值与参数时,具备更好的适应性和鲁棒性。
3. 与现有方法的对比结果
本研究的主要贡献体现在以下几个方面: - 构造了能够处理任意相对阶数约束的高阶控制屏障函数(HOCBF)。 - 提供了一种新颖而有效的优化框架,该框架通过结合HOCBF与QP解决了复杂系统的安全控制优化问题。 - 成功将理论应用于ACC与机器人导航中,解决了实际场景中安全与控制约束同时存在时的问题。
此研究在学术价值和工程应用上都具有重要意义。学术上,它扩展了控制理论中屏障函数的基本思路,提供了更普适的方法;工程上,该方法为自动驾驶、工业自动化与机器人领域提供了关键技术支持。
该研究的亮点包括: 1. 首次提出高阶控制屏障函数(HOCBF)及其递归定义,不再局限于相对阶数为1的约束问题。 2. 引入了惩罚法与参数化方法,显著提高了问题可行性。 3. 提供了广泛适用的优化框架,结合CBF与CLF以满足高维动态系统的安全性与稳定性需求。
作者提出,未来将结合机器学习方法进一步提升系统性能,探索在线优化与自主学习能力。此外,还计划研究适用于非凸集合的优化技术。