四旋翼无人机轨迹跟踪的鲁棒神经模糊自适应控制

分享自：
四旋翼无人机轨迹跟踪的鲁棒神经模糊自适应控制

信息科学
航空航天工程
人工智能
自动化
工程学
期刊:2025 XXVII Robotics Mexican Congress (COMRoB)
【点击此处】阅读全文、收藏及针对性提问
本文旨在介绍一篇题为《Robust Neuro-Fuzzy Adaptive Control for Trajectory Tracking of a Quadrotor UAV》的学术论文。该论文由来自墨西哥国立理工学院拉古纳理工学院（Tecnológico Nacional de México / Instituto Tecnológico de la Laguna）的Dexter Hernández、Sergio López和Miguel Llama三位作者共同完成。该研究发表于2025年11月12日至14日在墨西哥托雷翁举行的“2025年第二十七届墨西哥机器人大会”（2025 XXVII Robotics Mexican Congress，COMROB），并收录于大会论文集。本报告将对该研究进行详细介绍。
研究背景与动机本研究属于机器人控制与智能控制领域，具体聚焦于四旋翼无人机（Quadrotor UAV）的轨迹跟踪控制问题。四旋翼无人机因其垂直起降、悬停和灵活机动能力，在工业运输、医疗物资配送、监控等多个领域得到广泛应用。然而，四旋翼系统本质上是非线性、强耦合且欠驱动（underactuated）的复杂系统。这意味着其控制输入（四个旋翼的转速）数量少于需要独立控制的自由度（六个：三个位置和三个姿态角），并且系统各状态变量之间存在复杂的相互影响。此外，在实际应用中，无人机不可避免地会受到外部干扰（如风力）和模型不确定性（如参数不匹配）的影响。这些特性使得四旋翼的高精度、鲁棒控制成为一个极具挑战性的课题。
传统的控制方法，如比例-积分-微分（PID）控制器，通常严重依赖精确的系统模型，并且需要大量参数整定工作，在存在干扰和不确定性时，其性能往往难以保证。因此，研究人员一直在探索能够不依赖于精确模型、并能自适应处理不确定性的先进控制方法。神经模糊控制（Neuro-Fuzzy Control， NFC）结合了模糊逻辑（处理不确定性和专家知识）和神经网络（学习和自适应能力）的优点，被认为是解决此类问题的有效工具。本研究正是受到这一挑战的驱动，旨在设计一种新型的、鲁棒的神经模糊自适应控制器，以提升四旋翼在干扰存在下的轨迹跟踪性能。
本研究的目标是：设计并验证一种用于四旋翼无人机轨迹跟踪的单层神经模糊控制器。该控制器采用PD控制加模糊神经补偿的结构，无需精确的系统模型知识，并能有效应对干扰。此外，为了降低控制设计的复杂度并适应四旋翼的欠驱动特性，研究采用了分散控制（decentralized control）策略，将系统分解为驱动子系统和欠驱动子系统分别进行控制器设计。
研究详细工作流程本研究主要包含四个核心步骤：1）建立四旋翼动力学模型；2）设计针对驱动与欠驱动子系统的神经模糊控制器；3）设计模糊神经补偿机制；4）通过仿真实验验证控制器性能。研究没有使用物理样机，而是基于数学模型在仿真环境中进行验证，研究对象即为描述四旋翼动态的微分方程模型及其在控制器作用下的响应。
第一步：建立四旋翼动力学模型。 研究者采用了文献中广泛使用的简化四旋翼动力学模型。该模型将系统分为平移（位置）子系统和旋转（姿态）子系统，分别用方程(1)和(2)描述。其中，ξ = (x, y, z)^T 表示位置坐标，η = (φ, θ, ψ)^T 表示滚转、俯仰和偏航角。模型考虑了重力(g)、惯性矩阵(J)、空气阻尼系数(λξ, λη)、科里奥利力和向心力效应(wη(η̇))，以及外部干扰(dξ, dη)。模型参数基于Quanser公司的QBall2平台实验数据设定（如表I所示），包括质量(m)、转动惯量(Jx, Jy, Jz)和各轴阻尼系数等，这确保了仿真环境具有一定的现实基础。
第二步：设计神经模糊控制器。 考虑到四旋翼的欠驱动特性（例如，水平位置x, y无法直接控制，需要通过调整姿态角θ, φ来间接实现），研究者将控制系统分解为两部分： * 针对驱动子系统（z, ψ）的控制律： 对于高度z和偏航角ψ这两个可以直接通过控制输入（总推力和偏航力矩）控制的自由度，设计了如方程(3a)和(3b)所示的控制律。控制输入u_k（k=z, ψ）由两部分组成：一个传统的PD控制器项（k_vk * r_k，其中r_k为滤波误差）和一个模糊神经补偿项（ŵ_k^T * ζ̄(χ_k)）。神经网络的权重ŵ_k通过在线自适应律(3b)进行更新，其中γ_k是自适应增益，ζ̄(χ_k)是增广的模糊乘积向量（作为神经网络的激活函数），χ_k = [e_k, ė_k]^T是输入（跟踪误差及其导数）。 * 针对欠驱动子系统（{x, θ} 和 {y, φ}）的控制律： 对于水平位置x和与之耦合的俯仰角θ（同理，y和滚转角φ），设计了如方程(4a)和(4b)所示的控制律。控制输入u_l（l=θ, φ）同样由PD项（k_pl * y_l）和模糊神经补偿项（ŵ_l^T * ζ(χ_m)）构成。这里的y_l是一个综合了位置和姿态误差及其导数的输出函数（见方程(5)），其参数（α1, α2, β1, β2）在表II中给出。神经网络的输入χ_m（m=x, y）仅包含欠驱动坐标（x或y）的误差信息，权重ŵ_l通过类似的自适应律(4b)在线更新。
这种设计的关键在于，控制器不需要知道被控对象（四旋翼）的精确数学模型，其模糊神经补偿部分能够在线学习并抵消系统动态中的不确定性和外部干扰。同时，分散化设计降低了单个控制器的复杂度。
第三步：设计模糊神经补偿。 这是本研究的核心创新点之一。研究者采用了一个单层模糊神经网络来生成补偿信号。与常规神经网络使用Sigmoid或ReLU等激活函数不同，该网络使用“模糊乘积向量”作为激活函数。具体而言： 1. 模糊规则与推理： 采用了基于单点模糊化、乘积推理机和中心平均解模糊器的模糊系统。规则形式为：“如果χ1是A1且…且χn是An，则y是B”。 2. 网络输出计算： 模糊神经网络的输出f是各条规则后件（权重ŵ_j）的加权和，权重由前件隶属度函数的乘积归一化后得到，即f = ŵ^T * ζ(χ)。其中，ζ(χ)就是“模糊乘积向量”，其每个元素对应一条模糊规则的归一化激活度。 3. 结构增强： 研究者将神经网络的偏置（bias）加入到模糊乘积向量中，形成了一个“增广的模糊乘积向量”ζ̄ = [ζ^T, 1]^T，相应地，权重向量也扩展为ŵ = [ŵ_rule^T, ŵ_bias]^T。文中指出，这一改进显著提升了控制器的性能。 4. 隶属度函数： 输入变量的模糊集采用高斯型隶属度函数（径向基函数）定义，如方程(6)所示。每个输入变量（如位置误差e_z、速度误差ė_z等）定义了五个模糊集：负大（NB）、负小（NS）、零（Z）、正小（PS）、正大（PB）。这些模糊集的中心和标准差（σ）根据四旋翼预期的误差范围（基于文献[16]-[19]）进行启发式选择，具体数值见表III。 5. 在线学习： 每个子系统（驱动和欠驱动）都有自己独立的模糊神经网络。网络权重通过前述的梯度下降类自适应律(3b)和(4b)进行在线实时更新，这使得控制器能够适应变化的环境和系统动态。
第四步：仿真实验与性能验证。 研究者在MATLAB/Simulink（或类似仿真环境）中搭建了完整的控制系统进行验证。工作流程如下： 1. 仿真设置： 期望轨迹设定为一个螺旋上升的圆形路径：x_d = A cos(ω1 t), y_d = A sin(ω1 t), z_d = h t，姿态角期望值均为0。仿真时长50秒。 2. 控制器参数： 为驱动子系统和欠驱动子系统分别设置了PD增益（k_p, k_v）和自适应增益（γ），具体数值在文中给出。 3. 干扰引入： 为了测试鲁棒性，在仿真中向高度通道（d_z）和三个姿态通道（d_φ, d_θ, d_ψ）施加了正弦形式的干扰b sin(ω2 t)。 4. 对比基准： 为了凸显所提神经模糊控制器（NFC）的性能，将其与一个具有相同PD参数的纯PD控制器（PDC）在相同仿真条件下进行对比。 5. 数据分析： 通过比较实际轨迹与期望轨迹、分析控制信号（u_z, u_φ, u_θ, u_ψ）的变化、观察姿态角响应以及计算位置和偏航角跟踪误差的均方根值（RMS）来评估控制器性能。
主要研究结果仿真实验结果清晰地展示了所提神经模糊控制器的优越性能。
轨迹跟踪结果（图5）： 神经模糊控制器（NFC）驱动的四旋翼在初始短暂偏离后，能够快速、准确地收敛到期望的螺旋上升圆形轨迹上。而作为对比的纯PD控制器（PDC）在整个仿真过程中始终无法完全跟踪上期望轨迹，存在持续的跟踪误差。这直观地证明了NFC在复杂轨迹跟踪任务中的有效性。
控制信号分析（图6）： NFC产生的控制信号（总推力u_z和三个力矩u_φ, u_θ, u_ψ）表现出合理的动态特性。u_z在起飞阶段迅速增加后稳定在维持高度所需的数值附近；u_φ和u_θ在初始阶段为纠正姿态产生振荡后趋于零，表明滚转和俯仰角得到了稳定；u_ψ呈现正弦变化以跟踪偏航指令。相比之下，PDC的u_z信号响应更迟缓（阻尼更大）。控制信号的平滑性和有界性也说明了控制器的稳定性。
姿态响应结果（图7）： 在NFC控制下，偏航角（ψ）能够紧密跟踪其期望值（0度），且振荡幅度远小于PDC控制下的结果。滚转角（φ）和俯仰角（θ）在两种控制器下都稳定在零附近，但NFC的控制性能在误差收敛速度或抗干扰性上可能更优（文中提到差异不显著，但结合轨迹跟踪结果，NFC通过姿态的精确控制间接实现了更好的位置跟踪）。
定量性能指标（表IV）： 误差的均方根值（RMS）提供了最有力的量化证据。在所有四个被比较的自由度上，NFC的跟踪误差均方根值均显著低于PDC： * x方向误差：NFC (0.0445 m) < PDC (0.0463 m) * y方向误差：NFC (0.0025 m) < PDC (0.0036 m) * z方向误差：NFC (0.0046 m) 远小于 PDC (0.5653 m)。这一巨大差距尤其突出，因为仿真中在z方向施加了干扰，这充分证明了NFC模糊神经补偿模块在对抗干扰方面的强大能力。 * 偏航角误差：NFC (0.3073度) 远小于 PDC (3.5454度)。
这些数据结果与图形结果相互印证，强有力地支持了结论：本研究提出的神经模糊自适应控制器在存在外部干扰的情况下，能够实现比传统PD控制器更精确、更鲁棒的四旋翼无人机轨迹跟踪。
研究结论与价值本研究成功设计并仿真验证了一种用于四旋翼无人机轨迹跟踪的鲁棒神经模糊自适应控制器。主要结论如下： 1. 控制器有效性： 所提出的基于PD加模糊神经补偿的分散式神经模糊控制方案，能够有效解决四旋翼非线性、耦合、欠驱动系统的轨迹跟踪问题。 2. 鲁棒性验证： 在施加了模拟干扰的仿真环境中，该控制器表现出了良好的精度和鲁棒性，显著优于传统PD控制器。 3. 无模型特性： 控制器设计不依赖于被控对象的精确数学模型，其模糊神经补偿部分通过在线学习自适应地补偿系统动态不确定性和外部干扰。 4. 结构创新： 采用“增广的模糊乘积向量”作为神经网络激活函数，并结合在线权重更新，提升了控制器的性能。
研究的价值体现在： * 科学价值： 为欠驱动、非线性系统的智能控制提供了一种新的解决方案。它将模糊逻辑、神经网络和自适应控制理论相结合，展示了混合智能控制在复杂系统控制中的潜力。分散控制的思路为处理高阶、多变量系统提供了可行的工程化路径。 * 应用价值： 所设计的控制器具有较强的实用前景。由于其不依赖精确模型且能抗干扰，更适用于实际无人机应用场景，如物流配送、巡检、野外作业等存在不确定环境和风扰的情况。仿真中使用的参数基于真实实验平台（QBall2），增加了研究成果向实际系统迁移的可行性。
研究亮点创新的控制器结构： 核心亮点在于将单层神经网络的激活函数替换为“增广的模糊乘积向量”。这本质上是构建了一个结构透明的模糊神经网络，兼具模糊系统的解释性和神经网络的学习能力，并通过加入偏置项增强了其表达能力。
针对性的分散化设计： 没有采用统一的六自由度控制器，而是根据四旋翼的物理特性（驱动 vs. 欠驱动）自然地将系统分解，为不同类型的子系统量身定制控制律，降低了设计复杂度并提高了效率。
显著的性能提升： 在存在干扰的轨迹跟踪任务中，相较于基准PD控制器，所提控制器在关键性能指标（特别是高度和偏航跟踪误差）上实现了数量级式的提升，有力地证明了其优越性。
完整的仿真验证： 研究提供了从模型建立、控制器设计、参数选择到对比实验的完整流程，结果分析包含定性和定量（RMS误差）两个方面，论证充分。
其他有价值内容论文在引言部分对相关领域的研究工作进行了综述，列举了将神经模糊控制、滑模控制、观测器理论等应用于机器人轨迹跟踪的多种方法，为本研究提供了学术背景和定位。此外，论文明确说明了模糊隶属度函数参数的选择依据（参考了其他文献中关于四旋翼性能极限的数据），体现了设计的合理性。最后，论文指出了所提方法因为引入模糊乘积向量而带来的计算量增加问题，并以此作为采用分散控制结构而非集中控制结构的理由之一，显示了研究者对工程实现可行性的考虑。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问