基于模糊逻辑与RBF神经网络的四旋翼无人机航迹跟踪控制器研究

分享自：
基于模糊逻辑与RBF神经网络的四旋翼无人机航迹跟踪控制器研究

期刊:IEEE AccessDOI:10.1109/access.2023.3322944
基于模糊逻辑与RBF神经网络的四旋翼无人机航迹跟踪控制器研究 学术研究报告
本文旨在向各位研究者介绍一篇发表于*IEEE Access*期刊的最新研究成果。该研究由河北科技大学电气工程学院的贾克进、林思琦、杜云、邹超和陆梦阳林共同完成，并于2023年10月9日在线发表（最终版本发布于2023年10月13日）。论文题为《Research on Route Tracking Controller of Quadrotor UAV Based on Fuzzy Logic and RBF Neural Network》，即《基于模糊逻辑和RBF神经网络的四旋翼无人机航迹跟踪控制器研究》。本研究聚焦于自动控制与机器人领域，特别是无人机（UAV）的飞行控制问题。
一、 研究的学术背景与目标
四旋翼无人机因其结构简单、尺寸紧凑、灵活性高等优点，在军事侦察、民用巡检、农业喷洒等多个领域得到了广泛应用。然而，四旋翼无人机本质上是一个具有多变量、强耦合、欠驱动特性的非线性系统。在执行指定航迹跟踪任务时，其飞行过程会受到外部环境干扰、内部气动参数摄动以及未建模动力学等多源扰动的严重影响。传统的比例-积分-微分（PID）控制器虽然结构简单、调试方便，但其参数固定，严重依赖经验调整，且抗干扰能力和鲁棒性较弱，难以满足复杂环境下的高精度轨迹跟踪需求。
因此，如何提升PID控制器在动态、不确定环境下的性能，成为该领域的一个关键挑战。先前的研究尝试了多种改进方案，例如结合强化学习、采用非整数阶PID、或引入滑模控制（SMC）作为自适应机制。然而，这些方法或难以应对系统的非线性与不确定性，或在处理外部环境突变干扰时能力有限。模糊控制（Fuzzy Logic）能够将专家经验转化为控制规则，实时调整参数，处理非线性问题；而径向基函数（RBF）神经网络则具备强大的在线学习和逼近能力，能有效抑制未知扰动。本研究旨在融合这两种方法的优势，针对传统PID控制器的两大核心缺陷——参数难以实时自适应调整、抗干扰能力不足——提出一种创新的复合控制策略。
本研究的主要目标是：设计一种结合模糊逻辑与RBF神经网络的PID控制器（文中称为RF-PID控制器），以实现四旋翼无人机在存在环境干扰下的高精度、高鲁棒性航迹跟踪控制。具体贡献包括：1）将无人机轨迹跟踪问题转化为位置环与姿态环的串级PID指令跟踪控制问题，简化了控制参数输入；2）利用模糊控制理论，根据系统偏差实时自适应调整PID参数增益；3）利用RBF神经网络的学习机制，在线补偿PID控制参数，通过在线学习与调整抑制外部环境变化对系统的干扰。
二、 研究的详细工作流程
本研究的工作流程可分为四个核心步骤：系统建模与基础控制器设计、模糊PID控制器设计、RBF神经网络PID补偿器设计，以及最终的仿真验证与性能对比。研究未涉及实物样机实验，而是通过高保真的数值仿真（基于MATLAB/Simulink平台）来验证所提控制算法的有效性。
第一步：系统建模与串级PID控制器设计 研究首先以“X”型四旋翼无人机为对象，基于牛顿-欧拉方程建立了其刚体动力学模型。为了简化控制器设计，研究在合理假设（如小角度假设）下，将复杂的非线性模型解耦为水平通道（x, y位置）、高度通道（z位置）和姿态通道（滚转角φ、俯仰角θ、偏航角ψ）的简化模型。基于串级控制思想，研究设计了一个底层飞行控制架构：外环为位置PID控制器，负责根据期望位置与实际位置的偏差，计算出期望的姿态角（φ_d, θ_d）和期望拉力（F_d）；内环为姿态PID控制器，负责根据外环给出的期望姿态角与当前实际姿态角的偏差，计算出控制无人机运动的扭矩（τ_x, τ_y, τ_z）和总拉力。这一设计将复杂的六自由度轨迹跟踪问题，分解为相对独立的位置环和姿态环PID命令跟踪问题。
第二步：模糊自适应PID（F-PID）控制器设计 针对传统PID参数固定、依赖经验的缺点，研究引入了模糊控制来实时调整位置环PID控制器的三个增益参数（K_p, K_i, K_d）。具体流程如下： 1. 输入与模糊化：以位置跟踪偏差e(t)及其变化率ec(t)作为模糊控制器的输入。将这两个精确量通过定义的隶属度函数（如三角形、梯形）转换为模糊语言变量，如“负大(NB)”、“负中(NM)”、“零(Z)”、“正小(PS)”等。 2. 模糊规则库与推理：研究基于专家经验，建立了包含21条规则的模糊规则表。规则形式为“如果e(t)是A且ec(t)是B，那么K_p是C，K_i是D，K_d是E”。例如，当偏差大且偏差变化率大时，需要较大的比例增益K_p来快速减小偏差，同时需要较小的积分增益K_i和微分增益K_d以防止超调。通过Mamdani推理方法，将输入的模糊集合与规则库匹配，得到输出增益参数的模糊集合。 3. 解模糊化：采用重心法，将输出的模糊集合转化为精确的增益调整量（K_p0, K_i0, K_d0）。这些调整量与PID控制器的初始增益相结合，形成能够根据系统状态实时调整的模糊自适应PID控制器。
第三步：RBF神经网络PID在线补偿器设计 模糊控制器虽然能根据规则调整参数，但其规则基于先验经验，当系统遇到未在规则库中考虑的突发性剧烈干扰时，性能可能下降。为此，研究引入了RBF神经网络作为在线补偿器。 1. 网络结构：采用“5-8-3”的三层前馈网络结构。输入层包含5个节点：模糊PID控制器的三个控制量输出（K_p0*e(t), K_i0*∫e(t)dt, K_d0*de(t)/dt）、系统控制量u(t)以及系统实际位置反馈y_out(t)。隐含层包含8个节点，使用高斯函数作为径向基函数。输出层包含3个节点，输出PID增益的补偿量（K_p1, K_i1, K_d1）。 2. 在线学习机制：RBF网络的核心是能够在线学习。其性能指标函数定义为网络输出y_m(t)与系统实际输出y_out(t)之差的平方的一半。采用梯度下降法，该网络在线实时更新其权重w_j、基宽向量b_j和中心向量c_j，以最小化性能指标，即让网络的输出尽可能逼近系统的真实行为。 3. 补偿机制：通过网络学习得到的雅可比矩阵信息（代表系统输出对控制输入的灵敏度），结合梯度下降法，计算出对PID三个增益的补偿量（K_p1, K_i1, K_d1）。最终的PID控制器增益为模糊输出与神经网络补偿量之和：K_p = K_p0 + K_p1, K_i = K_i0 + K_i1, K_d = K_d0 + K_d1。这种设计使得控制器不仅能够基于经验规则调整，还能通过在线学习自适应地补偿未建模动态和突发干扰。
第四步：仿真验证与对比分析 为验证所提出的RF-PID控制器的性能，研究在MATLAB/Simulink环境中设置了三种具有挑战性的轨迹跟踪场景进行数值仿真，并与标准PID控制器、模糊PID（F-PID）控制器进行对比。仿真中考虑了不稳定的空气阻力作为外部干扰（空气阻力系数在7e-2到7.5e-2之间随机选取）。 1. 场景一（8字形轨迹）：在固定高度的二维平面上跟踪一个8字形轨迹。该轨迹要求无人机在保持高度的同时，连续、平滑地改变飞行方向，对姿态控制要求高。 2. 场景二（鞍形轨迹）：在三维空间中跟踪一个鞍形轨迹。该轨迹在x, y, z三个通道的期望输入差异大，导致无人机欧拉角变化剧烈，对控制器的动态响应和协调能力构成挑战。 3. 场景三（复杂环境路径）：跟踪一个在城市复杂环境中通过路径规划算法（引用文献[32]）生成的最优路径。路径点间距不均匀且距离大，起始点与路径起点存在较大偏差，考验控制器在非理想初始条件和不规则输入下的稳定性和适应性。 在每种场景下，研究对比了三种控制器跟踪轨迹与期望轨迹的贴合度、飞行总距离误差、各通道（x, y, z）的跟踪误差曲线以及姿态角（φ, θ, ψ）的跟踪误差。
三、 研究的主要结果
仿真实验的结果清晰地证明了RF-PID控制器的优越性。
在场景一（8字形轨迹）中，RF-PID控制器生成的轨迹最贴近期望的8字形，在轨迹的尖锐拐点处转弯半径更小。飞行距离统计显示，期望轨迹长度为6.586米，PID、F-PID、RF-PID控制器的实际飞行距离分别为11.7091米、13.2769米和9.8881米，RF-PID的相对误差最小。从各通道跟踪曲线看，RF-PID在x轴和y轴方向对期望输入的响应更快，超调更小，尤其是在y轴极性变化的时刻（t=2.5s, 7s等），RF-PID产生的跟踪误差（如0.08米）远小于PID控制器（0.1-0.2米）和F-PID控制器（0.4米）。姿态角跟踪误差图显示，RF-PID控制器能在短时间内（约2秒后）将俯仰角和滚转角的跟踪误差控制在[-0.2, 0.2]度范围内，偏航角误差接近零，表明其具有出色的姿态稳定能力。
在场景二（鞍形轨迹）中，RF-PID控制器同样表现出最佳的轨迹拟合效果。统计数据显示，期望轨迹长15.7399米，PID、F-PID、RF-PID的飞行距离分别为16.6184米、17.8612米和16.0779米，RF-PID的误差最小。在x通道输入突增时（t=2s），F-PID控制器出现超调，而RF-PID能及时调整。在y通道极性剧烈变化时，RF-PID的误差控制也优于另外两者。对于z通道，从局部放大图可见，RF-PID控制器响应速度快，误差控制在一个更合理的范围内。姿态角误差同样在2秒后被快速抑制并维持在很小范围内。
在场景三（复杂环境路径）中，由于初始位置（0,0,0）与路径起点（4,4,2）存在较大偏差，PID控制器在跟踪起始点时出现振荡，F-PID控制器出现超调，而RF-PID控制器虽然初始误差也较大，但能以更稳定的状态完成跟踪任务。期望飞行距离为92.3035米，三种控制器的实际飞行距离分别为104.2573米、104.7670米和101.6529米，RF-PID再次胜出。在x通道，RF-PID能及时调整由初始大偏差引起的超调。在y通道，RF-PID的跟踪轨迹与期望输入的误差更小。在z通道，PID控制器虽率先实现零误差控制，但因控制量瞬时增大引发了振荡；而RF-PID在实现零误差控制后，能保持更小的稳态误差。
在所有三个测试场景中，RF-PID控制器在轨迹贴合度、飞行距离误差、各通道跟踪精度以及姿态稳定速度方面，均 consistently 优于标准的PID控制器和单一的模糊PID控制器。这些结果有力地支持了研究的核心论点：融合模糊逻辑和RBF神经网络的复合控制策略，能显著提升四旋翼无人机轨迹跟踪的鲁棒性和准确性。
四、 研究的结论与价值
本研究得出结论：所提出的基于模糊逻辑和RBF神经网络的PID控制器（RF-PID），通过将无人机轨迹跟踪问题转化为串级PID控制、利用模糊理论实现PID参数的自适应实时调整、并借助RBF神经网络的在线学习能力进行增益补偿，有效克服了传统PID控制器参数固定、抗干扰能力弱的缺点。数值仿真结果表明，该控制器能显著提高四旋翼无人机轨迹跟踪控制的鲁棒性和精度。
本研究的科学价值在于提出并验证了一种有效的智能复合控制框架，将基于经验的模糊推理与基于数据的神经网络学习相结合，为处理非线性、强耦合、多扰动的无人机控制系统提供了一种新颖的解决方案。其应用价值直接体现在提升无人机在复杂、动态环境（如城市巡检、农业作业、灾害救援）中执行自动化任务时的可靠性、稳定性和精度。虽然当前研究仅基于数值仿真，且干扰模型相对简单，但为后续在实际物理平台上实现和应用该算法奠定了坚实的理论基础。
五、 研究的亮点
方法创新性：本研究的主要亮点在于创新性地将模糊控制与RBF神经网络进行深度结合，并非简单并列。模糊控制负责基于规则的“粗调”和快速响应，RBF神经网络负责基于在线学习的“细调”和干扰补偿，二者协同工作，实现了“经验”与“学习”的优势互补。
问题转化清晰：通过严谨的数学模型和串级控制思想，将复杂的六自由度无人机轨迹跟踪问题，清晰地分解为位置环和姿态环的PID指令跟踪问题，简化了控制器设计的复杂度。
详实的对比验证：研究通过设计三个不同难度和特点的轨迹跟踪场景（平面复杂轨迹、三维空间轨迹、实际规划路径），并与两种基准控制器进行全方位、多指标的对比，验证结果全面且有说服力，充分展示了所提控制器在稳定性、适应性和决策能力方面的优越性。
工程实用性导向：整个控制器的设计（如模糊规则表的制定、RBF网络结构的选择）均考虑了工程实现的可行性与计算效率，具有较好的实用化前景。
六、 其他有价值的內容
论文在讨论部分也坦诚指出了当前研究的局限性：实验环境仅为数值仿真，干扰因素仅是基于实验数据的空气阻力变化扰动，缺乏在实际复杂环境（如强风、阵风、传感器噪声、模型不确定性更大）中的应用经验。这为未来的研究工作指明了方向：作者计划未来将重点研究四旋翼无人机在实际环境中的跟踪控制问题，并考虑引入自抗扰控制（Active Disturbance Rejection Control）等更先进的抗干扰理论。这种对研究局限性的清晰认识和对未来工作的规划，增强了论文的严谨性和深度。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问