本文作者为 Haobin Shi, Meng Xu 和 Kao-Shing Hwang,后者为 IEEE 的资深会员,研究成果发表于 IEEE Transactions on Fuzzy Systems。据文档显示,此论文已被接受,将在未来某期该刊物中正式发表,具体 DOI 为 10.1109/TFUZZ.2019.2931219。
本研究属于机器人技术及模糊控制(fuzzy control)领域,具体聚焦于基于图像的视觉伺服(image-based visual servoing, IBVS)方法在轮式移动机器人(wheeled mobile robots, WMRs)中的应用。IBVS 是一种利用视觉反馈控制机器人运动的技术,广泛应用于导航、目标跟踪和特定位置操作等领域。
在 IBVS 的传统应用中,机器人往往面临以下主要瓶颈: 1. 伺服控制律的设计与收敛问题:对于“欠驱动动力学系统”(underactuated dynamic systems),耦合的动态特性使得 IBVS 控制的运动效率较低;同时,传统系统由于伺服增益固定,收敛速度慢,易造成控制不稳定。 2. 图像检测准确性:图像噪声会导致特征点检测误差,直接影响伺服控制效果。 3. 计算复杂性:伺服控制过程中的逆运动学计算与 Moore-Penrose 广义逆方法因复杂的计算量限制了效率。 4. 学习率问题:强化学习(Reinforcement Learning, RL)算法在控制中的学习率固定导致学习能力有限,收敛时间长。
因此,为解决上述关键问题,提高 WMR 的控制鲁棒性与适应性,同时优化 IBVS 的效率与收敛性能,此研究提出了基于模糊自适应(fuzzy-adaptive)和改进 Q 学习算法(Q-learning)的解耦式 IBVS 方法。
研究的主要目的是开发一种新型视觉伺服控制方法,以提升轮式移动机器人在视觉伺服任务中的性能和收敛效率。研究的创新点包括: 1. 提出一种解耦式 IBVS 方法,通过使用单独的伺服增益对平移与旋转操作进行解耦,优化欠驱动动力学系统的运动表现。 2. 借助改进的 Bagging 方法(Bagging,袋装算法)减少图像噪声对控制精度的影响,并优化图像特征点的提取。 3. 设计了一种基于改进 Q 学习的自适应方法,可在运行过程中动态调整图像雅可比矩阵(Jacobian Matrix)的参数以提高学习能力和控制性能。 4. 使用模糊逻辑(fuzzy logic)调整强化学习模型的学习率,从而有效加速学习过程并提高收敛率。
研究分为以下主要模块和步骤: 1. 解耦控制模块: - 引入解耦式控制方法,分别为 WMR 的平移和旋转运动设计独立的伺服增益,从而减少欠驱动动力学的干扰。 - 改进 Bagging 算法,通过构建加权线性速度预测模型减少噪声干扰,同时降低伺服控制中的计算复杂度。
自适应雅可比矩阵模块:
模糊学习率调节:
图像特征点提取:
伺服控制律设计:
强化学习与模糊控制结合:
研究通过仿真平台(如 Webots 模拟器)和真实环境中的机器人实验验证了提出方法的有效性,主要实验结果如下: 1. 速度预测精度提升: - 改进后的 Bagging 方法相对于传统的 Moore-Penrose 广义逆方法,显著降低了图像噪声的影响。 - 改进 Bagging 方法预测的 WMR 速度值更接近理论期望值。
收敛速度:
强学习率调节的有效性:
真实环境验证:
本研究提出的基于解耦和自适应控制的视觉伺服方法为轮式移动机器人的智能化控制提供了如下价值: 1. 科学意义: - 为 IBVS 系统提供了一种全新的基于 RL 与模糊逻辑的优化解决方案。 - 提供一种可同时处理欠驱动问题和复杂噪声的控制框架。
创新方法:
应用灵活性:
研究指出,未来可以采用深度强化学习(Deep Reinforcement Learning, DRL)来优化混合参数的连续调整,以进一步提升非线性控制系统的动态适应性。此外,对于奖励稀疏问题,开发更适合 IBVS 系统的奖励机制或将极大促进机器人智能控制的发展。