数据驱动方法在软体机器人建模与控制中的应用综述

分享自：
数据驱动方法在软体机器人建模与控制中的应用综述

机械
生物医学工程
期刊:ieee transactions on automation science and engineeringDOI:10.1109/tase.2024.3377291
【点击此处】阅读全文、收藏及针对性提问
类型b：学术综述报告
本文是由Zixi Chen（意大利Scuola Superiore Sant’Anna生物机器人研究所）、Federico Renda（阿联酋哈利法大学自主机器人系统中心）等9位作者联合撰写的综述论文，发表于2025年《IEEE Transactions on Automation Science and Engineering》第22卷。论文题为《Data-Driven Methods Applied to Soft Robot Modeling and Control: A Review》，系统回顾了数据驱动方法在软体机器人建模与控制领域的研究进展。
数据驱动方法的分类与应用框架
 文章首先构建了软体机器人”设计-传感-建模-控制”的完整框架（图1）。灰色模块代表机器人设计，包括1自由度（degree of freedom, DOF）软体手指、3自由度连续体机器人等结构；绿色传感系统通过光学标记（optical markers）、光纤光栅（fiber Bragg grating, FBG）等传感器获取信息；蓝色建模模块建立从驱动变量a到机器人状态p的映射函数fθ；红色控制模块gτ则实现从期望状态pd到驱动指令的逆向求解。该框架明确了数据驱动方法在软体机器人两大核心问题——建模（正向求解）与控制（逆向求解）中的集成应用场景。
物理模型与雅可比矩阵的基础作用
 作为数据驱动方法的基础，物理模型提供了仿真环境和机理认知。论文比较了四种典型物理模型：有限元法（finite element method, FEM）可实现高精度离线仿真（如SOFA软件）；Cosserat杆模型通过几何变应变（geometric variable-strain, GVS）离散化（如PyElastica仿真器）；分段常曲率（piecewise constant curvature, PCC）假设简化了动态效应建模；同心管机器人（concentric tube robot）等专用模型则针对特定结构（表II）。雅可比矩阵通过线性化处理实现实时控制，其在线更新策略（公式1-2）和优化控制方法（如[34]首次应用）虽简化了复杂非线性问题，但需要高频更新（表III）。这两种传统方法为数据驱动方法提供了仿真环境和数据关系推导基础。
统计方法的灵活建模能力
 统计方法通过数据拟合建立变量间映射，主要包括三类：回归方法中，高斯过程回归（Gaussian process regression, GPR）利用核函数（公式4-5）预测机器人状态[70]；局部加权投影回归（locally weighted projection regression, LWPR）通过高斯核加权实现增量学习[16]；支持向量回归（support vector regression, SVR）在损失函数中引入L2范数扩展（公式3）[75]。高斯混合模型（Gaussian mixture model, GMM）通过联合概率密度（公式6）同时支持正向建模（公式7）和逆向控制（公式8）[74]。扩展卡尔曼滤波（extended Kalman filter, EKF）作为观测器，通过状态预测（公式9）和测量校正（公式10）实现实时状态估计[81]。统计方法优势在于中等数据需求下实现在线更新（表IV），但局部模型泛化能力有限。
神经网络的通用逼近特性
 神经网络发展经历了三个阶段：早期采用极限学习机（extreme learning machine, ELM）（公式11-13）和径向基函数（radial basis function, RBF）等简单结构；现阶段多层感知机（multilayer perceptron, MLP）（公式14）成为主流，如[24]通过超参数实验验证了隐藏层数对传感任务的影响；针对迟滞特性，递归神经网络（recurrent neural network, RNN）尤其是长短期记忆网络（long short-term memory, LSTM）（公式15）表现出色，如[32]用于导管动态控制。特殊网络结构中，卷积神经网络（convolutional neural network, CNN）（图6-c）处理视觉信息[95]，生成对抗网络（generative adversarial network, GAN）生成合成数据[121]。神经网络虽泛化能力强但需大量数据，且在线更新困难（表V）。
强化学习的高层任务实现
 强化学习（reinforcement learning, RL）通过环境探索解决复杂任务：早期采用高斯过程时序差分（Gaussian process temporal difference）等统计模型作为代理[123]；现代使用深度Q学习（deep Q-learning）等神经网络方法（公式16），如[128]实现软体蛇形机器人步态设计。针对软体机器人特有挑战，研究者采用离散化动作空间[37]、仿真环境预训练[133]等策略。RL虽能完成开瓶盖等复杂操作[69]，但存在实时交互风险和高计算成本问题（表VI）。
方法比较与未来展望
 论文通过表VII对比了2019年后代表性研究，指出：统计方法平衡数据需求与计算效率；神经网络具有最强泛化能力；RL专攻高层复杂任务。未来发展方向包括：1）构建更大规模神经网络模型；2）多方法融合（如[114]结合RNN与运动学模型）；3）医疗应用中的安全性验证。作者建立了专题网站（https://sites.google.com/view/23zcb）持续更新研究进展。
本文的学术价值在于首次并行梳理了软体机器人建模与控制的数据驱动方法，通过352篇文献的系统分析（图2-3），建立了分类体系（表I），为研究者选择方法提供决策框架。实践意义体现在：比较了各方法在数据需求（data requirement）、控制频率（control frequency）等关键指标（图3）的差异，指导工程应用；指出现有方法在医疗等安全敏感领域的局限性，推动后续研究向可解释性、可靠性方向发展。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问