2025年7月31日,《自然》(Nature)期刊第643卷发表了题为《果蝇运动的全身物理模拟》的研究论文。这项研究由来自美国霍华德·休斯医学研究所珍妮莉亚研究园区(Roman Vaxenburg, Igor Siwanowicz, Alice A. Robie, Carmen Morrow, Zinovia Stefanidi, Gert-Jan Both, Gwyneth M. Card, Michael B. Reiser, Kristin M. Branson, Srinivas C. Turaga)、Fauna Robotics (Josh Merel)、Google DeepMind (Guido Novati, Matthew M. Botvinick, Yuval Tassa) 以及德国图宾根大学(Zinovia Stefanidi)等机构的科学家共同完成。
一、研究背景与目标
动物行为源于神经系统、身体和环境之间的复杂相互作用。要精确模拟感觉运动行为的神经控制,必须拥有解剖学上精细的身体生物力学表征。尽管存在针对线虫、水螅、啮齿动物和果蝇的物理模型,但此前的果蝇模型要么身体结构简化,要么仅专注于单一运动模态(如仅飞行或仅行走),且控制器多为手动设计。因此,开发一个集成的、高生物真实性的、能够模拟多种行为(特别是整合飞行与行走)的全身物理模型,对于研究“脑-身体-环境”闭环中的感觉运动控制至关重要。本研究的核心目标是:建立一个开源、通用、解剖学细节丰富的果蝇(Drosophila melanogaster)全身物理仿真框架,并利用数据驱动的方法训练神经网络控制器,使其能生成自然主义的运动行为,从而为研究具身环境下的神经控制提供一个强大平台。
二、研究方法与流程
本研究构建了一个系统性的工作流程,涵盖了从解剖学建模、物理引擎集成到行为控制器训练的多个步骤。
1. 高分辨率解剖学建模与几何重建 * 研究对象与样本处理:研究以成年雌性果蝇(w1118品系)为对象。为获得无畸变的高分辨率图像,研究者将果蝇身体分解为头、胸腹、翅膀和腿等部分,通过胰蛋白酶消化去除软组织,并用过氧化氢漂白和刚果红染色几丁质结构。 * 成像与分割:使用共聚焦荧光显微镜对各个身体部件进行成像。通过对共聚焦图像栈的手动分割,识别出67个独立的身体组件(包括头、胸、腹、口器、触角、翅膀、平衡棒和6条腿的各节段)以及66个关节枢轴点。 * 三维模型简化与装配:使用Fiji软件从图像中提取三维网格,并导入Blender软件进行简化,将顶点数从约2260万减少到约2万,以平衡计算效率与形态特征保留。在Blender中,将这些组件组装成完整身体模型,并依据识别的关节位置定义运动学树,最终模型具有102个自由度(degrees of freedom, DOFs)。关节被建模为单铰链(1 DOF)或多个铰链的组合(2或3 DOFs)。
2. 物理引擎集成与身体-环境交互建模 * 模型导入与物理属性设定:将Blender几何模型导入开源的MuJoCo物理引擎。为每个身体部件生成了简化的几何基元(“geom”)以进行高效的碰撞检测和物理模拟。通过称重实验测量了各身体部分(头、胸、腹、翅膀、腿)的质量,MuJoCo据此计算了假设均匀密度下的转动惯量。 * 驱动器与传感器添加:为所有关节添加了驱动器(翅膀使用扭矩驱动器,其余关节使用位置驱动器)。在附节和腹部等多节段结构,通过MuJoCo的肌腱(tendon)耦合多个自由度以实现协调弯曲。引入了新颖的“粘附驱动器”来模拟果蝇足部使其能在墙壁和天花板上行走的粘附特性。此外,模型还集成了视觉、前庭、本体感觉和机械感觉等传感器。 * 新型流体动力学模型开发:为实现逼真的飞行模拟,研究团队开发了一种计算高效的现象学、准稳态流体模型,作为MuJoCo的一个新功能。该模型将翅膀近似为细长椭球体,估算其在不可压缩静止流体中运动时产生的力和扭矩,综合了附加质量、粘性阻力、粘性抗力、马格努斯升力和库塔升力五种流体动力学现象。通过调整模型系数,实现了模型的稳定悬停。
3. 基于模仿学习的运动控制器训练 * 强化学习框架:使用深度强化学习(Reinforcement Learning, RL)训练神经网络作为感觉运动控制器。采用分布式RL设置,利用Ray框架并行运行多个CPU执行器(生成经验)和一个GPU学习器(更新网络权重)。使用分布最大后验策略优化(Distributional Maximum a Posteriori Policy Optimization, DMPO)算法进行训练。 * 飞行控制器训练: * 数据来源:使用高速摄像记录的果蝇(Drosophila hydei)自由飞行轨迹数据集,包含216条训练轨迹(约43秒),涵盖转弯、加减速、侧飞、倒飞和悬停等动作。 * 控制器设计:控制器由可训练的多层感知机(MLP)和一个翅膀拍打模式生成器(Wing-beat Pattern Generator, WPG)组成。WPG提供一个源自果蝇悬停数据的基准、镜像对称的翅膀拍打模式。MLP接收本体感觉、前庭感觉信号以及高层转向指令(目标质心位置和姿态变化),输出控制信号,用于微调WPG的基准模式、控制翅膀拍打频率以及调整头部和腹部角度。 * 训练目标:奖励函数激励模型匹配真实果蝇的质心轨迹和身体方向,但并未直接用真实的翅膀运动数据进行监督,从而让策略网络自主发现实现目标运动所需的物理可行的翅膀运动模式。 * 行走控制器训练: * 数据来源:使用俯视高速视频记录的果蝇自由行走数据集,包含约13,000个行走片段(约64分钟),速度范围0-4 cm/s。 * 控制器设计:训练一个MLP控制器,接收更丰富的本体感觉输入和高层转向指令,输出59维控制信号驱动腿部(包括粘附)、腹部和头部的关节。 * 训练目标:奖励模型匹配真实的腿部运动、质心轨迹和身体方向。粘附力的使用并未在奖励函数中明确指定,而是由模型在训练中自然学会在腿部支撑期激活。 * 分层视觉引导飞行控制器训练: * 任务设计:设计了两个需要视觉输入的任务:“起伏地形”任务(保持恒定高度飞越正弦波地形)和“沟壑”任务(在正弦弯曲的狭窄沟壑中飞行并避免碰撞)。 * 控制器设计:采用分层控制架构。底层复用先前训练好的、固定的低层飞行控制器。高层“导航器”策略由一个卷积神经网络(CNN)处理来自复眼相机(32x32像素,150°视野)的视觉输入,并结合本体感觉、前庭感觉以及任务目标(目标高度和速度),生成低维转向指令传递给底层控制器。 * 训练:仅训练高层CNN和导航器MLP,底层控制器权重冻结。任务通过端到端RL训练完成。
三、主要研究结果
1. 物理模型与仿真平台的建立 成功创建了一个包含67个刚体组件、102个自由度、集成于MuJoCo引擎的雌性果蝇全身物理模型。该模型具备高保真的几何结构、质量属性、关节限制、粘附机制和现象学流体动力学模型。仿真速度足以支持强化学习训练(例如,在单CPU核上模拟10毫秒飞行耗时约421.5毫秒)。
2. 飞行模仿学习结果 训练得到的飞行控制器在56条测试轨迹上表现优异:质心位置跟踪的中位误差为0.25毫米,身体方向跟踪的中位误差小于5度。模型能够复现实蝇飞行中的关键特征:通过微小的左右翅膀拍打不对称性(与真实果蝇类似)产生大幅度的加速度和转向;在急转弯(Saccades)过程中,身体角速度、航向和速度的变化模式与真实果蝇数据高度一致。分析表明,在生成的流体力中,粘性阻力和库塔升力是主导力量。模型飞行性能对流体参数变化具有鲁棒性(20%的参数变化下仍能保持稳定)。
3. 行走模仿学习结果 行走控制器在3200条测试轨迹上实现了精确跟踪:质心位置中位误差0.4厘米,方向中位误差4度。模型自发涌现出自然的步态特性:在不同速度下,同时处于支撑相的腿数量与真实果蝇数据相符(例如,4 cm/s时平均3.1条腿,1 cm/s时平均3.9条腿);腿部摆动起始的相位延迟与真实数据吻合良好;在转弯时,模型学会了通过调整内侧和外侧腿部步幅长度来实现转向,这与果蝇行为一致。此外,模型成功学会了在具有挑战性的起伏地形上动态调节腿部粘附力以保持运动能力,证明了粘附机制的有效性。
4. 分层视觉引导飞行结果 模型成功完成了两个视觉导航任务。在“起伏地形”任务中,经过初始加速阶段后,飞行高度中位误差为0.045厘米,速度中位误差为2.2厘米/秒。在更复杂的“沟壑”任务中,高度中位误差为0.032厘米,速度中位误差为0.16厘米/秒。这表明,模型能够有效利用低分辨率视觉输入,结合已习得的低层飞行技能,完成需要持续环境感知和避障的高级导航任务。
四、研究结论与意义
本研究成功构建了一个首个统一模拟果蝇飞行和行走的、解剖学细节丰富的全身物理仿真框架,并利用深度模仿学习训练出了能够生成自然主义运动、响应高层指令的神经网络控制器。这项工作表明,将高精度生物力学建模、先进的物理交互模拟与数据驱动的控制算法相结合,可以在仿真中重现复杂的动物行为。
其科学价值在于:1) 提供了一个开源的“数字果蝇”平台,作为研究具身感觉运动控制、脑-身体-环境交互的强大工具;2) 展示了如何整合跨尺度的数据(从静态显微解剖到动态运动轨迹)来构建和验证计算模型;3) 为未来将连接组数据、肌肉驱动模型和更逼真的传感器模型整合到该平台中奠定了基础,从而可能实现从单神经元活动到全身行为的跨尺度机制研究。
应用价值体现在:1) 该框架可作为机器人仿生设计和控制算法开发的测试平台;2) 其开发的新型MuJoCo功能(如现象学流体模型、粘附驱动器)具有通用性,可用于其他生物或机器人的仿真。
五、研究亮点与创新
六、其他有价值内容
研究还通过逆向运动学展示了模型支持梳理等非运动行为的能力,验证了其关节活动范围的合理性。文中详细讨论了模型的局限性和未来改进方向,例如:当前使用的位置/扭矩驱动器是对生物肌肉的简化;未来可集成更详细的肌肉驱动模型和基于连接组的神经回路模型;视觉传感器可以进一步细化以匹配果蝇复眼的真实光学特性。这些讨论为后续研究指明了清晰的技术路线。