ICLR 2026 计算生物 Drosophila 肌骨模型 Hill-type 肌肉 OpenSim MuJoCo 模仿学习肌肉协同

Musculoskeletal simulation of limb movement biomechanics in Drosophila melanogaster¶

会议: ICLR 2026
OpenReview: https://openreview.net/forum?id=6lEjX1getx
代码: 待确认
领域: 计算生物学 / 神经科学 / 运动控制
关键词: Drosophila, 肌骨模型, Hill-type 肌肉, OpenSim, MuJoCo, 模仿学习, 肌肉协同

一句话总结¶

首次为果蝇腿构建解剖学+生理学精确的 3D 肌骨模型（OpenSim + MuJoCo 双引擎），用 Hill-type 肌肉桥接运动神经元活动与关节运动，从真实行为数据反推肌肉协同，并证明被动关节属性（刚度/阻尼）能加速肌肉驱动控制的学习。

研究背景与动机¶

领域现状：果蝇 Drosophila melanogaster 的中枢神经系统、肌肉组织和外骨骼都已有接近完整的重建（connectome、micro-CT 等），是研究"神经-生物力学-行为"如何协同产生运动的理想模式生物——神经系统紧凑、可遗传操作、腿部自由度丰富。

现有痛点：尽管解剖数据齐备，果蝇腿肌肉仍缺乏解剖学和物理学上扎实的模型。已有的全身仿真（NeuroMechFly、Vaxenburg 等）依赖抽象的"位置/力矩控制器"驱动关节，把肌肉组织和被动生物力学整个抽象掉了，既无法刻画肌肉冗余与内在柔顺性，也无法回答"神经网络如何协调肌肉产生鲁棒行为"。

核心矛盾：运动神经元活动与关节运动之间缺了一座"桥"——只靠连接组或神经记录，无法预测某个行为下的肌肉活动模式，因为果蝇腿肌（约 19 块肌肉、69 个运动神经元、含跨关节的双关节肌）解剖与功能都太复杂。

本文目标：建立首个生物学细节充分的果蝇腿肌骨模型，把解剖、生理、行为数据统一进一个框架，能从真实运动学反推肌肉协同，并作为具身智能体的物理约束接口。

核心 idea：用 Hill-type 肌肉模型替换抽象关节控制器——从高分辨 X-ray 扫描提取肌肉附着点和纤维走向构建肌腱单元，用多目标优化校准未知参数，再结合 3D 姿态估计实现"肌肉驱动的行为回放"，最后在 MuJoCo 里训模仿学习策略探究被动属性对控制的影响。

方法详解¶

整体框架¶

管线分三段：左侧从多只果蝇的解剖数据（X-ray/µCT 扫描）确定肌肉附着点与纤维路径，在 OpenSim 中构建 15 个肌腱单元（MTU）的 Hill-type 肌肉模型并优化参数；右侧从自由行为果蝇的 3D 姿态估计获取真实关节运动学；中间二者结合，先在 OpenSim 用静态优化-前向动力学反推肌肉活动，再用 MyoConverter 转到 MuJoCo 训练模仿学习策略。

flowchart LR
    A[多只果蝇<br/>X-ray/µCT 扫描] --> B[肌肉附着点+纤维路径]
    B --> C[OpenSim 构建<br/>15 个 Hill-type MTU]
    C --> D[NSGA-II 多目标<br/>优化肌肉参数]
    E[行为果蝇<br/>5 相机 3D 姿态] --> F[逆运动学<br/>7-DoF 关节角]
    D --> G[静态优化+前向动力学<br/>反推肌肉协同]
    F --> G
    D --> H[MyoConverter→MuJoCo]
    F --> H
    H --> I[PPO 模仿学习<br/>探究被动关节属性]

关键设计¶

1. 从解剖影像构建 Hill-type 肌肉模型：让仿真长出"真肌肉"。 作者用两个公开数据集加一个自采的同步辐射 µCT 数据集，针对 thorax–coxa、coxa–trochanter、femur–tibia 三个关节标注肌纤维，跨数据集交叉验证附着点。每条前腿建模 15 个 MTU（thorax 7、coxa 6、femur 2），覆盖 19 个肌群中的 12 个；每个肌群用 1–2 个 Hill-type MTU 表示，含收缩元件（CE）、并联弹性元件（PE）和串联弹性元件（SE，假设刚性肌腱）。总肌腱长度 $l_{mt}=l_m\cos(\alpha)+l_t$，其中 $l_m$ 为纤维长、$\alpha$ 为羽状角、$l_t$ 为肌腱长。最大等长力由生理横截面积（PCSA）估计，按 $28\,\text{mN/mm}^2$ 的比张力缩放（介于果蝇跳跃肌 $37$ 和间接飞行肌 $9$ 之间）。

2. 多目标优化校准未知参数：用两种行为防过拟合。 由于实验数据有限，初始解剖参数未必符合生物现实，作者用 OpenSim 做闭环优化：对优化器提出的每组候选参数，先用静态优化（SO）从参考关节角反推肌肉激活，再用前向动力学（FD）模拟关节轨迹，用 NSGA-II 找出使运动学最贴近实验数据的参数集。关键技巧是同时拟合触角梳理和行走两种行为、只保留两者都表现好的解来避免过拟合；每个关节（1 或 3 DoF）独立优化，一个 3-DoF 关节约 8 小时。优化后用肌肉力臂验证生物合理性——模型正确复现了屈肌/伸肌力臂符号相反，且预测的关节主导肌与已知功能一致。

3. 模仿学习 + 物理约束动作空间：让策略只学控制、不学物理。 把优化好的 OpenSim 模型经 MyoConverter 转成 MuJoCo 格式，用 dm_control 搭建跟踪任务，PPO 训练 MLP 策略（2 层 512 单元 + 256，ReLU），训 $15\times10^6$ 步、控制频率 500 Hz、物理引擎 10 kHz。86 维观测含 4 个腿部 landmark 的 3D 坐标（12-D）、7 DoF 关节角与角速度（14-D）、15 块肌肉的激活/力/长度/速度（60-D），输出 15 维 $[0,1]$ 肌肉兴奋（即运动神经元活动）。奖励同时在笛卡尔、关节角、关节速度空间鼓励精确跟踪： $$r_t=\frac{1}{3}\left[\exp(-w_p d^{xpos}_t)+\exp(-w_p d^{qpos}_t)+\exp(-w_v d^{qvel}_t)\right]$$ 其中 $w_p=5,\ w_v=3$，奖励裁剪到 $[0,1]$。关键洞察是：肌骨模型把策略动作限制在"只能产生物理上合理的运动"的空间里，消除了灾难性动作，策略无需先学一个物理世界模型再学控制，只需学控制本身，从而高效且利于缩小 sim-to-real gap。

4. 用 NMF 从仿真肌肉活动反推协同基元。 对 SO 估出的肌肉活动做非负矩阵分解（NMF），发现仅 3 个肌肉基元就解释了超 90% 的方差，第一个基元单独占 80% 以上，各基元有明显非重叠的时间动态，由此能预测可供实验验证的行为相关肌肉协同分组。

实验关键数据¶

主实验：肌肉协同与参数优化¶

项目	结果
建模 MTU	15 个/前腿（thorax 7 + coxa 6 + femur 2），覆盖 12/19 肌群
优化算法	NSGA-II，200 个体 × 40 代，3-DoF 关节约 8h，全腿约 20h
优化目标	行走 + 触角梳理两种行为联合，RMSE（按关节运动范围归一）+ Pearson $R^2$
肌肉协同	NMF 仅 3 个基元解释 >90% 方差，第 1 基元 >80%
协同结构	Sar/Sa 任务不变；coxal 屈肌→协同2、伸肌→协同3（仅梳理时特化）

消融：被动关节属性对模仿学习的影响¶

四种 MuJoCo 配置（armature 始终保留），PPO 训 1500 万步，比较早期（2.5–3M 步）与后期（14.5–15M 步）平均奖励：

配置	学习速度/最终性能
仅 armature（惯性）	最慢、最低
armature + damping	中等
armature + stiffness	中等
armature + damping + stiffness	最快、最高（早期优势持续到训练末期）

统计检验用双侧 Mann-Whitney U + Holm-Bonferroni 校正。

关键发现¶

肌肉协调高度依赖行为：果蝇可能用同一套肌肉、通过激活不同的任务特定协同来灵活复用——梳理时 trochanter 屈/伸肌节律性重叠激活，行走时却反相。
刚度+阻尼组合学习最快：被动力学稳定运动、减少持续纠错，让策略专注于产生协调的肌肉模式而非纠正不稳定；尽管最终运动学各配置肉眼难分，但学习效率显著不同。

亮点与洞察¶

首个解剖+生理双精确的果蝇腿肌骨模型，双引擎（OpenSim 做生物力学分析、MuJoCo 做学习）互补，填补了"运动神经元活动↔关节运动"之间的桥梁。
从解剖影像到功能仿真的端到端自动化管线：提取解剖特征→估计生理参数→多目标优化未知参数，可迁移到其他物种。
物理约束动作空间的训练哲学很有启发：肌骨模型天然剔除非物理动作，策略不必隐式学物理，直击 sim-to-real 痛点。
3 个基元解释 >90% 方差呼应运动控制中"肌肉协同降维"的经典假说，且给出可实验验证的预测。

局限与展望¶

未建模 tibia 肌肉（X-ray 仅部分捕获 tibia）和 trochanter 肌肉（功能未明），覆盖 12/19 肌群，并非全肌群。
训练昂贵：7-DoF 全腿模仿学习约 96 小时，全腿参数优化约 20 小时（顺序执行）。
仿真悬空免接触：为速度和稳定性省略了身体-环境接触，未涉及真实落地动力学。
仅前腿、两种行为：协同结论基于行走和触角梳理，泛化到其他腿/行为待验证。
未真正闭环神经：尚未接入 connectome 神经回路，仍是从运动学反推肌肉而非从神经驱动肌肉。
展望：接入 DEP-RL 等状态相关探索提升高维肌肉动作空间的样本效率；用于驱动具身智能体生成自然柔顺的运动，乃至控制仿生机器人。

评分¶

新颖性: ⭐⭐⭐⭐⭐ 首个解剖+生理精确的果蝇腿肌骨模型，双引擎、端到端管线，填补该领域空白。
实验充分度: ⭐⭐⭐⭐ 含参数优化、力臂验证、NMF 协同分析、被动属性消融（多 seed + 统计检验），但局限于前腿与两种行为。
写作质量: ⭐⭐⭐⭐ 管线图清晰、动机层层递进、方法与生物学背景交代充分。
价值: ⭐⭐⭐⭐⭐ 横跨神经科学、机器人、机器学习的物理接地运动控制基座，可迁移到其他物种与具身智能体。