ICLR 2026 Oral hippocampus spatial coding locomotor development RNN place cells head direction cells cognitive maps

From Movement to Cognitive Maps: RNNs Reveal How Locomotor Development Shapes Hippocampal Spatial Coding¶

会议: ICLR 2026 Oral
OpenReview: https://openreview.net/forum?id=8bM7MkxJee
代码: 有
领域: 计算神经科学
关键词: hippocampus, spatial coding, locomotor development, RNN, place cells, head direction cells, cognitive maps

一句话总结¶

结合幼鼠运动发育的聚类分析和浅层 RNN 预测学习模型，首次计算性地证明运动统计特征的发育变化（爬行→行走→奔跑→成年）驱动了海马空间调谐神经元（位置细胞、方向细胞、联合编码细胞）的序贯涌现，定量复现大鼠海马记录数据的发育时间线，并预测了联合位置-方向编码细胞在发育中逐渐增多这一现象且在实验数据中得到验证。

研究背景与动机¶

领域现状：海马体中存在位置细胞（place cells）、头方向细胞（HD cells）、边界细胞（border cells）、网格细胞（grid cells）等空间编码神经元。它们在个体发育中按特定时间线依次涌现（HD 细胞最早 ~P12，位置细胞 ~P16，网格细胞 ~P20），但驱动其涌现的计算机制未知。

现有痛点：已有模型（如 Cueva & Wei 2018、TEM）能在训练过程中产生空间表征，但它们使用恒定运动模式、直接提供空间坐标作为监督信号，从未考虑真实运动发育统计的影响。两种竞争假说——"内在电路成熟" vs "经验依赖发育"——尚无计算模型直接检验。

核心矛盾：运动经验被假设对空间认知至关重要，但没有计算模型能解释为什么发育不同阶段的运动特征（速度、加速度、转弯频率等）会导致不同类型的空间神经元在特定时间点涌现。

本文目标 建立运动发育统计与海马空间编码涌现之间的因果计算链路。

切入角度：用数据驱动方法提取真实幼鼠运动的发育阶段统计，驱动预测学习 RNN，检测其是否自发涌现出与生物数据匹配的空间编码发育时间线。

核心 idea：具身感知运动经验（embodied sensorimotor experience）的发育统计变化足以驱动海马空间编码的个体发育。

方法详解¶

整体框架¶

论文想回答一个具体问题：是否仅凭运动发育阶段的统计变化，就能驱动海马空间编码神经元按生物学时间线依次涌现。为此它搭了一条从行为数据到神经表征的计算链路——先从真实幼鼠的开放场行为里把运动统计（速度、加速度、转弯频率等）按发育阶段聚类出来，再用每个阶段的统计去驱动模拟环境中的智能体生成轨迹，让一个浅层 RNN 在这些轨迹上做"预测下一帧视觉"的自监督任务。RNN 按爬行→行走→奔跑→成体的顺序逐阶段训练，最后分析它隐藏状态的空间调谐特性，和真实大鼠海马记录的发育时间线逐项对照。

%%{init: {'flowchart': {'rankSpacing': 24, 'nodeSpacing': 28, 'padding': 6, 'wrappingWidth': 400}}}%%
flowchart TD
    A["真实幼鼠<br/>开放场行为数据"] --> B["运动发育阶段提取<br/>K-means 聚类速度/加速度/角速度<br/>→爬行·行走·奔跑·成体"]
    B --> C["按阶段统计驱动智能体<br/>生成轨迹(全景视觉+前庭信号)"]
    C --> D["预测学习 RNN<br/>自我中心视觉预测下一帧"]
    D --> E["渐进发育暴露训练<br/>爬行→行走→奔跑→成体 逐阶段"]
    E -->|每阶段收敛后切换| C
    E --> F["空间调谐量化<br/>SI / RVL 判定位置细胞·HD 细胞"]
    F --> G["对照真实大鼠海马记录<br/>发育时间线"]

关键设计¶

1. 运动发育阶段提取：让数据自己划出发育的转折点

已有模型普遍用一套恒定的运动模式生成轨迹，根本没法反映幼鼠在不同年龄运动方式的质变，自然也就无从检验"运动发育是否驱动空间编码"。本文改从已发表的幼鼠开放场实验数据里提取速度、加速度、角速度等运动统计，再用 K-means 聚类把 P12–P60 的运动数据自动切成三个阶段——爬行（crawl, ~P12-P15）、行走（walk, ~P16-P19）、奔跑（run, ~P20+），外加成体阶段。关键在于发育阶段不是人为划的，而是聚类从运动模式里读出的自然转折点，这样喂给 RNN 的运动统计才真实对应生物学上的发育节点。

2. 预测学习 RNN：用自我中心视觉，不给特权坐标

以往模型（如路径积分类）往往直接把 \(x\)-\(y\) 坐标作为监督信号喂进去，等于提前把"空间"这个答案泄露给了网络。本文换成预测学习框架：浅层 RNN 接收当前时刻的全景视觉 \(\mathbf{v}_t \in \mathbb{R}^{80}\) 和前庭信号（角速度 \(\omega_t\)），用隐藏状态去预测下一时刻的视觉输入 \(\hat{\mathbf{v}}_{t+1}\)，

\[\mathbf{h}_t = f(\mathbf{W}_{vh}\mathbf{v}_t + \mathbf{W}_{hh}\mathbf{h}_{t-1} + \mathbf{W}_{\omega h}\omega_t + \mathbf{b}), \qquad \mathcal{L} = \|\hat{\mathbf{v}}_{t+1} - \mathbf{v}_{t+1}\|^2\]

这个选择有两层考虑：一是预测学习框架本身有大量文献支持（Eichenbaum et al. 2004; Levy 1989），海马常被建模成"比较传入感觉与记忆预测"的系统；二是只用自我中心视觉而非绝对位置坐标，空间表征就只能是网络为完成预测任务自发学出来的，而不是被直接灌进去的，这才让"运动统计驱动涌现"的结论站得住。

3. 渐进发育暴露训练：把动物的成长顺序搬进训练课程

要检验发育顺序本身是否重要，就不能一次性把所有运动模式混着训。本文让同一个 RNN 依次经历各阶段的轨迹——先在爬行模式的轨迹上训到收敛，再切到行走、奔跑、成体。每个阶段的轨迹都由带有该阶段运动统计（速度分布、转弯频率等）的模拟智能体在 \(0.625 \times 0.625\) m 的环境里运动生成；成体阶段还额外引入网格细胞输入 \(g(\mathbf{x}) = \sum_k \cos(\mathbf{k}_i \cdot \mathbf{x})\)，scale 参数 \(\lambda \in \{0.2, 0.4, 0.6\}\) m。这套渐进暴露其实就是在模拟真实动物的成长过程：幼鼠在不同年龄表现出质性不同的运动模式，每种模式给网络的是统计特征不同的感觉经验，发育顺序也因此被编码进了训练课程里。

4. 空间调谐量化：用标准指标把"像不像空间细胞"算成数

光看隐藏状态还不够，得有客观尺子才能和海马记录对齐。本文用标准空间信息指标量化位置编码，

\[SI = \sum_i p_i \frac{r_i}{\bar{r}} \log_2 \frac{r_i}{\bar{r}}\]

其中 \(p_i\) 是落在第 \(i\) 个空间 bin 的占用概率，\(r_i\)、\(\bar{r}\) 分别是该 bin 的发放率与平均发放率；再用 Rayleigh 向量长度（RVL）量化方向选择性，最后用阈值法把符合标准的单元判定为位置细胞或 HD 细胞。为排除混淆因素，配套了一组对照实验：反转发育顺序、控制帧间时间间距、控制累积训练量——分别用来证明发育顺序、时间分辨率和训练量各自的作用边界。

实验关键数据¶

主实验：发育时间线匹配¶

发育阶段	对应年龄	位置细胞	HD 细胞	联合编码	生物数据匹配
爬行 (crawl)	~P12-15	少/无	微弱	无	✓
行走 (walk)	~P16-19	涌现	成人样	涌现	✓
奔跑 (run)	~P20+	增多	稳定	增多	✓
成体 (adult)	>P30	成熟	成熟	成熟	✓

消融实验¶

配置	关键指标	说明
正常发育顺序	SI 和 RVL 逐阶段递增	基线：匹配生物数据
反转发育顺序	空间编码涌现模式异常	证明发育顺序重要性
仅加速感觉变化	位置中心表征不涌现	仅改变帧率不等价于运动发育
控制累积训练量	不影响涌现时间线	排除训练量混淆
控制帧间距	不改变核心结论	排除时间分辨率混淆

关键发现¶

模型预测方向选择性主要通过联合位置-方向编码（conjunctive place-HD coding）涌现，而非先产生纯 HD 细胞——在海马记录数据中得到验证
跨试次空间编码相关性 >0.8，证明学到的表征稳定可靠
纯 HD 细胞在行走阶段 (~P16) 出现成人样调谐，匹配 MEC 中 HD 细胞 ~P15 的实验数据

亮点与洞察¶

首个运动发育→空间编码的计算桥梁：此前只有描述性观察，本文首次提供了机制性解释
具身认知的计算证据：运动不仅是输出，还是塑造认知表征的关键输入——对 embodied AI 有直接启示
预测→验证闭环：模型产生新预测（联合编码细胞的发育规律），并在实验数据中确认，这是计算神经科学的黄金标准
发育式课程学习的灵感：类似 curriculum learning，"先简单后复杂"的发育暴露顺序对表征学习至关重要

局限与展望¶

模型为单层 RNN，无法自发产生网格细胞（需要更复杂的 attractor dynamics）
环境为简单的 2D 方形区域，未测试复杂多房间环境
训练在 5.9s 级别短片段上进行，未测试长时间跨度的空间记忆
线性解码方式可能低估表征复杂性
未直接操控真实动物的运动发育来做因果验证

评分¶

新颖性: ⭐⭐⭐⭐⭐ 首次建立运动发育→空间编码涌现的计算机制，问题新颖且重要
实验充分度: ⭐⭐⭐⭐ 计算模型+5项控制实验+真实海马记录验证，唯一遗憾是缺少实际动物干预实验
写作质量: ⭐⭐⭐⭐⭐ 跨学科写作清晰，reviewer 最高评分10分（"should be highlighted as oral"）
价值: ⭐⭐⭐⭐⭐ 对计算神经科学和 embodied AI 有深远启示，建立了新研究方向