BaRISTA: Brain-Scale Informed Spatiotemporal Representation of Human Intracranial EEG¶

会议: NeurIPS 2025
arXiv: 2512.12135
代码: https://github.com/ShanechiLab/BaRISTA
领域: 神经科学 / 基础模型
关键词: 颅内脑电, 时空Transformer, 空间编码尺度, 掩码重建, 预训练

一句话总结¶

BaRISTA 系统探索 iEEG Transformer 的空间编码尺度（电极/脑区/脑叶），发现脑区级编码 + 空间掩码重建在语言任务解码上达 86.2% AUC（vs PopT 79.5%），编码尺度选择的影响 > 掩码策略选择，且跨被试泛化性好。

研究背景与动机¶

领域现状：iEEG 提供高时空分辨率脑活动，Transformer 预训练模型（PopT, Brant）已用于 iEEG 但空间编码选择未被系统研究。

现有痛点：不同患者电极位置完全不同，channel 级编码无法跨患者泛化。脑区级和脑叶级编码是否更好？空间编码和掩码策略如何交互？

核心矛盾：精细空间分辨率（channel）提供最多信息但跨患者不一致；粗空间分辨率（脑叶）跨患者一致但可能丢失局部信息。

本文目标 系统对比三种空间编码尺度，找到最优的空间编码-掩码组合。

切入角度：将 channel/atlas parcel/lobe 三种空间粒度作为实验变量，在掩码重建预训练框架下系统消融。

核心 idea：在 iEEG Transformer 中系统对比三种空间编码尺度，发现脑区级（atlas parcel）是最优的空间粒度——兼顾跨患者一致性和局部信息保留。

方法详解¶

整体框架¶

iEEG 数据（2048Hz）→ 时间分词（Dilated CNN 提取 250ms patch）→ 空间编码（channel/atlas/lobe 三种粒度的可学习嵌入 \(E_j\)）→ token \(S_{ij} = B_{ij} + E_j\) → 空间掩码（随机选掩码空间类别）→ Transformer（12 层/4 头/d=64 + RoPE）→ EMA 目标重建（online 编码器 vs EMA target 编码器的 MSE）

关键设计¶

三种空间编码尺度:
- Channel: (x,y,z) MNI 坐标 → 可学习嵌入（最精细但跨患者不一致）
- Atlas parcels: Destrieux atlas 脑区划分（中等粒度，跨患者一致）
- Lobes: 脑叶 + 皮层下区域（最粗但最稳定）
空间掩码重建预训练:
- 随机选择空间类别进行掩码（如掩盖某个脑区所有电极的 patch）
- Online tokenizer \(\mathcal{F}\) 和 EMA target tokenizer \(\tilde{\mathcal{F}}\)（动量 0→0.996 warmup）
- \(\mathcal{L} = \frac{1}{|B_{target}|}\sum \|\tilde{B}_{ij} - \hat{B}_{ij}\|_2^2\)
交错时空序列: 空间和时间 token 交错排列，使 attention 同时处理时空依赖

损失函数 / 训练策略¶

Brain Treebank 数据集：10 位癫痫患者，26 sessions，2048 Hz
预训练 + 线性探测评估

实验关键数据¶

主实验（下游分类 AUC %）¶

编码尺度/掩码	句子起始	语音/非语音
Channel	77.8%	76.4%
Parcel	86.2%	86.9%
Lobe	84.2%	84.1%
PopT baseline	79.5%	77.5%
Brant baseline	76.7%	69.1%

消融（ANOVA）¶

因素	p 值	效应量
编码尺度	p<1e-3	大
掩码策略	p=0.01-0.04	中
交互效应	Channel 编码 + Channel 掩码最佳匹配	—

关键发现¶

Parcel 编码显著优于 Channel（+8.4% 句子起始，+10.5% 语音）——解剖先验比精确坐标更重要
编码尺度的影响 > 掩码策略——选对编码比选对掩码更关键
跨被试泛化：hold-out 被试仍达 84.1%（vs 86.9% with target），说明脑区编码确实帮助跨患者泛化
数据规模正相关：5%→75% 预训练数据，性能持续提升

亮点与洞察¶

空间编码尺度是被忽视的关键设计选择：之前的工作默认用 channel 级，BaRISTA 证明脑区级更优
"太精细不如适中"：channel 编码虽然信息最多但跨患者不一致导致泛化差，atlas parcel 平衡了精度和泛化

局限与展望¶

仅基于解剖学划分，未探索功能性脑区编码
仅做空间掩码，未测试时空联合掩码
单一采样率（2048 Hz）
Dilated CNN 时间编码可能不是最优

评分¶

新颖性: ⭐⭐⭐⭐ 系统消融空间编码尺度是首次
实验充分度: ⭐⭐⭐⭐⭐ 三尺度×多掩码×ANOVA+跨被试+数据规模
写作质量: ⭐⭐⭐⭐ 实验设计严谨
价值: ⭐⭐⭐⭐ 为 iEEG 基础模型设计提供了关键指导
脑电信号的空间层级结构需要多尺度建模——粗粒度+细粒度互补
更大空间尺度（lobe级）改善解码性能，预训练显著提升少样本场景
该方法的核心创新在于设计思路的简洁性和有效性
实验结果充分验证了核心假设