HeLa-Mem: Hebbian Learning and Associative Memory for LLM Agents¶

会议: ACL 2026
arXiv: 2604.16839
代码: GitHub
领域: LLM Agent / 记忆系统
关键词: Hebbian学习, 联想记忆, 长期对话, 情景-语义双路径, 扩散激活

一句话总结¶

HeLa-Mem 提出了一种受神经科学启发的 LLM 代理记忆架构，将对话历史建模为带 Hebbian 学习动力学的动态图——通过共激活强化记忆间连接、反思性蒸馏将枢纽记忆凝练为语义知识、双路径检索结合语义相似度和 Hebbian 扩散激活，在 LoCoMo 上以显著更少的 token 达到最优性能。

研究背景与动机¶

领域现状：LLM 代理的长期记忆是关键挑战——固定上下文窗口无法跨扩展交互保持连贯性。现有记忆系统将对话历史表示为非结构化嵌入向量，通过语义相似度检索信息。

现有痛点：(1) 嵌入式检索无法捕捉人类记忆中的联想结构——相关经历通过重复共激活逐渐增强连接；(2) 现有方法各自优化单一维度（结构/检索/更新），忽略它们的相互作用；(3) 更根本的是，记忆的动态演化被忽视——当前系统将存储和检索视为独立的静态过程，无法捕捉记忆间不断重组的连接性。

核心矛盾：语义相似度仅捕捉表面关联，但人类记忆中的关联更深——一个今天讨论的话题可能触发一个月前的记忆，不是因为表面关键词相似，而是因为它们属于同一个演化叙事。

本文目标：构建一个模拟生物记忆中联想、巩固和扩散激活三个机制的 LLM 代理记忆架构。

切入角度：借鉴 Hebbian 学习原理（"一起激活的神经元连在一起"）和情景-语义记忆的双系统理论。

核心 idea：用 Hebbian 学习动力学驱动的动态图表示情景记忆 + 反思性蒸馏产生语义记忆 + 双路径扩散激活检索。

方法详解¶

整体框架¶

三模块认知循环：(1) 在线编码与联想——对话轮次编码为图节点，共激活时 Hebbian 强化边权重；(2) 反思性巩固——反思代理检测枢纽节点并进行 Hebbian 蒸馏，将密集连接的记忆簇凝练为语义知识；(3) 双路径检索——查询时同时通过语义相似度（基路径）和 Hebbian 扩散激活（翻转路径）检索。

关键设计¶

Hebbian 在线联想:
- 功能：捕捉语义嵌入无法发现的潜在记忆关联
- 核心思路：边权重更新公式 \(w_{ij}^{(t+1)} = (1-\lambda) \cdot w_{ij}^{(t)} + \eta \cdot \mathbb{I}(v_i, v_j \in \mathcal{K}_t)\)，其中 \(\lambda\) 控制突触衰减，\(\eta\) 控制学习率，\(\mathbb{I}\) 指示两个节点是否在当前检索集中被共激活。重复共现的记忆逐渐增强连接，未使用的连接随时间衰减。
- 设计动机：超越语义相似度——两条记忆可能在表面上不相似，但因反复被同时检索而建立强关联（类似人脑中的联想）
Hebbian 蒸馏（反思性巩固）:
- 功能：防止记忆图无限膨胀，同时保留关键信息
- 核心思路：当节点 \(v_i\) 的累积边权重 \(D(v_i) = \sum_{j \in \mathcal{N}(i)} w_{ij} > \delta_{hub}\) 超过阈值时，反思代理检索枢纽节点及其强连接邻居，用 LLM 合成该簇为结构化语义知识（用户画像、事实记忆、代理知识），存入语义记忆存储。同时对低权重+长期未访问的节点进行自适应遗忘。
- 设计动机：模拟大脑的睡眠巩固过程——频繁激活的记忆簇被抽象为稳定的长期知识
双路径扩散激活检索:
- 功能：检索语义相关和关联相关的记忆
- 核心思路：基激活 \(S_{base}(v_i) = (\text{sim}(\mathbf{q}, \mathbf{e}_i) + \alpha \cdot \text{keyword}) \cdot \gamma(v_i)\)（语义+时间衰减）。扩散激活 \(S(v_j) = S_{base}(v_j) + \beta \sum_{i \in \mathcal{N}(j)} S_{base}(v_i) \cdot w_{ij}\)。最终检索集 = Top-k（基路径）∪ Top-m（翻转路径：扩散后高分但基路径未入选的节点）。
- 设计动机：翻转路径捕捉"语义上远但关联上近"的记忆——对多跳推理特别有益

损失函数 / 训练策略¶

无训练。所有参数（\(\eta, \lambda, \beta, \tau\) 等）为超参数。Hebbian 学习在检索过程中在线发生。

实验关键数据¶

主实验（LoCoMo 基准）¶

方法	多跳F1	时序F1	开放域F1	单跳F1	Token数↓
MemGPT	-	-	-	-	高
A-Mem	-	-	-	-	中
HeLa-Mem	最优	最优	最优	最优	最少

消融实验¶

配置	说明
无 Hebbian 学习	退化为纯语义检索，多跳下降显著
无反思性蒸馏	图不断膨胀，检索噪声增加
无扩散激活	仅基路径，无法发现关联记忆

关键发现¶

HeLa-Mem 在所有四个问题类别上达到最优，同时使用显著更少的 token（位于性能-效率图的"左上角理想区域"）
扩散激活对多跳推理贡献最大——这正是 Hebbian 学习捕捉的潜在关联的价值所在
平均排名 1.25（所有类别中近乎全部第一），跨四种 LLM 骨干一致表现优异

亮点与洞察¶

生物记忆三机制的统一建模（联想+巩固+扩散激活）提供了一个优雅的认知科学视角
Hebbian 蒸馏的"枢纽检测→簇合成→语义知识"管线模拟了人脑的记忆巩固
Token 效率优势说明更精准的检索（而非更多的检索）才是关键

局限与展望¶

超参数（\(\eta, \lambda, \delta_{hub}\) 等）需要手动调节，对不同场景可能敏感
仅在 LoCoMo 单一基准上评估，更多长期对话场景需验证
图操作的计算开销随对话长度增长

评分¶

新颖性: ⭐⭐⭐⭐⭐ Hebbian 学习驱动的记忆架构在 LLM Agent 中是首创
实验充分度: ⭐⭐⭐⭐ 四骨干+四类别+消融，但仅单一基准
写作质量: ⭐⭐⭐⭐⭐ 认知科学动机清晰，架构描述系统
价值: ⭐⭐⭐⭐⭐ 为 LLM 长期记忆提供了生物启发的新范式代码: 待确认
领域: llm_agent
关键词: 待补充

一句话总结¶

待深读论文后补充

研究背景与动机¶

待深读论文后补充

方法详解¶

待深读论文后补充

实验关键数据¶

待深读论文后补充

亮点与洞察¶

待深读论文后补充

局限性 / 可改进方向¶

待深读论文后补充

评分¶

新颖性: 待评
实验充分度: 待评
写作质量: 待评
价值: 待评

HeLa-Mem: Hebbian Learning and Associative Memory for LLM Agents¶

一句话总结¶

研究背景与动机¶

方法详解¶

整体框架¶

关键设计¶

损失函数 / 训练策略¶

实验关键数据¶

主实验（LoCoMo 基准）¶

消融实验¶

关键发现¶

亮点与洞察¶

局限与展望¶

相关工作与启发¶

评分¶

一句话总结¶

研究背景与动机¶

方法详解¶

实验关键数据¶

亮点与洞察¶

局限性 / 可改进方向¶

相关工作与启发¶

评分¶