🐾 claw-stack

最后更新:2026 年 3 月

持久记忆系统

Claw-Stack 的持久记忆系统为 AI 智能体提供三个不同的记忆层级——即时召回、结构化知识和语义搜索——使其能够跨会话积累专业知识,而不是每次从头开始。

三范式融合

记忆架构建立在三个研究范式之上,每个范式解决保留问题的不同部分:

Mem0 — 事实提取

每次会话后,提取过程识别值得保留的离散事实:用户偏好、项目状态、经验教训、未完成任务。这些以结构化条目存储,附带来源归属和置信度评分。

Zep — 时间衰减

记忆条目携带生存时间(TTL)值。高频事实无限期保持新鲜。陈旧或低相关度条目衰减并最终归档——不是删除。每周清理运行在归档前将过期条目汇总成经验教训,防止膨胀同时保留机构知识。

MemGPT — 智能体自我管理

智能体可以直接读写自己的记忆文件。每个智能体每天运行自我回顾,从前一天的工作中提取经验教训并更新个人记忆。这创造了良性循环:昨天犯了错误的智能体明天会记住它。

三层记忆

第一层 — MEMORY.md(即时召回)

顶层 MEMORY.md 文件在每次会话开始时加载到每个智能体的上下文窗口中。为避免占用过多上下文预算,该文件被刻意保持简短(不超过 200 行)。它只包含最关键、最常用的事实:当前项目、活跃任务、关键联系人和系统状态。

第二层 — memory/*.md(结构化知识)

memory/ 目录包含智能体可按需读取的按主题分类的 Markdown 文件。主题分为几个类别:personal/(个人)、projects/(项目)、agents/(智能体)和 system/(系统)。当智能体需要特定主题的深层上下文时,它读取相关主题文件,而不是搜索完整历史。

第三层 — 语义向量索引(深度检索)

每日记忆同步流水线运行完整提取过程:扫描原始记忆文件、将条目嵌入向量存储、去重重叠条目、按类别分类并导出到搜索索引。当智能体需要回答"三个月前我们关于 X 做了什么决定?"时,语义搜索返回按嵌入相似度排名的相关条目,而不是关键词匹配。

每日记忆流水线

[每日定时任务]
  → 扫描原始记忆文件
  → LLM 事实提取(结构化 JSON)
  → 去重重叠条目
  → 分类:个人 / 任务 / 智能体 / 系统
  → 分配 TTL 值
  → 嵌入并索引到向量存储
  → 更新 MEMORY.md(删除陈旧顶层事实)

[每周定时任务 — 周日凌晨 4:00]
  → 对过期条目运行衰减引擎
  → 将过期条目汇总为经验教训
  → 归档到 lessons.md(可搜索,不可变)
  → 从活跃索引中删除
          

常见问题

记忆在智能体之间共享吗?

默认情况下,每个智能体有自己的个人记忆空间。还有一个所有智能体都可以读取的共享系统记忆。智能体不能写入其他智能体的个人记忆——只能写自己的。共享记忆由编排器(Orange)和共识进程更新。

会话开始时加载 MEMORY.md 的 token 成本是多少?

MEMORY.md 文件在当前实现中限制为 200 行,根据内容密度通常消耗 800–1500 个输入 token。这是有意设计的:该文件必须足够小,不能在有大型任务描述的会话中占据上下文预算。

记忆条目可以手动编辑吗?

可以。所有记忆文件都是磁盘上的纯 Markdown。你可以直接编辑、删除或重新组织它们。记忆总线不锁定文件。下次流水线运行时会获取任何更改并相应地更新向量索引。

Authors: Qiushi Wu & Orange 🍊