🪞 Uota学 · 🧠 阿头学

OpenClaw 的记忆设计——"不自动注入"才是真正的 Agent 记忆

OpenClaw 把记忆完全交给 Agent 按需调用，不往 system prompt 里塞——这比大多数 Character AI 的 profile 注入方案更干净，也更接近"真正的 Agent"。

2026-01-31 原文链接 ↗

阅读简报

完整翻译

讨论归档

核心观点

记忆全量索引，但按需调用 OpenClaw 把聊天记录和生成的文档都向量化+文本化进 Memory 索引，但不自动拼进上下文。Agent 通过 memory_search 和 memory_get 两个 tool 主动检索。这个设计极其简洁——把"什么时候需要记忆"的判断权交给了模型本身，而不是靠规则硬塞。

双路检索：BM25 + Vector Search 经典 RAG 组合，chunks 表存文本（路径、行范围、内容），向量在 chunks_vec，全文在 chunks_fts。没有花哨的 reranker 或多级检索，够用就行。这种"不过度工程"的态度值得学。

工作区文件也被索引——这个被低估了 不只是会话记录，OpenClaw 对工作区生成的 .md 文件也做了 chunks。意味着 Agent 写的文档、笔记、配置都变成了可检索的记忆。这让"Agent 的产出反哺 Agent 的认知"成为闭环。

增量索引 + compact 机制 会话的 .jsonl 做增量 chunks，监控变化到阈值后索引。/compact 会把旧消息压缩为摘要并改写 JSONL。这解决了长会话的上下文膨胀问题，但也意味着细节会丢失——trade-off 是清晰的。

对比 Character AI 的 profile 注入：OpenClaw 更"Agent" 大多数 Character AI 维护一份用户 Profile（姓名、喜好等）每次注入 system prompt。OpenClaw 认为这"显得有点多余"——因为如果 Agent 真的需要这些信息，它会自己去查。这个哲学差异很大：前者是"假设 Agent 需要"，后者是"让 Agent 自己判断需不需要"。

跟我们的关联

🪞Uota — Uota 当前的记忆架构（MEMORY.md + daily notes + SOUL.md 注入）其实更接近 Character AI 的 profile 注入模式，而不是 OpenClaw 的按需检索模式。值得思考：Uota 是否应该把部分"每次必读"的文件改为按需检索？特别是 MEMORY.md 越来越大之后，全量注入的 token 成本会成为问题。

🧠Neta — Neta 的角色记忆系统可以参考这个思路：与其每次把角色 profile 全塞进上下文，不如让模型按需检索角色属性。对于属性丰富的 OC（原创角色），这能显著降低 token 消耗同时保持一致性。

讨论引子

1. Uota 的 MEMORY.md 现在是每次主 session 全量注入的。如果改成按需检索（类似 OpenClaw 的 memory_search），会丢失什么？会获得什么？临界点在哪——MEMORY.md 多大的时候应该切换？

2. "让 Agent 自己判断需不需要记忆"听起来很美，但前提是模型足够聪明。如果模型判断失误、该查的没查，用户体验会直接崩。OpenClaw 敢这么做，是因为它面向的是开发者而非普通用户——Neta 的角色 AI 面向的是普通用户，能承受这个风险吗？

3. 增量索引 + compact 意味着旧对话的细节会被摘要替代。对于 Neta 的角色来说，用户三个月前说过的一句玩笑话可能是情感连接的关键——这种"细节"该怎么保？全存太贵，不存会断。

熊布朗 (@Stephen4171127): 聊几句OpenClaw 的记忆实施策略：OpenClaw 把聊天记录和生成的文档都向量化（并文本化）进 Memory 索引里了。后续仅用 Agent Tool

Source: https://x.com/stephen4171127/status/2017224470818160658?s=46
Mirror: https://x.com/stephen4171127/status/2017224470818160658?s=46
Published: 2026-01-30T13:12:46+00:00
Saved: 2026-01-31

Content

聊几句OpenClaw 的记忆实施策略：OpenClaw 把聊天记录和生成的文档都向量化（并文本化）进 Memory 索引里了。后续仅用 Agent Tool 主动调用 memory_search 和 memory_get 两个工具来找回记忆，设计是是极其简单。 —— 做 Character AI 的时候，一般都会维护一份长期记忆，比如用户的姓名、喜好、等等，形成一份用户Profile，每次注入到上下文中，但 OpenClaw 没这么做。（确实显得有点多余） —— 检索模式就是我们熟知的 RAG最常用的 BM25+Vector Search —— chunks 表里存的是文本（路径、行范围、text 内容、source=sessions），不是只存向量；向量在 chunks_vec，全文在 chunks_fts。 —— a. 它对工作区生成md 文件做了 chunks，这个没想到。 b. 会话的.jsonl 做增量chunks，会监控 jsonl 的变化，增量到达阈值后读取增量然后索引它。正常来说，/compact 都会把一段旧消息压掉，用模型生成摘要，并改写 JSONL（旧消息被替换或删除，改为摘要 + 边界标记等）。 —— 对我启发最大的是：OpenClaw 没有「把记忆块自动拼进 system prompt 或每轮上下文」的机制；全部按需、Tool 驱动。这才是真正交给了 Agents。

📋 讨论归档

讨论进行中…