TencentDB Agent Memory 是腾讯开源的 AI agent 本地长期记忆层:用 4 层渐进式管线把碎片化对话层层提炼成 L0 对话→L1 事实→L2 场景→L3 用户画像的语义金字塔,存储用本地 SQLite + sqlite-vec(向量检索零外部 API),低层存证据、高层存结构且可逐层溯源恢复,作为 OpenClaw 插件零配置接入、也支持 Hermes,号称最高省 61% token、PersonaMem 准确率从 48% 提到 76%。
来源:README_CN 项目简介 + 核心技术 + 效果亮点 + package.json 查看 GitHub 仓库 →现在多数 agent 记忆系统把所有对话切片平铺成向量,召回时像在一堆便利贴里找线索、缺宏观视角。TencentDB Agent Memory 提出「拒绝平铺、走向分层与符号化」:建 L0 对话→L1 结构化事实→L2 场景块→L3 用户画像 的语义金字塔,平时靠高层 Persona 把握偏好、要细节时再检索底层 Atom;异构存储让低层海量事实进数据库、高层画像/场景/画布进可读 Markdown(低层留证据、高层留结构),且严格索引映射保证每条信息 100% 可溯源恢复、没有不可逆黑盒。再加上本地 SQLite + sqlite-vec 的零外部依赖存储、hybrid(RRF 融合)召回、可选短期记忆压缩,以及实测作为 OpenClaw 插件最高省 61.38% token、通过率相对 +51.52%、PersonaMem 48%→76%。腾讯官方背书 + 可量化收益 + 本地优先,是 agent 长期记忆这条线上设计较有想法的实现。
来源:README_CN 核心技术 / 效果亮点 benchmark长期个性化记忆分层:L0 Conversation(原始对话)→ L1 Atom(结构化事实)→ L2 Scenario(场景块)→ L3 Persona(用户画像)。渐进式披露——平时用高层 Persona 把握用户偏好,需要考证细节时才下钻到底层 Atom,避免「扁平向量堆砌」。pipeline 每 N 轮对话触发 L1 提取,L2 有最小间隔,新 session 有 warm-up(1→2→4 轮翻倍触发)。
来源:README_CN '记忆分层' + 配置参数(pipeline.everyNConversations / warmup / l2MinInterval)底层数据库 + 上层文件系统结合:海量事实/日志/轨迹存数据库或归档文件保证全量检索;高层画像/场景/画布/Skill 存业务可读的 Markdown 保证高信息密度、白盒可调。原则是「低层保留证据,高层保留结构」。
来源:README_CN '渐进式披露与异构存储'压缩/抽象最大的风险是丢证据。靠严格索引映射,系统内没有任何摘要是不可逆黑盒——无论短期记忆卸载的报错日志还是长期记忆总结的用户偏好,都能沿「高层符号(Persona/画布) → 中层索引(Scenario/JSONL) → 底层原文(L0/refs)」完美溯源恢复。
来源:README_CN '每一条信息都 100% 可找回、可恢复'用最少符号表达最多语义——把记忆组织成 Mermaid 画布等符号化结构,提升信息密度与逻辑清晰度,让 agent 和开发者都能白盒查看与调整高层记忆。
来源:README_CN '符号化记忆' 节默认本地 SQLite + sqlite-vec 后端,向量检索零外部 API;召回策略支持 keyword / embedding / hybrid(RRF 融合,推荐);中文用 @node-rs/jieba 分词、tcvdb-text 文本处理、js-tiktoken 计 token。可选短期记忆压缩(offload,≥0.3.4)。注:记忆提取 pipeline 仍需一个 LLM(MODEL_API_KEY,默认腾讯 LKE / DeepSeek-V3.2,可指向任意 OpenAI 兼容接口),「零外部 API」主要指存储与向量检索。
来源:README_CN 配置参数(storeBackend/recall.strategy/offload)+ Hermes 配置 + package deps作为 OpenClaw 插件零配置启用(openclaw.plugin.json);通过 slots 字段注册 contextEngine 可启用短期记忆压缩路由。也支持 NousResearch 的 Hermes agent——一条 docker 命令启动带记忆的 Hermes(Gateway :8420、命名卷持久化)。hermes-plugin/ 目录承载这部分。
来源:README_CN OpenClaw / Hermes 接入 + hermes-plugin/ + openclaw.plugin.json项目是 TypeScript 库 + 插件,src/(122 文件)实现核心:4 层记忆 pipeline(L0→L1→L2→L3 的提取与抽象)、异构存储层(SQLite + sqlite-vec 存底层事实与向量、Markdown 文件系统存高层 Persona/Scenario/画布)、召回引擎(keyword/embedding/hybrid RRF)、短期记忆压缩(offload)。中文处理用 @node-rs/jieba + tcvdb-text,LLM 调用经 @ai-sdk/openai + ai SDK(可配任意 OpenAI 兼容 endpoint)。对外有两种接入:OpenClaw 插件(openclaw.plugin.json + slots/contextEngine 路由)和 Hermes(hermes-plugin/ + Docker,Gateway :8420 + 命名卷持久化)。数据流:对话进来 → 按 N 轮/idle/warm-up 触发 L1 事实提取 → L2 场景聚合 → L3 画像更新,同时严格维护索引映射保证任意高层符号可回溯到底层原文。设计判断:核心创新是「分层 + 符号化 + 可溯源」三点——用语义金字塔替代扁平向量、用低层 DB+高层 Markdown 的异构存储兼顾全量检索与白盒可调、用索引映射保证压缩不丢证据,这套设计明显比「一堆向量 + 相似度召回」更有结构感,也更适合需要解释和审计记忆的场景;代价是 pipeline 依赖 LLM 做提取(有成本和质量波动),且分层提取的准确性本身是新的质量变量。
来源:README_CN 核心技术 + tree(src/hermes-plugin)+ package deps中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
sqlite-vec@ai-sdk/openai + ai@node-rs/jieba + @tencentdb-agent-me…js-tiktokenundici1. 给 OpenClaw / Hermes agent 加本地长期记忆:零配置接入后 agent 能跨会话记住用户偏好、历史决策,且记忆是分层可解释的而非一堆向量;2. 省 token + 提准确率:用高层 Persona 替代把全部历史塞进上下文,实测最高省 61% token、PersonaMem 48%→76%;3. 需要可审计/可溯源记忆的场景:靠索引映射从画像回溯到原始对话,满足「为什么 agent 这么认为」的解释需求;4. 隐私/本地优先:存储与向量检索全本地 SQLite,数据不出机(提取 pipeline 可指向本地或自有 LLM endpoint);5. 中文 agent 记忆:内置 jieba 分词与中文文本处理,对中文场景适配好。
来源:README_CN 效果亮点 / 核心技术 / 配置v0.3.5(2026-05-20,package.json 同为 0.3.5)。最近 3 个 release:v0.3.3 (2026-05-12) → v0.3.4 (2026-05-13) → v0.3.5 (2026-05-20),offload 短期记忆压缩等在 0.3.4 引入。仓库 2026-04-07 创建,仍处 0.3.x 早期、迭代活跃。
来源:GitHub Releases API(3 个 tag)+ package.json version如果你在给 agent 做长期记忆、又不满足于「一堆向量 + 相似度召回」,TencentDB Agent Memory 的分层 + 符号化 + 可溯源设计值得一看:L0→L1→L2→L3 语义金字塔、低层 DB 高层 Markdown 的异构存储、100% 可回溯,配本地 SQLite 存储和实测的 token/准确率收益。务实建议:1) 用 OpenClaw 的话零配置接入最省事,先体验分层记忆带来的 token 节省和画像准确率提升;2) 厘清「零外部 API」——存储和向量检索本地零依赖,但记忆提取仍需一个 LLM(默认腾讯 LKE/DeepSeek,可换 OpenAI 兼容或本地 endpoint),纯离线要自己接本地模型;3) 配置项多(recall 策略、提取触发间隔、offload),先用默认 hybrid + everyN=5 跑通再调;4) 分层提取质量是关键变量,提取错会污染高层画像,重要场景要抽查 L1/L3 的准确性,好在可溯源便于核对;5) 0.3.x 早期、几天一版,配置 schema 可能变,生产前锁版本;6) 目前主要服务 OpenClaw/Hermes,接其它 agent 需自己适配。
来源:综合分析