Hindsight 是 Vectorize 推出的 AI 代理「记忆系统」。它与大多数只做对话历史召回的代理记忆方案不同——目标是让代理「学习」而不仅仅是「记住」。Hindsight 用类生物(biomimetic)的数据结构来组织记忆,把信息分为「世界知识」(关于世界的事实)、「经验」(代理自身的经历)和「心智模型」(通过反思原始记忆与经验形成的、对世界的学习性理解),并对外提供 Retain(存入)、Recall(检索)、Reflect(反思生成新洞见)三个核心操作。项目附有论文(arXiv 2512.12818),代码以 MIT 许可开源,约 14,330 stars。
来源:README.md(What is Hindsight、Architecture & Operations 段落);GitHub 仓库元数据(stars=14330、license=MIT、homepage) 查看 GitHub 仓库 →「代理长期记忆」是 2026 年 AI Agent 领域的关键瓶颈之一:RAG 和知识图谱在长期对话/任务记忆上各有短板。Hindsight 主打在 LongMemEval 这一长期记忆基准上取得当前最优表现,且声称该成绩已由弗吉尼亚理工 Sanghani 中心和《华盛顿邮报》的研究协作者独立复现(其它厂商分数为自报)。项目同时强调已在多家世界 500 强企业和一批 AI 创业公司的生产环境中使用,并提供论文、Cookbook、云服务和多语言 SDK,工程完备度高,因而获得较高关注。
来源:README.md(Memory Performance & Accuracy 段落,含独立复现与生产使用说明);仓库 topics(ai-memory、agents)Retain 存入要记住的信息、Recall 检索相关记忆、Reflect 对已有记忆与经验做反思以生成新观察和洞见。
来源:README.md(Architecture & Operations:Retain/Recall/Reflect)把记忆分为世界知识、经验、心智模型三层,用实体/关系/时间序列加稀疏稠密向量表示,区别于单纯向量检索或知识图谱。
来源:README.md(Architecture & Operations:World/Experiences/Mental Models)最简单的接入方式是用 LLM Wrapper 替换现有 LLM 客户端,之后在 LLM 调用过程中自动存取记忆;需要更精细控制时可用 SDK 或直接 HTTP API。
来源:README.md(Adding Hindsight to Your AI Agents 段落)LLM 提供商支持 openai/anthropic/gemini/groq/ollama/lmstudio/minimax;客户端提供 Python 与 Node/TypeScript 两套 SDK,另有可内嵌运行、无需独立服务的 hindsight-all(Python embedded)。
来源:README.md(Quick Start 的 Docker LLM_PROVIDER 选项、Client、Python Embedded 段落)在 retain 时用自定义 metadata 给记忆打标,便于按用户隔离,召回时按 metadata 过滤,适合个性化聊天机器人等场景。
来源:README.md(Use Cases → Per-User Memories 段落)Hindsight 的记忆按「记忆库」(bank)组织。信息存入时被分流到「世界事实」或「经验」两条记忆通路,再表示为实体、关系和时间序列的组合,并配合稀疏/稠密向量表示以辅助召回;在此之上通过反思形成「心智模型」。服务端核心是 Python 的 hindsight-api(仓库内有 hindsight-api-slim 包),数据持久化基于 PostgreSQL(用 Alembic 管理 schema 迁移,可见实体三元组索引、向量索引、记忆链接等迁移脚本),企业部署还支持 Oracle AI Database。部署形态丰富:单机 Docker 镜像、docker-compose(外置 PG、AlloyDB、TimescaleDB、VectorChord、S3 文件存储、nginx 等多种组合)。客户端有 Python(hindsight-client)和 Node/TypeScript(@vectorize-io/hindsight-client)两套 SDK,以及面向编码代理的 MCP 集成。
来源:README.md(Architecture & Operations、Quick Start 的 Docker/Client 段落);git tree(hindsight-api-slim/、alembic/versions/、docker/docker-compose/ 各子目录)中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
PostgreSQL(向量+全文检索,Alembic 迁移)可选 AlloyDB/TimescaleDB/VectorChord/O…litellm(多 LLM 接入)S3(可选文件存储)Hindsight 面向需要长期学习能力的对话型和任务型 AI 代理。最适合那些需要混合多种能力的场景——例如需要处理开放式任务、根据用户反馈调整行为、学习完成复杂工作以接近人类水平的「AI 员工」。较简单的用法包括给聊天机器人做按用户隔离的个性化记忆与历史。官方也提醒:对于 n8n 等简单 AI 工作流,Hindsight 可能属于「杀鸡用牛刀」,更适合对长期记忆有真实需求的代理。
来源:README.md(Use Cases 段落,含适用与不适用提示)最新发布为 v0.6.2(2026-05-14)。该版本以集成修复、文档完善和依赖安全更新为主:多处修复编码代理集成(如 claude-code 的 get_page 取 content、MCP 把 recall 的 max_results 改名为 max_tokens、可配置 MCP 请求超时);修复 agent-sdk 的参数命名与分页取数;修复 CLI/control-plane 让 retain 的事件日期/时间戳真正传到 API,并新增 --timestamp 文档;修复 mental_models.subtype 的迁移;以及成批升级 npm 与 pip 的高危/严重依赖(litellm 升到 ≥1.83.14、urllib3 升到 2.7.0 等)。整体是一个偏稳定性与安全的小版本。
来源:GitHub releases/latest(v0.6.2 What's Changed 列表)Hindsight 在「代理记忆」这一正成为刚需的方向上给出了较有体系的方案:用分层记忆加反思机制,试图让代理真正从交互中学习,而不仅是召回历史。它的基准成绩有第三方复现背书、工程化和部署选项都比较成熟,对要做长期记忆型 AI 代理(尤其是 AI 员工类应用)的团队值得认真评估。需要注意的是横评分数的口径差异、对轻量场景可能偏重,以及它同时存在商业云服务——选型时应结合自身对长期记忆的真实需求和运维能力来判断。
来源:综合 README.md(基准与适用性说明)、release notes 与 git tree 的工程结构