Endee 是一个用 C++ 写的高性能开源向量数据库,面向 AI 检索类负载——RAG、语义搜索、混合搜索、推荐与带过滤的向量检索。它的招牌设计是单节点可处理多达 10 亿向量,通过优化的索引与执行、以及面向现代 CPU(AVX2/AVX512/NEON/SVE2)的编译来拿性能。功能上结合稠密向量检索、稀疏检索(混合搜索)、payload 元数据过滤、备份流程与运行时可观测。提供 HTTP API(端口 8080),支持本地构建/脚本与 Docker 部署。Apache-2.0,另有 endee.io 云版。
来源:README 顶部/Why Endee/Features;GitHub desc,license Apache-2.0 查看 GitHub 仓库 →约 1.3k 星,热度来自向量数据库这个 AI 基础设施刚需 + 一个抓眼的卖点:单节点 10 亿向量、C++ + CPU SIMD 优化。在 Qdrant/Milvus/pgvector 等已成熟的赛道里,它主打『单机就能扛大规模、性能优先、可控自托管』,对做 RAG/agent 记忆、又想要高性能开源向量库的人有吸引力。(注:其 fork 数明显高于 star,数据观感不太寻常,热度真实度可结合实际使用判断。)
来源:GitHub 1,318 stars / 1,732 forks,created 2026-01-24;README 顶部为 AI 检索与语义相似度负载设计,C++ 实现并针对 AVX2/AVX512/NEON/SVE2 等现代 CPU 指令集编译,号称单节点可处理多达 10 亿向量。
来源:README 顶部/Features(Vector search/CPU-targeted builds)在稠密向量之外支持稀疏向量检索,可做混合搜索——同时利用语义理解和词级精度提升相关性。
来源:README Why Endee/Features(Hybrid retrieval);docs/sparse.md支持按 payload 做元数据感知的检索过滤,实现应用特定的查询逻辑(先过滤再/同时做向量相似检索)。
来源:README Features(Payload filtering);docs/filter.md内置备份 API 与流程,以及运行时日志/instrumentation(含 mdbx 存储引擎的观测),面向生产运维。
来源:README Features(Backup APIs/Operational logging);docs/backup-system.md提供本地脚本(install.sh/run.sh)、手动构建、Docker 镜像与预编译 registry 镜像多种部署;通过 HTTP API(端口 8080)管理索引与服务检索;另有 endee.io 云托管版。
来源:README Getting Started/API and ClientsC++ 实现的单体向量数据库(CMakeLists 构建,src/ 为主体,third_party/ 含依赖)。核心是为现代 CPU 优化的向量索引与执行引擎:编译时按目标指令集(AVX2/AVX512/NEON/SVE2)选优,号称单节点扛 10 亿向量。存储层用 mdbx(README 提到 mdbx-instrumentation 观测)。对外是 HTTP API(端口 8080)管理索引、服务稠密+稀疏检索与 payload 过滤。运维侧有备份 API、日志与 instrumentation。部署上 install.sh/run.sh 本地构建运行、docker-compose 与 registry 镜像、infra/ 放部署相关。它定位为『性能优先、单节点大规模、可自托管』的检索层,可作为 RAG 与 agent 记忆的后端,接 LangChain/CrewAI/AutoGen/LlamaIndex 等框架。整体是『C++ CPU 优化引擎 + mdbx 存储 + HTTP API + Docker/脚本部署』的向量库工程。
来源:README Features/Getting Started;tree(src/、third_party/、CMakeLists.txt、docker-compose.yml、infra/)中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
CPU SIMD(AVX2/AVX512/NEON/SVE2)mdbx(存储引擎)HTTP APICMake(构建)Docker适合:①做 RAG/问答/copilot,需要带元数据过滤的快速向量检索后端的团队;②给 LangChain/CrewAI/AutoGen/LlamaIndex 等 agent 做长期记忆与上下文检索;③语义/混合搜索、推荐与近邻匹配;④想要性能优先、单节点扛大规模、可自托管的开源向量库的人。不适合:已深度绑定 Qdrant/Milvus/pgvector 等成熟方案且无迁移动力的团队;以及需要久经大规模生产验证、丰富客户端 SDK 与生态的关键业务(Endee 仍较新、生态与实战验证有待积累)。
来源:README Use Cases,结合定位推断已发布 1.0.0(仓库 Release Notes),主分支持续更新(最近 push 2026-05-22,创建于 2026-01-24)。提供云版(endee.io)与自托管两条路径,处于早期但活跃迭代、已有正式版本的阶段。
来源:GitHub Release 1.0.0;pushed_at 2026-05-22;README API and ClientsEndee 是向量数据库赛道里一个性能取向鲜明的新选手:C++ + 多指令集 SIMD 优化,主打单节点扛 10 亿向量,稠密+稀疏混合检索、payload 过滤、备份与可观测都有,定位直接对准 RAG 和 agent 记忆,Apache-2.0 可自托管。对想要性能优先、单机大规模、可控开源向量库的人值得评估。但要清醒:10 亿向量与性能优势目前是自述、缺独立基准,生态/SDK/实战验证远不及 Qdrant/Milvus/pgvector,star-fork 数据观感也不太寻常,且项目较新。建议把它当作『值得做 PoC 压测的高性能候选』,关键业务则等更多第三方验证与生态成熟更稳妥。
来源:综合 README 定位/能力、tree 工程结构、成熟度与数据观感的事实判断