endee 是什么?

Endee 是一个用 C++ 写的高性能开源向量数据库,面向 AI 检索类负载——RAG、语义搜索、混合搜索、推荐与带过滤的向量检索。它的招牌设计是单节点可处理多达 10 亿向量,通过优化的索引与执行、以及面向现代 CPU(AVX2/AVX512/NEON/SVE2)的编译来拿性能。功能上结合稠密向量检索、稀疏检索(混合搜索)、payload 元数据过滤、备份流程与运行时可观测。提供 HTTP API(端口 8080),支持本地构建/脚本与 Docker 部署。Apache-2.0,另有 endee.io 云版。

⭐ 1,142 Stars 🍴 1,521 Forks C++ Apache-2.0 作者: endee-io
来源:README 顶部/Why Endee/Features;GitHub desc,license Apache-2.0 查看 GitHub 仓库 →

为什么值得关注

约 1.3k 星,热度来自向量数据库这个 AI 基础设施刚需 + 一个抓眼的卖点:单节点 10 亿向量、C++ + CPU SIMD 优化。在 Qdrant/Milvus/pgvector 等已成熟的赛道里,它主打『单机就能扛大规模、性能优先、可控自托管』,对做 RAG/agent 记忆、又想要高性能开源向量库的人有吸引力。(注:其 fork 数明显高于 star,数据观感不太寻常,热度真实度可结合实际使用判断。)

来源:GitHub 1,318 stars / 1,732 forks,created 2026-01-24;README 顶部

核心功能

高性能稠密向量检索

为 AI 检索与语义相似度负载设计,C++ 实现并针对 AVX2/AVX512/NEON/SVE2 等现代 CPU 指令集编译,号称单节点可处理多达 10 亿向量。

来源:README 顶部/Features(Vector search/CPU-targeted builds)
混合检索(稠密 + 稀疏)

在稠密向量之外支持稀疏向量检索,可做混合搜索——同时利用语义理解和词级精度提升相关性。

来源:README Why Endee/Features(Hybrid retrieval);docs/sparse.md
Payload 元数据过滤

支持按 payload 做元数据感知的检索过滤,实现应用特定的查询逻辑(先过滤再/同时做向量相似检索)。

来源:README Features(Payload filtering);docs/filter.md
备份与可观测

内置备份 API 与流程,以及运行时日志/instrumentation(含 mdbx 存储引擎的观测),面向生产运维。

来源:README Features(Backup APIs/Operational logging);docs/backup-system.md
灵活部署 + HTTP API

提供本地脚本(install.sh/run.sh)、手动构建、Docker 镜像与预编译 registry 镜像多种部署;通过 HTTP API(端口 8080)管理索引与服务检索;另有 endee.io 云托管版。

来源:README Getting Started/API and Clients

技术架构

C++ 实现的单体向量数据库(CMakeLists 构建,src/ 为主体,third_party/ 含依赖)。核心是为现代 CPU 优化的向量索引与执行引擎:编译时按目标指令集(AVX2/AVX512/NEON/SVE2)选优,号称单节点扛 10 亿向量。存储层用 mdbx(README 提到 mdbx-instrumentation 观测)。对外是 HTTP API(端口 8080)管理索引、服务稠密+稀疏检索与 payload 过滤。运维侧有备份 API、日志与 instrumentation。部署上 install.sh/run.sh 本地构建运行、docker-compose 与 registry 镜像、infra/ 放部署相关。它定位为『性能优先、单节点大规模、可自托管』的检索层,可作为 RAG 与 agent 记忆的后端,接 LangChain/CrewAI/AutoGen/LlamaIndex 等框架。整体是『C++ CPU 优化引擎 + mdbx 存储 + HTTP API + Docker/脚本部署』的向量库工程。

来源:README Features/Getting Started;tree(src/、third_party/、CMakeLists.txt、docker-compose.yml、infra/)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) CPU SIMD(AVX2/AVX512/NEON/SVE2)CPU SIMD(AVX2… mdbx(存储引擎) HTTP API CMake(构建) Docker 高性能稠密向量检索 混合检索(稠密 + 稀疏) Payload 元数据过滤 备份与可观测 灵活部署 + HTTP API endee 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言C++框架自研向量索引/执行引擎
CPU SIMD(AVX2/AVX512/NEON/SVE2)mdbx(存储引擎)HTTP APICMake(构建)Docker
单节点自托管(端口 8080);本地脚本/手动构建/Docker/registry 镜像;另有 endee.io 云版
来源:README Why Endee/Getting Started;CMakeLists.txt

快速上手

最快本地路径:`chmod +x ./install.sh ./run.sh` 后 `./install.sh --release --avx2`(按你的 CPU 选指令集 flag)再 `./run.sh`,服务监听 8080 端口。详细的安装/构建/Docker/运行/认证见 docs/getting-started.md 或 docs.endee.io/quick-start。之后通过 HTTP API 建索引、写入向量(含稀疏与 payload)、做检索;可作为 LangChain/CrewAI/AutoGen/LlamaIndex 等的检索/记忆后端。也可直接用 endee.io 云版。
来源:README Getting Started/API and Clients

使用场景

适合:①做 RAG/问答/copilot,需要带元数据过滤的快速向量检索后端的团队;②给 LangChain/CrewAI/AutoGen/LlamaIndex 等 agent 做长期记忆与上下文检索;③语义/混合搜索、推荐与近邻匹配;④想要性能优先、单节点扛大规模、可自托管的开源向量库的人。不适合:已深度绑定 Qdrant/Milvus/pgvector 等成熟方案且无迁移动力的团队;以及需要久经大规模生产验证、丰富客户端 SDK 与生态的关键业务(Endee 仍较新、生态与实战验证有待积累)。

来源:README Use Cases,结合定位推断

优势与局限

优势

  • 性能取向明确:C++ + 多指令集 SIMD 优化,主打单节点 10 亿向量的大规模检索
  • 检索能力齐:稠密 + 稀疏混合检索 + payload 元数据过滤,覆盖 RAG/语义/混合搜索常见需求
  • 有运维意识:内置备份 API、日志与 mdbx instrumentation,面向生产而非纯 demo
  • 部署灵活:脚本/手动/Docker/registry 镜像 + 云版,Apache-2.0 可自托管可商用
  • 定位清晰:直接面向 RAG 与 agent 记忆,并点名兼容主流 agent 框架

局限

  • 10 亿向量/性能优势是项目自述,缺独立第三方基准,实际表现需自行验证
  • 生态与成熟度不及 Qdrant/Milvus/pgvector:客户端 SDK、社区、长期生产验证仍待积累
  • star/fork 数据观感不寻常(fork 多于 star),热度真实度宜结合实际使用判断
  • C++ 自托管对运维有一定门槛,索引调参与大规模稳定性需实测
  • 1.0.0 虽已发布,但项目较新(2026-01 创建),关键业务上线需充分压测与回滚预案
来源:README 顶部/Features;与成熟向量库的对比与数据观感推断

最新版本

已发布 1.0.0(仓库 Release Notes),主分支持续更新(最近 push 2026-05-22,创建于 2026-01-24)。提供云版(endee.io)与自托管两条路径,处于早期但活跃迭代、已有正式版本的阶段。

来源:GitHub Release 1.0.0;pushed_at 2026-05-22;README API and Clients

总结评价

Endee 是向量数据库赛道里一个性能取向鲜明的新选手:C++ + 多指令集 SIMD 优化,主打单节点扛 10 亿向量,稠密+稀疏混合检索、payload 过滤、备份与可观测都有,定位直接对准 RAG 和 agent 记忆,Apache-2.0 可自托管。对想要性能优先、单机大规模、可控开源向量库的人值得评估。但要清醒:10 亿向量与性能优势目前是自述、缺独立基准,生态/SDK/实战验证远不及 Qdrant/Milvus/pgvector,star-fork 数据观感也不太寻常,且项目较新。建议把它当作『值得做 PoC 压测的高性能候选』,关键业务则等更多第三方验证与生态成熟更稳妥。

来源:综合 README 定位/能力、tree 工程结构、成熟度与数据观感的事实判断
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-23 00:06. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件