sentrysearch 是什么?

SentrySearch 是一个对视频片段做语义搜索的开源工具:你用自然语言描述想找的画面(如「闯红灯的红色卡车」),它返回一段从原片裁好的对应短视频。它把视频切成重叠片段,用 Google Gemini Embedding、阿里 DashScope(qwen-cloud)或本地 Qwen3-VL 模型把每段视频嵌入向量、存进本地 ChromaDB;查询(文本或图片)嵌入同一向量空间后匹配,最佳片段自动从原文件裁出。它尤其面向 Tesla Sentry/行车记录仪海量录像,是「搜索→SentryMerge 多机位合一→SentryBlur 自动打码」三件套的第一环。Python、Apache-2.0、约 4,200 星。

⭐ 3,712 Stars 🍴 346 Forks Python 作者: ssrajadh
来源:README 顶部简介/How it works/Getting Started、GitHub meta(ssrajadh/sentrysearch,Python,Apache-2.0) 查看 GitHub 仓库 →

为什么值得关注

行车记录仪/Tesla Sentry 会攒下海量录像,出事要回看时人工翻找极其痛苦。SentrySearch 用「视频语义搜索」直接解决:一句话就能定位到某个事件并裁出片段,还能用图片搜、用 highlights 模式在「不知道找什么」时浮出最异常的片段;既可用云端嵌入也可本地模型(隐私、无需 API key),并与多机位合成、自动打码组成完整流水线。这种「把翻录像变成一句话搜索」的实用价值,加上 Tesla 车主群体的刚需,使它受到关注(约 4,200 星)。

来源:README 顶部简介/Highlights/Local Backend、GitHub meta(stars 4208、created_at 2026-03-17、pushed_at 2026-05-18)

核心功能

视频语义搜索 + 自动裁剪

把视频切成重叠片段并嵌入向量存入本地 ChromaDB,用自然语言查询匹配后,自动把最佳匹配片段从原文件裁出保存为短视频,免去人工拖进度条。

来源:README How it works/Search 段
图片搜与 highlights 异常发现

除文本外可用图片在同一向量空间检索(search by image);highlights 模式在你不知道该搜什么时,浮出录像里最异常/最值得看的片段。

来源:README Search by image/Highlights 段
多后端:云端与本地

嵌入后端可选 Google Gemini Embedding(默认)、阿里 DashScope qwen-cloud,或本地 Qwen3-VL 模型(--backend local,无需 API key、数据不出本机),按隐私/成本/效果权衡。

来源:README How it works/Local Backend/Qwen Cloud 段
Tesla 三件套流水线

作为流水线第一环:SentrySearch 找事件 → SentryMerge 把多机位录像自动剪成跟随主体的一段视频 → SentryBlur 自动打码敏感信息;并支持 Tesla 元数据叠加显示。

来源:README 顶部 The Pipeline/Tesla Metadata Overlay/Stitch/Redact 段

技术架构

SentrySearch 是 Python 命令行工具(包在 sentrysearch/,用 uv 安装、需 Python 3.11/3.12 因 PyTorch wheel 限制)。核心流程:index 把视频用 ffmpeg 切成重叠片段,按所选后端(Gemini Embedding / DashScope qwen-cloud / 本地 Qwen3-VL)将每段嵌入为向量,存入本地 ChromaDB;search 把文本或图片查询嵌入同一空间做相似度匹配,再用 ffmpeg 从原文件裁出最佳片段。命令含 init(配置/校验 Gemini key)、index、search、search-by-image、highlights、以及与 SentryMerge/SentryBlur 的对接和 Tesla 元数据叠加。ffmpeg 用于切片与裁剪(无系统级则用内置 imageio-ffmpeg)。仓库含 sentrysearch/、tests/、docs/、.env.example、pyproject.toml,文档中英双语。所有索引数据本地存储。

来源:README How it works/Getting Started/Usage、仓库目录(sentrysearch/tests/docs、pyproject.toml)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) 嵌入:Gemini Embedding / DashScope qwen-cloud / 本地 Qwen3-VL嵌入:Gemini Em… ChromaDB(本地向量库)ChromaDB(本地… ffmpeg / imageio-ffmpeg(切片/裁剪)ffmpeg / image… uv(安装)、PyTorch(本地后端)uv(安装)、PyT… 视频语义搜索 + 自动裁剪 图片搜与 highlights 异常发现图片搜与 highlights… 多后端:云端与本地 Tesla 三件套流水线 sentrysearch 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Python(3.11/3.12)框架CLI 工具 + 向量检索流水线
嵌入:Gemini Embedding / DashScope qwen…ChromaDB(本地向量库)ffmpeg / imageio-ffmpeg(切片/裁剪)uv(安装)、PyTorch(本地后端)
本地 CLI,索引数据本地存储;本地后端无需 API key、数据不出机;云端后端需相应 API key
来源:README Getting Started/How it works/Local Backend

快速上手

装 uv 后克隆并 `uv tool install .`(需 Python 3.11/3.12,新版可 `uv python install 3.12` 再 `uv tool install --python 3.12 .`)。默认 Gemini 后端先 `sentrysearch init` 配置并校验 API key(建议在 Google AI Studio 设花费上限);想本地/隐私则用 `--backend local`(无需 key)或 `--backend qwen-cloud` 配 DASHSCOPE_API_KEY。然后 `sentrysearch index /path/to/footage` 建索引,`sentrysearch search "red truck running a stop sign"` 搜索并自动裁出片段;也可按图搜或用 `sentrysearch highlights` 浮出异常片段。ffmpeg 必需(无系统级则自动用内置 imageio-ffmpeg)。可衔接 SentryMerge/SentryBlur。
来源:README Getting Started/Usage 段

使用场景

最贴合 Tesla Sentry/行车记录仪车主与安防场景:出事故或纠纷后用一句话定位事件片段、按可疑画面(图片)检索、用 highlights 在海量录像里浮出异常时刻;再用 SentryMerge 把多机位剪成连贯一段、用 SentryBlur 给车牌人脸打码后再分享,兼顾取证与隐私。更广义地,任何需要在大量视频里「按内容找片段」的人(监控、素材库)都适用。本地后端尤其适合注重隐私、不想把录像传云的用户。

来源:README 顶部 The Pipeline/Highlights/Local Backend、Tesla 相关功能

优势与局限

优势

  • 解决真实痛点:把「翻录像」变成一句话语义搜索并自动裁片,对 Tesla/行车记录仪海量素材尤其省事。
  • 隐私可选:本地 Qwen3-VL 后端无需 API key、数据不出本机,索引也本地存储;并配 SentryBlur 打码。
  • 能力齐全:文本/图片搜 + highlights 异常发现 + Tesla 元数据叠加 + 多机位合成/打码三件套流水线。
  • 工程友好:uv 安装、ChromaDB 本地库、ffmpeg 自动回退,中英文档,Apache-2.0 开源。

局限

  • 云端后端有调用成本与隐私顾虑(录像发往 Gemini/DashScope),需自行权衡并设花费上限。
  • 依赖 Python 3.11/3.12(PyTorch wheel 限制)与 ffmpeg,本地后端对算力有要求。
  • 录像常含他人车牌/人脸等敏感信息,处理与分享需注意隐私与当地法规(故配套 SentryBlur)。
  • 语义搜索的召回质量取决于嵌入模型与切片策略,复杂/细粒度查询可能漏匹配。
来源:README How it works/Local Backend/Cost/Limitations、隐私考量

最新版本

项目以 uv 工具安装分发,迭代活跃,近期新增 highlights(异常片段发现)模式。功能已覆盖视频语义搜索与自动裁剪、图片搜、多后端(Gemini/DashScope/本地 Qwen3-VL)、Tesla 元数据叠加,并与 SentryMerge/SentryBlur 组成流水线。中英双语文档。仓库最近一次更新在 2026-05-18。

来源:README New/Usage、GitHub meta pushed_at 2026-05-18、created_at 2026-03-17

总结评价

SentrySearch 把「在海量行车/监控录像里找事件」从苦差变成一句话搜索:切片嵌入存 ChromaDB、文本或图片查询匹配、自动裁出片段,还能用 highlights 浮出异常时刻,并能选本地 Qwen3-VL 后端保隐私、配 SentryMerge/SentryBlur 完成合成与打码。对 Tesla 车主与需要按内容检索视频的人,它非常实用,工程与隐私选项也到位。要权衡的是云端后端的成本与隐私、对 Python/ffmpeg 与算力的依赖、以及处理含他人信息录像的合规问题。作为「视频语义搜索 + 取证流水线」的开源方案,它的实用性和完成度都很扎实。

来源:综合 README、How it works、流水线与 GitHub meta 的事实判断
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-23 20:09. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件