ghost-pepper 是什么?

Ghost Pepper 是一款 100% 本地运行的 macOS 语音工具,用设备端的开源语音模型做语音转文字与会议转录——不调用任何云 API,数据不离开你的 Mac。它常驻菜单栏:按住 Control 说话、松开即转写并粘贴到任意输入框;还能录制会议生成笔记、转录与 AI 摘要并存为 Markdown,本地小模型还会清理口头禅与自我更正。语音模型基于 WhisperKit、清理模型基于 LLM.swift,模型从 Hugging Face 一次性下载后本地缓存。要求 macOS 14+、Apple Silicon,MIT 开源、免费。

⭐ 1,894 Stars 🍴 91 Forks Swift 作者: matthartman
来源:README 顶部简介、Features、How it works、GitHub meta(matthartman/ghost-pepper,Swift,MIT) 查看 GitHub 仓库 →

为什么值得关注

语音转文字与会议转录工具很多,但多数把音频发往云端,隐私敏感场景不放心;而本地方案过去要么慢、要么质量差。随着 Apple Silicon + WhisperKit/Qwen 等模型成熟,Ghost Pepper 把「完全本地、质量够用、还自带清理与摘要」做成一个免费开源、装了就用的菜单栏应用,并专门提供可验证的隐私审计(PRIVACY_AUDIT.md,让你用 Claude Code 自查代码)。作者还自嘲「别人融了 8000 万美元做的东西,这里免费给」。这种「隐私优先 + 免费开源 + 体验顺手」的定位使它受到关注(约 2,700 星)。

来源:README Why Ghost Pepper/Privacy audit、GitHub meta(stars 2689、created_at 2026-03-20)

核心功能

按住 Control 说话即转写粘贴

全局快捷键:按住 Control 说话、松开后自动转写并把文字粘贴进当前任意文本框,适合随手口述输入。

来源:README Features「Hold Control to talk」
本地会议转录与 AI 摘要

录制通话/会议,生成笔记、转录与 AI 摘要并保存为 Markdown,分块转录、文件存本地磁盘,全程不上云。

来源:README Features「Meeting transcription」、Privacy audit
本地清理与多模型可选

本地小 LLM 自动去除口头禅、处理自我更正;语音模型可选 Whisper tiny/small(.en)、Whisper small 多语言、Parakeet v3(25 语言)、Qwen3-ASR 0.6B(50+ 语言),清理模型可选 Qwen3.5 0.8B/2B/4B,按速度/质量权衡,模型自动下载缓存。

来源:README Features「Smart cleanup」、How it works(Speech/Cleanup models 表)
菜单栏常驻与可定制

作为菜单栏应用运行(无 Dock 图标、可登录启动),可编辑清理提示词、选择麦克风、按需开关各功能;转录历史与录音仅存本机、可随时清除。

来源:README Features「Menu bar app」「Customizable」、Good to know
可验证的隐私设计

每个核心功能都本地运行并附隐私审计:语音转写(WhisperKit/FluidAudio)、清理(Qwen via LLM.swift)、录音(AVAudioEngine+ScreenCaptureKit)、摘要、OCR(Apple Vision)、存储均本地,仅本地 UserDefaults 计数、无任何第三方追踪 SDK;可云的 Zo/Trello/Granola 等默认关闭、需自带 key。提供 PRIVACY_AUDIT.md 供你用 Claude 自查。

来源:README Privacy audit 表与 Optional cloud features 说明

技术架构

Ghost Pepper 是一个原生 macOS 应用(Swift,Xcode 工程 GhostPepper.xcodeproj),常驻菜单栏。语音转文字由 WhisperKit(Whisper 系列)与 FluidAudio(Parakeet)驱动,多语言可选 Qwen3-ASR;文本清理与摘要由 LLM.swift 跑本地 Qwen3.5 模型;录音用 AVAudioEngine + ScreenCaptureKit,OCR/截屏用 Apple Vision;更新走 Sparkle。模型从 Hugging Face 一次性下载、本地缓存。全局热键与「模拟按键粘贴」需要 Accessibility 权限、录音需 Microphone 权限。仓库还含 CleanupModelProbe(Support)(清理模型探测)、Config/、scripts/、GhostPepperTests/、docs/ 等。会议笔记/转录/摘要以 Markdown 落本地磁盘,使用计数仅存 UserDefaults,无遥测 SDK。

来源:README How it works/Privacy audit/Permissions/Acknowledgments、仓库目录树(GhostPepper.xcodeproj、CleanupModelProbe、Config、scripts)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) WhisperKit(语音转文字)+ FluidAudio(Parakeet)WhisperKit(语… LLM.swift(本地清理/摘要 LLM)LLM.swift(本地… Whisper / Parakeet v3 / Qwen3-ASR(语音模型,Hugging Face)Whisper / Para… Qwen3.5 0.8B/2B/4B(清理模型)Qwen3.5 0.8B/2… Apple Vision(OCR)、ScreenCaptureKit/AVAudioEngine(录音)、Sparkle(更新)Apple Vision(… 按住 Control 说话即转写粘贴按住 Control 说话即… 本地会议转录与 AI 摘要 本地清理与多模型可选 菜单栏常驻与可定制 可验证的隐私设计 ghost-pepper 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Swift框架原生 macOS 应用(菜单栏)
WhisperKit(语音转文字)+ FluidAudio(Parake…LLM.swift(本地清理/摘要 LLM)Whisper / Parakeet v3 / Qwen3-ASR(语音…Qwen3.5 0.8B/2B/4B(清理模型)Apple Vision(OCR)、ScreenCaptureKit/A…
本地运行、无云依赖;macOS 14.0+、Apple Silicon(M1+);模型一次性从 HF 下载缓存;需 Microphone 与 Accessibility 权限
来源:README How it works/Acknowledgments/Permissions、徽章(macOS 14+/Apple Silicon)

快速上手

下载 [GhostPepper.dmg](https://github.com/matthartman/ghost-pepper/releases/latest),打开后把 Ghost Pepper 拖进 Applications,授予麦克风与辅助功能(Accessibility)权限,按住 Control 说话即可。macOS Sequoia 首次打开若提示「Apple 无法验证」,到 系统设置>隐私与安全性 拉到底点 Open Anyway 并确认(仅需一次)。也可从源码构建:克隆仓库、用 Xcode 打开 GhostPepper.xcodeproj,Cmd+R 运行。需 macOS 14.0+ 与 Apple Silicon。模型首次使用自动从 Hugging Face 下载。企业/受管设备可由 IT 通过 MDM 的 PPPC 配置预授权 Accessibility(README 给了 Bundle ID/Team ID)。
来源:README Getting started/Permissions/Enterprise 段

使用场景

适合注重隐私、想完全本地做语音转写与会议记录的 macOS 用户:随手按住 Control 口述输入到任何应用、把会议/通话录下来自动转录并生成 Markdown 笔记与摘要、用本地清理去掉口头禅让文字更干净。尤其适合处理敏感内容(医疗、法务、内部会议)或离线环境——所有处理都在机器上完成、可代码审计。对开发者,它也是用 WhisperKit + LLM.swift 在 Apple Silicon 上做本地语音 AI 应用的参考实现。

来源:README Features/Privacy audit、Why Ghost Pepper

优势与局限

优势

  • 真·隐私优先:语音转写、清理、录音、摘要、OCR、存储全部本地,无遥测 SDK,且提供可自查的隐私审计文档。
  • 免费开源(MIT)、体验顺手:菜单栏常驻、按住即说、自动粘贴,还有本地清理与会议摘要,覆盖日常口述与会议两大场景。
  • 模型可选、质量够用:多档语音/清理模型按速度与质量权衡,多语言支持(最高 Qwen3-ASR 50+ 语言)。
  • 对企业友好:提供 MDM/PPPC 预授权 Accessibility 的方案,便于受管设备部署。

局限

  • 平台受限:仅 macOS 14+、Apple Silicon,Intel Mac 与其它系统无法使用。
  • 需较敏感的系统权限:Accessibility(全局热键+模拟粘贴)与麦克风,且应用未公证首次需手动放行 Gatekeeper。
  • 本地模型有资源/速度权衡:高质量多语言或大清理模型占用更多空间与时间(清理 4B 约 5–7s),低端机体验有限。
  • 可云的集成(Zo/Trello/Granola)需自带 API key,部分高级模型(Qwen3-ASR)要 macOS 15+。
来源:README How it works/Permissions/Privacy audit/Getting started 的限制说明

最新版本

通过 GitHub Releases 提供 macOS DMG,并用 Sparkle 自动更新。功能已覆盖按住说话转写粘贴、会议转录与 AI 摘要、本地清理、多档语音/清理模型与可验证的隐私审计。MIT 开源、免费。仓库最近一次更新在 2026-05-21。

来源:README Getting started/Acknowledgments、GitHub meta pushed_at 2026-05-21、created_at 2026-03-20

总结评价

Ghost Pepper 把「完全本地的语音转写与会议转录」做成了一个免费、开源、体验顺手的 macOS 菜单栏应用:按住 Control 即说即贴、会议自动转录加 AI 摘要、本地小模型还帮你清理口头禅,且关键是所有处理都在机器上完成、附带可自查的隐私审计。对注重隐私、常处理敏感语音内容或想离线工作的 Mac 用户,它几乎是首选,也是用 WhisperKit+LLM.swift 做本地语音 AI 的好范例。约束也清楚——仅支持 Apple Silicon 的较新 macOS、需要麦克风与辅助功能权限、本地模型有速度/空间权衡。作为「隐私优先、免费替代付费语音应用」的工具,它的定位与完成度都很扎实。

来源:综合 README、How it works、Privacy audit 与 GitHub meta 的事实判断
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-23 19:02. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件