koharu 是什么?

Koharu 是一个用 Rust 编写、ML 驱动的漫画翻译工具,主打本地优先(local-first)的翻译工作流:把文本区域/对话气泡检测、OCR、修复(inpainting 抹掉原文字)、LLM 翻译、CJK 竖排与 RTL 文本渲染等串成一条自动化流水线。底层用 candle 与 llama.cpp 做高性能推理、用 Tauri 做桌面应用,所有组件均为 Rust,强调视觉模型与 LLM 都在本机运行以保护隐私。它还能导出带可编辑文字图层的 PSD、内置本地 HTTP API 与 MCP 服务器供自动化,并支持无头(headless)模式。GPL-3.0 开源、约 4,500 星。

⭐ 2,371 Stars 🍴 124 Forks Rust 作者: mayocream
来源:README 顶部简介/Features/Usage、GitHub meta(mayocream/koharu,Rust,GPL-3.0,homepage koharu.rs) 查看 GitHub 仓库 →

为什么值得关注

漫画翻译过去要在多个工具间手动完成「框字→识别→抹字→翻译→排版」,门槛高又繁琐;而把这条流程用 ML 自动化、且能完全在本地跑(隐私、不依赖云)是很有吸引力的组合。Koharu 用纯 Rust + candle/llama.cpp 实现高性能本地推理,覆盖检测、OCR、修复、翻译到竖排渲染与 PSD 导出全流程,还提供 MCP/HTTP API 便于自动化,定位清晰、工程扎实,并有 Trendshift 曝光与多语言文档,因此受到关注(约 4,500 星,迭代活跃)。

来源:README 顶部简介/Features、GitHub meta(stars 4454、created_at 2025-04-09、pushed_at 2026-05-23)

核心功能

自动检测 + OCR

自动检测文本区域、对话气泡与清理蒙版,并对漫画对白、说明文字等做 OCR,省去手动框选与誊写。

来源:README Features(detection、OCR)
修复与本地/远程 LLM 翻译

用 inpainting 抹掉页面上的原文字(lettering),再用本地或远程 LLM 后端做翻译;视觉模型与 LLM 默认在本机运行以保护数据隐私。

来源:README Features(Inpainting、Translation)、隐私 Note
高级文本渲染与图生图重绘

支持 CJK 竖排与 RTL 的高级文本渲染,把译文排回页面;并提供 Codex image-to-image 生成,从源图与提示做端到端整页重绘。

来源:README Features(text rendering、Codex image-to-image)
PSD 导出(可编辑文字图层)

可把当前页导出为压平的渲染图,或带图层的 Photoshop PSD——PSD 保留辅助图层并把译文写成可编辑文字图层,方便后续手工精修。

来源:README Features/Export 段
本地 API、MCP 服务器与无头模式

内置本地 HTTP API 与 MCP 服务器供本地 agent 集成(`koharu --port 9999` 后连 http://localhost:9999/mcp);支持无头模式(--headless)只起服务、用网页客户端连接,便于脚本化与批处理。

来源:README MCP Server/Headless Mode 段

技术架构

Koharu 是一个纯 Rust 的多 crate 工作区,桌面端用 Tauri。仓库按职能拆分:koharu-core/(核心流程)、koharu-ml/(视觉模型:检测/OCR/修复)、koharu-llm/(LLM 翻译)、koharu-ai/、koharu-renderer/(文本渲染,含竖排/RTL)、koharu-psd/(PSD 导出)、koharu-rpc/、koharu-runtime/、koharu-app/ 与 koharu/(应用与 CLI)、ui/(前端)、docs/、scripts/、tests/。推理用 candle(HF 的 Rust 张量库)跑视觉模型、llama.cpp 跑 LLM,默认都在本地。运行形态多样:GUI 桌面应用、无头模式(--headless 起服务 + 网页客户端)、以及内置的 HTTP API 与 MCP 服务器(可 --port 固定端口)供自动化与 agent 集成。整条流水线把检测→OCR→修复→翻译→渲染→导出连起来,PSD 导出保留可编辑文字图层衔接后期。

来源:README 顶部/Usage/MCP/Headless、仓库目录树(koharu-core/ml/llm/renderer/psd/rpc/runtime/app、ui、tests)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) candle(HuggingFace Rust 推理,视觉模型)candle(Huggin… llama.cpp(LLM 推理)llama.cpp(LLM… 本地/远程 LLM 后端(翻译)本地/远程 LLM… PSD 导出、MCP 服务器、HTTP APIPSD 导出、MCP… 自动检测 + OCR 修复与本地/远程 LLM 翻译修复与本地/远程 LLM… 高级文本渲染与图生图重绘高级文本渲染与图生图重… PSD 导出(可编辑文字图层)PSD 导出(可编辑文字… 本地 API、MCP 服务器与无头模式本地 API、MCP 服务器… koharu 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Rust框架Tauri(桌面应用)+ 多 crate 工作区
candle(HuggingFace Rust 推理,视觉模型)llama.cpp(LLM 推理)本地/远程 LLM 后端(翻译)PSD 导出、MCP 服务器、HTTP API
本地运行(视觉模型与 LLM 在本机),桌面 GUI / 无头服务 / MCP;GitHub Releases 分发,支持 GPU
来源:README 顶部简介/Features/Usage、GitHub topics(gpu/tauri)

快速上手

从官网安装指南(koharu.rs/how-to/install-koharu)或 GitHub Releases 下载安装。GUI:启动后导入漫画页,工具栏用快捷键操作(V 选择、M 框选、B 画笔、E 橡皮、R 修复笔、[/] 调笔刷、Ctrl+Z 撤销等),自动检测+OCR+修复+翻译后用渲染把译文排回,再按需导出渲染图或带可编辑文字图层的 PSD。自动化:`koharu --port 9999` 起 MCP 服务器,客户端连 http://localhost:9999/mcp;无头模式 `koharu --port 4000 --headless` 后用网页客户端连 http://localhost:4000。视觉模型与 LLM 默认本地运行。
来源:README Getting Started/Usage/Export/MCP/Headless 段

使用场景

适合漫画汉化/翻译爱好者与团队,想用一个本地工具把「检测→OCR→抹字→翻译→竖排排版→导出」自动化:自动识别气泡与文字、抹掉原文、用本地或远程 LLM 翻译、把译文按 CJK 竖排/RTL 排回页面,并导出带可编辑文字图层的 PSD 给后期精修;或用 MCP/HTTP API 与无头模式做批量与 agent 化处理。注重隐私、想离线处理的人尤其合适。需要注意:翻译/再分发受版权保护的漫画涉及法律风险,应仅用于获授权或合规的用途。

来源:README Features/Usage/Export、隐私 Note

优势与局限

优势

  • 全流程自动化且本地优先:检测、OCR、修复、翻译、竖排渲染、PSD 导出一条龙,视觉模型与 LLM 都在本机跑、保护隐私。
  • 纯 Rust + candle/llama.cpp + Tauri,性能与安全兼顾,模块化清晰、支持 GPU。
  • 对后期友好:PSD 导出保留可编辑文字图层;并提供 MCP/HTTP API 与无头模式便于自动化与 agent 集成。
  • 文档齐全(多语言)、迭代活跃,GPL-3.0 开源。

局限

  • 版权与合规:翻译并再分发受版权保护的漫画存在法律风险,应仅用于授权或合法用途。
  • 本地模型有硬件/质量权衡:本地视觉模型与 LLM 的翻译质量、速度受机器与所选模型影响,复杂版式仍需人工精修。
  • GPL-3.0 强 copyleft,二次开发分发需遵循其义务。
  • 自动检测/OCR/修复对复杂背景、艺术字或低质量扫描可能出错,需人工校对。
来源:README Features/Export、License(GPL-3.0)、本地推理与版权考量

最新版本

Koharu 通过 GitHub Releases 分发桌面安装包(README 含累计下载量徽章),迭代活跃。功能已覆盖检测/OCR/修复/翻译/竖排渲染、Codex 图生图重绘、PSD 导出、本地 HTTP API、MCP 服务器与无头模式。GPL-3.0 开源,文档在 koharu.rs(含日/中文)。仓库最近一次更新在采集日当天(2026-05-23)。

来源:README 顶部/Features、GitHub meta pushed_at 2026-05-23

总结评价

Koharu 是漫画翻译工具里少见地「全流程自动化 + 本地优先 + 纯 Rust」的作品:检测、OCR、抹字、LLM 翻译、CJK 竖排渲染到带可编辑图层的 PSD 导出一条龙,且视觉模型与 LLM 都能在本机跑、保护隐私,还提供 MCP/HTTP API 与无头模式方便自动化。对漫画汉化爱好者与团队,它能把繁琐流程大幅简化,工程质量也高。要权衡的是翻译/再分发受版权作品的法律风险、本地模型的硬件与质量权衡、复杂版式仍需人工精修,以及 GPL 的商用约束。在合规用途下,它是一个完成度很高的本地漫画翻译方案。

来源:综合 README、Features、架构与 GitHub meta 的事实判断
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-23 19:21. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件