Koharu 是一个用 Rust 编写、ML 驱动的漫画翻译工具,主打本地优先(local-first)的翻译工作流:把文本区域/对话气泡检测、OCR、修复(inpainting 抹掉原文字)、LLM 翻译、CJK 竖排与 RTL 文本渲染等串成一条自动化流水线。底层用 candle 与 llama.cpp 做高性能推理、用 Tauri 做桌面应用,所有组件均为 Rust,强调视觉模型与 LLM 都在本机运行以保护隐私。它还能导出带可编辑文字图层的 PSD、内置本地 HTTP API 与 MCP 服务器供自动化,并支持无头(headless)模式。GPL-3.0 开源、约 4,500 星。
来源:README 顶部简介/Features/Usage、GitHub meta(mayocream/koharu,Rust,GPL-3.0,homepage koharu.rs) 查看 GitHub 仓库 →漫画翻译过去要在多个工具间手动完成「框字→识别→抹字→翻译→排版」,门槛高又繁琐;而把这条流程用 ML 自动化、且能完全在本地跑(隐私、不依赖云)是很有吸引力的组合。Koharu 用纯 Rust + candle/llama.cpp 实现高性能本地推理,覆盖检测、OCR、修复、翻译到竖排渲染与 PSD 导出全流程,还提供 MCP/HTTP API 便于自动化,定位清晰、工程扎实,并有 Trendshift 曝光与多语言文档,因此受到关注(约 4,500 星,迭代活跃)。
来源:README 顶部简介/Features、GitHub meta(stars 4454、created_at 2025-04-09、pushed_at 2026-05-23)自动检测文本区域、对话气泡与清理蒙版,并对漫画对白、说明文字等做 OCR,省去手动框选与誊写。
来源:README Features(detection、OCR)用 inpainting 抹掉页面上的原文字(lettering),再用本地或远程 LLM 后端做翻译;视觉模型与 LLM 默认在本机运行以保护数据隐私。
来源:README Features(Inpainting、Translation)、隐私 Note支持 CJK 竖排与 RTL 的高级文本渲染,把译文排回页面;并提供 Codex image-to-image 生成,从源图与提示做端到端整页重绘。
来源:README Features(text rendering、Codex image-to-image)可把当前页导出为压平的渲染图,或带图层的 Photoshop PSD——PSD 保留辅助图层并把译文写成可编辑文字图层,方便后续手工精修。
来源:README Features/Export 段内置本地 HTTP API 与 MCP 服务器供本地 agent 集成(`koharu --port 9999` 后连 http://localhost:9999/mcp);支持无头模式(--headless)只起服务、用网页客户端连接,便于脚本化与批处理。
来源:README MCP Server/Headless Mode 段Koharu 是一个纯 Rust 的多 crate 工作区,桌面端用 Tauri。仓库按职能拆分:koharu-core/(核心流程)、koharu-ml/(视觉模型:检测/OCR/修复)、koharu-llm/(LLM 翻译)、koharu-ai/、koharu-renderer/(文本渲染,含竖排/RTL)、koharu-psd/(PSD 导出)、koharu-rpc/、koharu-runtime/、koharu-app/ 与 koharu/(应用与 CLI)、ui/(前端)、docs/、scripts/、tests/。推理用 candle(HF 的 Rust 张量库)跑视觉模型、llama.cpp 跑 LLM,默认都在本地。运行形态多样:GUI 桌面应用、无头模式(--headless 起服务 + 网页客户端)、以及内置的 HTTP API 与 MCP 服务器(可 --port 固定端口)供自动化与 agent 集成。整条流水线把检测→OCR→修复→翻译→渲染→导出连起来,PSD 导出保留可编辑文字图层衔接后期。
来源:README 顶部/Usage/MCP/Headless、仓库目录树(koharu-core/ml/llm/renderer/psd/rpc/runtime/app、ui、tests)中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
candle(HuggingFace Rust 推理,视觉模型)llama.cpp(LLM 推理)本地/远程 LLM 后端(翻译)PSD 导出、MCP 服务器、HTTP API适合漫画汉化/翻译爱好者与团队,想用一个本地工具把「检测→OCR→抹字→翻译→竖排排版→导出」自动化:自动识别气泡与文字、抹掉原文、用本地或远程 LLM 翻译、把译文按 CJK 竖排/RTL 排回页面,并导出带可编辑文字图层的 PSD 给后期精修;或用 MCP/HTTP API 与无头模式做批量与 agent 化处理。注重隐私、想离线处理的人尤其合适。需要注意:翻译/再分发受版权保护的漫画涉及法律风险,应仅用于获授权或合规的用途。
来源:README Features/Usage/Export、隐私 NoteKoharu 通过 GitHub Releases 分发桌面安装包(README 含累计下载量徽章),迭代活跃。功能已覆盖检测/OCR/修复/翻译/竖排渲染、Codex 图生图重绘、PSD 导出、本地 HTTP API、MCP 服务器与无头模式。GPL-3.0 开源,文档在 koharu.rs(含日/中文)。仓库最近一次更新在采集日当天(2026-05-23)。
来源:README 顶部/Features、GitHub meta pushed_at 2026-05-23Koharu 是漫画翻译工具里少见地「全流程自动化 + 本地优先 + 纯 Rust」的作品:检测、OCR、抹字、LLM 翻译、CJK 竖排渲染到带可编辑图层的 PSD 导出一条龙,且视觉模型与 LLM 都能在本机跑、保护隐私,还提供 MCP/HTTP API 与无头模式方便自动化。对漫画汉化爱好者与团队,它能把繁琐流程大幅简化,工程质量也高。要权衡的是翻译/再分发受版权作品的法律风险、本地模型的硬件与质量权衡、复杂版式仍需人工精修,以及 GPL 的商用约束。在合规用途下,它是一个完成度很高的本地漫画翻译方案。
来源:综合 README、Features、架构与 GitHub meta 的事实判断