naptha/tesseract.js

⭐ 37,983 Stars 🍴 2,365 Forks JavaScript Apache-2.0

Tesseract.js 是一个纯 JavaScript OCR 库,支持多种语言,可在浏览器和 Node.js 环境中运行,用于从图像中提取文字。

来源:据 README 描述 查看 GitHub 仓库 →

为什么值得关注

Tesseract.js 受关注的原因包括其跨平台支持、多种语言支持、易于使用以及与 Tesseract OCR 引擎的紧密集成。它填补了在浏览器和 Node.js 环境中处理 OCR 任务的空白,并提供了独特的 JavaScript 实现。

来源:综合 README 描述和项目特征

核心功能

多语言支持

Tesseract.js 支持超过 100 种语言,能够处理多种语言的 OCR 任务。

来源:据 README 描述
浏览器和 Node.js 支持

Tesseract.js 可在浏览器和 Node.js 环境中运行,提供灵活的部署选项。

来源:据 README 描述
简单易用

通过简单的 API 调用即可实现 OCR 功能,易于集成到现有项目中。

来源:据 README 描述

技术架构

Tesseract.js 采用模块化设计,代码结构清晰。它使用 WebAssembly 将 Tesseract OCR 引擎集成到 JavaScript 中,并通过模块化的方式提供不同的功能。数据通过 API 调用在客户端和服务器之间流转。

来源:代码目录结构 + 依赖文件

技术栈

infra: Node.js, CDN  |  key_deps: tesseract.js-core, node-fetch, express  |  language: JavaScript  |  framework: Webpack, ESM

来源:依赖文件 + 代码目录结构

快速上手

npm install tesseract.js import { createWorker } from 'tesseract.js'; (async () => { const worker = await createWorker('eng'); const ret = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png'); console.log(ret.data.text); await worker.terminate();})();
来源:README Installation/Quick Start

使用场景

Tesseract.js 适用于需要从图像中提取文字的各种场景,例如:文档扫描、图像识别、数据提取等。

来源:README

优势与局限

优势

  • 优势1:跨平台支持,可在浏览器和 Node.js 环境中运行
  • 优势2:支持多种语言,适用于全球用户
  • 优势3:易于使用,API 简洁明了

局限

  • 局限1:不直接支持 PDF 文件,需要额外处理
  • 局限2:不修改 Tesseract 的核心功能,可能无法满足所有高级需求
来源:综合 README、代码结构和依赖分析

最新版本

v7.0.0 (2025-12-15): Significant improvements to recognition speed

来源:GitHub Releases

总结评价

Tesseract.js 是一个值得关注的 OCR 库,特别适合需要快速、灵活地从图像中提取文字的开发者。它适用于各种场景,如文档扫描、图像识别和数据提取等。

来源:综合分析
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间:2026-04-14 06:30。质量评分:85/100。 所有结论均标注了数据来源。如发现不准确之处,欢迎反馈。

数据来源: README、GitHub API、依赖文件