js文字识别OCR，由谷歌开源，支持任何语言Tesseract

Tesseract.js是一个JavaScript库，是由谷歌开源的一个库，是Tesseract的js版本。可以从图像中获取几乎任何语言的单词。包括：图像识别、视频实时识别。

Tesseract.js包装了Tesseract OCR引擎的Webassembly端口。它在浏览器中使用 webpack 或带有 CDN 的纯脚本标签，并使用 Node.js 在服务器上工作。

同时支持多种语言，例如：英语和繁体中文的eng+chi_tra
支持的图像格式：png，jpg，bmp，pbm
支持WebAssembly
支持打字稿
为支持的设备添加了支持 SIMD 的构建
添加了旋转预处理选项（包括自动旋转），可显著提高精度
现在可以检索处理后的图像（旋转、灰度、二进制）
改进了对并行处理（调度程序）的支持
createWorker是异步的getPDF功能被识别选项取代pdf
支持多线程

以下是识别效果

识别前原图

识别结果

使用方法

安装

Tesseract.js通过本地副本或CDN使用标签，通过Node和在Node上使用webpack.js使用。

npm方式

# For latest version
npm install tesseract.js
yarn add tesseract.js

# For old versions
npm install tesseract.js@3.0.3
yarn add tesseract.js@3.0.3

安装后使用

方式1：

import Tesseract from 'tesseract.js';

Tesseract.recognize(
  'https://tesseract.projectnaptha.com/img/eng_bw.png',
  'eng',
  { logger: m => console.log(m) }
).then(({ data: { text } }) => {
  console.log(text);
})

方式2：

import { createWorker } from 'tesseract.js';

const worker = await createWorker({
  logger: m => console.log(m)
});

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png');
  console.log(text);
  await worker.terminate();
})();

在浏览器环境中，只需提供 API 层。在内部，它会打开一个 Web Worker 来处理请求。该工作线程本身从 Emscripten 构建的代码加载代码，该代码本身托管在 CDN 上。然后，它会动态加载托管在另一个 CDN 上的语言文件。tesseract.jstesseract.js-core

因此，我们建议从 CDN 加载。但是，如果您确实需要将所有文件放在本地，则可以传递额外的参数来指定工作线程、语言和核心的自定义路径。tesseract.jsTesseractWorker

在 Node.js 环境中，您可能想要自定义的唯一路径是 languages/langPath。

Tesseract.recognize(image, langs, {
  workerPath: 'https://unpkg.com/tesseract.js@v4.0.1/dist/worker.min.js',
  langPath: 'https://tessdata.projectnaptha.com/4.0.0',
  corePath: 'https://unpkg.com/tesseract.js-core@v4.0.1/tesseract-core.wasm.js',
})

或

const worker = await createWorker({
  workerPath: 'https://unpkg.com/tesseract.js@v4.0.1/dist/worker.min.js',
  langPath: 'https://tessdata.projectnaptha.com/4.0.0',
  corePath: 'https://unpkg.com/tesseract.js-core@v4.0.1/tesseract-core.wasm.js',
});

展开阅读全文

页面更新：2024-04-23

标签：语言线程路径选项图像加载文字标签代码方式工作