Python--文字识别--Tesseract

共 1280字，需浏览 3分钟

·

2022-02-09 17:41

1.介绍

Tesseract 是一个 OCR 库,目前由 Google 赞助(Google 也是一家以 OCR 和机器学习技术闻名于世的公司)。Tesseract 是目前公认最优秀、最精确的开源 OCR 系统。除了极高的精确度,Tesseract 也具有很高的灵活性。它可以通过训练识别出任何字体，也可以识别出任何 Unicode 字符。

2.安装

以下所有都是在mac上安装实现的

//安装tesseract的同时安装训练工具

brew install --with-training-tools tesseract



//安装tesseract的同时安装所有语言，语言包比较大，如果安装的话时间较长，建议不安装，按需选择

brew install  --all-languages tesseract



//安装tesseract，并安装训练工具和语言

brew install --all-languages --with-training-tools tesseract 



//只安装tesseract，不安装训练工具

brew install  tesseract

3.下载语言库

下载地址:tesseract-ocr/tessdata

默认自带的是英语

根据自己的需求选择所要的语言库，在这里我们选择的是简体中文所以选择的库是：chi_sim.traineddata

将文件拷贝到到：/usr/local/Cellar/tesseract/(你下载的版本号)/share/tessdata目录下。

4.Tesseract的命令行使用

一般使用:

//默认使用eng文字库， imgName是图片的地址，result识别结果

tesseract imgName result

指定语言:

//指定使用简体中文

tesseract -l chi_sim imgName result



//查看本地存在的语言库

tesseract --list-langs

指定多语言:

//指定多语言，用+号相连

tesseract -l chi_sim+eng imgName result

5.Tesseract在Python中使用

通过 pip 安装支持Python 版本的 Tesseract库

pip install pytesseract

通过Python代码的简单实现

import pytesseract

from PIL import Image



image = Image.open('/Users/admin/Desktop/test.jpg')

text = pytesseract.image_to_string(image)

print text

是爬虫中的验证码的识别,可以通过更换别人训练好的语言包来识别.如果想自己通过训练来获得语言包也是可以的.

6.Tesseract训练

这里放个官方文档,等我练好了再分享

[tesseract-ocr/tesseract](tesseract-ocr/tesseract)

[更多内容](ztfDeveloper的博客 - CSDN博客)

浏览 22

点赞

收藏

分享

举报

评论

图片

表情

使用Tesseract做文字识别（OCR）

前言 OCR（optical character recognition，光学字符识别）是指直接将包含文本的图像识别为计算机文字（计算机黑白点阵）的技术。图像中的文本一般为印刷体文本。 Tesseract是github上的OCR开源库，今天我将使用Tesseract来进行文字识别。安装TESSERACT 安装Tesseract挺简单的，直接按照官网上安装方法安装即可。安装完记得配一下环境变量。 Tesseract官网我是在Win10下安装的，打开命令行，输入tesseract -v查看Tesseract版本号，输出以下信息表示安装成功：用TESSERACT做文字识别现在我使用Tesseract来识别下面图

金山云文字识别（KOCR）基于业界领先的深度学习技术，可将图片中的文字内容智能识别为可编辑的文本，支持通用类、票据类、卡证类等多场景的文本识别，支持提供定制化服务，实现信息录入效率的有效提升

[cp]所谓的移动警务通，移动端证件识别信息采集是指，使用成熟的OCR文字识别技术，通过手机或者带有摄像头的终端设备对身份证在做视频流扫描识别，提取证件的照片做OCR文字识别，实现提取身份证信息，裁剪头像，并且存入证件信息数据库，不仅集合了身份证识别还包括驾驶证识别，行驶证识别，护照识别、港澳台胞证识别等。优点是：方案成本低，用于智能移动设备，使用环境方便，功能容易扩展。可提供SDK做二次开发（现在可以提供安卓、iOS、私有云、公有云等的证件识别SDK）证件识别应用场景：出租屋证件识别：入住旅客登记流动人口管理：入户普查特种行业：开锁业、家政、中介等行业证件识别登记展会、访

印刷文字识别-通用文字识别/OCR文字识别-极速数据

可识别一般的网络图片，返回图片中的文本信息。

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

前言： OCR文字识别在目前有着比较好的应用，也出现了很多的文字识别软件，但软件是面向用户的。对于我们技术人员来说，有时难免需要在计算机视觉任务中加入文字识别，如车牌号识别，票据识别等，因此软件对我们是没用的，我们需要自己实现文字识别。在文字识别方面，主要有两款主流的开源框架Tesseract和EasyOCR。本文讨论了Tesseract和EasyOCR使用Python API之间的主要区别，包括安装、使用示例、准确率和推理速度方面的对比。使用示例 Tesseract 安装: pip install pytesseract pillow 使用示例： from PIL import Image import py

文字识别经验

整个文字识别的算法流程可以分成四部分：预处理、文本行检测、文字识别、后处理。预处理包括图像方向校正（例如图像偏转90度，倒置）、文本行校正、图像质量增强（例如去除屏拍摩尔纹等）。预处理是为了处理特殊情况、提高检测和识别的精度。文本行检测目前以EAST和PSENET比较常见，目前来看，psenet精度更高，适用的场景丰富，对于文本行比较密集的场景和弯曲文本性能更优，但是psenet速度低于EAST，尤其是文本行越多，后处理占用时间较长。对于单字符情况，psenet的文本框的置信度较低，在较高置信度阈值时，容易导致最终检测不到，而较小的阈值容易引入噪声，所以需要根据具体场景设置一个合理的阈值。对于文本行识别，CRNN、attention

印刷文字识别-名片识别/OCR文字识别-极速数据

通过POST上传base64格式的图片内容，可识别图片中的名片信息，返回姓名、职务、手机、公司、地址、电话、传真、邮箱、网址、邮编等信息。

文字识别简介

现在电脑、电子书可以帮助我们在网络上搜集资料，但当我们需要的资料在一些有权限的网站无法复制、下载时，大家都采用截图的方式保存资料，那后期这图片上的文字该怎么保存呢，一个字一个字的敲打整理，显然太耗时耗力，这时，OCR图文识别技术出现了，我们可以直接通过图片转文字的方式将文字整理出来。采用OCR文字识别技术实现资料的随时调用和检索，只需将需识别文字的图片上传到文字识别系统即可，对识别结果也可校对，识别速度快，应用这项OCR技术也可减少对史料的损坏以及增加资料的利用率等。OCR图文识别技术，帮助人们解决录入图片文字提取难题。文字识别包括图片OCR文字识别、视频OCR文字识别、场景文字OCR识别等。且支持PDF、BM

Python-文字识别

首先还是要安装tesseract OCR，即Optical Character Recognition，光学字符识别，谷歌开发的，在免费库中还是非常友好的，应用场景比较多，比如在爬取数据时可以识别验证码等，我是因为有一大批扫描文件需要转换成Excel，研究了一下，中间也遇到了很多问题，接下来可以带大家入个门。第一步需要下载tesseract OCR安装包（百度网上很多资源，如果搜到CSDN分析的文章里边的下载地址还是比较靠谱的，如果懒得百度可以后台私信无偿发你），还是注意安装位置，后边要设置环境变量第二步下载语言包，可以搜索已经训练好的现成的语言包（GitHub官方搜索下载，如果下载不下来可以百度或者后台私信无偿

印刷文字识别_车牌识别_车牌OCR文字识别_车牌图像识别_新能源车牌识别_OCR文字识别

深圳华辰网络科技有限公司

点赞

收藏

分享

举报