文字识别OCR开源框架的对比--Tesseract vs EasyOCR-技术圈

前言：

OCR文字识别在目前有着比较好的应用，也出现了很多的文字识别软件，但软件是面向用户的。对于我们技术人员来说，有时难免需要在计算机视觉任务中加入文字识别，如车牌号识别，票据识别等，因此软件对我们是没用的，我们需要自己实现文字识别。

在文字识别方面，主要有两款主流的开源框架Tesseract和EasyOCR。本文讨论了Tesseract和EasyOCR使用Python API之间的主要区别，包括安装、使用示例、准确率和推理速度方面的对比。

使用示例

Tesseract

安装: pip install pytesseract pillow

使用示例：

from PIL import Image



import pytesseract



text=pytesseract.image_to_string(Image.open(filename))



print(text)

这只是一个简单的使用示例，在实际应用中，图像并非理想情况，还需要对图像进行一定的预处理以更好地识别。如去除椒盐噪声，去除干扰物，如在车牌识别中还会利用矩形框检测框出车牌所在位置，并放大，以更好地进行车牌号识别。

EasyOCR

安装：pip install easyocr

使用示例

import easyocr



reader = easyocr.Reader(['ch_sim', 'en'])



text = reader.readtext('filename')



print(text)

注：easyocr还会输出文字在图片中的坐标。

准确率

在参考链接[2]中进行了一项实验，使用1000张含字母的图片和1000张含数字的图片分别使用Tesseract和EasyOCR进行测试。

含字母的输入图像如下图所示：

含数字的输入图像如下图所示：

经过测试得出下面两个开源框架的准确率对比

如上图所示，Tesseract 在字母识别方面做得更好，而 EasyOCR 在数字识别方面做得更好。

此外，它们在识别某些字符时存在完全不同的问题。例如，Tesseract倾向于将诸如29977.23之类的东西识别为2997.23，或者将carrier识别为 cartier。另一方面，EasyOCR更有可能将94268.1识别为94268，或者advances识别为 atvances。这两个单词识别的举例表明这两个框架对单个字母的识别倾向。