PaddleOCR基于飞桨的 OCR 工具库

联合创作 · 2023-09-26 05:40

PaddleOCR是基于飞桨的OCR工具库，包含总模型仅8.6M的超轻量级中文OCR，单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

## CPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle

## GPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。

特性

超轻量级中文OCR，总模型仅8.6M
- 单模型支持中英文数字组合识别、竖排文本识别、长文本识别
- 检测模型DB（4.1M）+识别模型CRNN（4.5M）
多种文本检测训练算法，EAST、DB
多种文本识别训练算法，Rosetta、CRNN、STAR-Net、RARE

支持的中文模型列表:

模型名称	模型简介	检测模型地址	识别模型地址
chinese_db_crnn_mobile	超轻量级中文OCR模型	inference模型 & 预训练模型	inference模型 & 预训练模型
chinese_db_crnn_server	通用中文OCR模型	inference模型 & 预训练模型	inference模型 & 预训练模型

超轻量级中文OCR在线体验地址：https://www.paddlepaddle.org.cn/hub/scene/ocr

也可以按如下教程快速体验超轻量级中文OCR和通用中文OCR模型。

超轻量级中文OCR以及通用中文OCR体验

上图是超轻量级中文OCR模型效果展示，更多效果图请见文末超轻量级中文OCR效果展示和通用中文OCR效果展示。

浏览 35

点赞

收藏

分享

举报

评论

图片

表情

PaddleSpeech基于飞桨的语音开源模型库

PaddleSpeech 是基于飞桨 PaddlePaddle 的语音方向的开源模型库，用于语音和音频中的各种关键任务的开发，包含大量基于深度学习前沿和有影响力的模型。特性:本项目采用了易用、高效、灵

PyocrPython 的 OCR 库

Pyocr是OCR引擎的简单Python封装，支持Tesseract和Cuneiform等。支持Python2.7和3.x，要求Pillow。示例代码：importImageimportsysfrom

28k 的开源 OCR 工具

TextinatormacOS OCR 工具

Textinator是一款简单的macOS状态栏/菜单栏应用程序，用于对屏幕截图执行自动文本检测。安装使用安装应用程序。然后，使用⌘+⇧+4( Cmd+Shift+4 )截取屏幕区域的屏幕截图。该应用

TextinatormacOS OCR 工具

Textinator 是一款简单的 macOS 状态栏/菜单栏应用程序，用于对屏幕截图执行自动文本检

Shellpshell 的工具库

Shellp 是一个 shell 的工具库，用于简化基于命令行应用程序的开发，可方便定义命令以及进入

Shellpshell 的工具库

Shellp是一个shell的工具库，用于简化基于命令行应用程序的开发，可方便定义命令以及进入交互模式，可轻松从文件和标准输入中获取数据，提供图形化工作空间，基于Qt的界面，如果没有图形界面环境则使用

Capture2Text便携式 OCR 工具

Capture2Text能够使用键盘快捷键快速对屏幕的一部分进行OCR。默认情况下，生成的文本将保存到剪贴板。支持中文、英文、法文、德文、日文、韩文、俄文、西班牙文等90多种语言。Capture2Te

Capture2Text便携式 OCR 工具

Capture2Text 能够使用键盘快捷键快速对屏幕的一部分进行 OCR。默认情况下，生成的文本将

dpScreenOCR轻量级 OCR 工具

dpScreenOCR是一个自由的开源程序，用于识别屏幕上的文本。由Tesseract提供支持，它支持100多种语言，并且可以拆分独立的文本块，例如列。安装dpScreenOCR类Unix系统dpSc

点赞

收藏

分享

举报