PaddleOCR基于飞桨的 OCR 工具库
PaddleOCR是基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。
## CPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle
## GPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。
特性
- 超轻量级中文OCR,总模型仅8.6M
- 单模型支持中英文数字组合识别、竖排文本识别、长文本识别
- 检测模型DB(4.1M)+识别模型CRNN(4.5M)
- 多种文本检测训练算法,EAST、DB
- 多种文本识别训练算法,Rosetta、CRNN、STAR-Net、RARE
支持的中文模型列表:
模型名称 | 模型简介 | 检测模型地址 | 识别模型地址 |
---|---|---|---|
chinese_db_crnn_mobile | 超轻量级中文OCR模型 | inference模型 & 预训练模型 | inference模型 & 预训练模型 |
chinese_db_crnn_server | 通用中文OCR模型 | inference模型 & 预训练模型 | inference模型 & 预训练模型 |
超轻量级中文OCR在线体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr
也可以按如下教程快速体验超轻量级中文OCR和通用中文OCR模型。
超轻量级中文OCR以及通用中文OCR体验
上图是超轻量级中文OCR模型效果展示,更多效果图请见文末超轻量级中文OCR效果展示和通用中文OCR效果展示。
评论
PaddleSpeech基于飞桨的语音开源模型库
PaddleSpeech 是基于飞桨 PaddlePaddle 的语音方向的开源模型库,用于语音和音频中的各种关键任务的开发,包含大量基于深度学习前沿和有影响力的模型。特性:本项目采用了易用、高效、灵
PaddleSpeech基于飞桨的语音开源模型库
0
PyocrPython 的 OCR 库
Pyocr是OCR引擎的简单Python封装,支持Tesseract和Cuneiform等。支持Python2.7和3.x,要求Pillow。示例代码:importImageimportsysfrom
PyocrPython 的 OCR 库
0
TextinatormacOS OCR 工具
Textinator是一款简单的macOS状态栏/菜单栏应用程序,用于对屏幕截图执行自动文本检测。安装使用安装应用程序。然后,使用⌘+⇧+4( Cmd+Shift+4 )截取屏幕区域的屏幕截图。该应用
TextinatormacOS OCR 工具
0
Shellpshell 的工具库
Shellp是一个shell的工具库,用于简化基于命令行应用程序的开发,可方便定义命令以及进入交互模式,可轻松从文件和标准输入中获取数据,提供图形化工作空间,基于Qt的界面,如果没有图形界面环境则使用
Shellpshell 的工具库
0