PaddleOCR基于飞桨的 OCR 工具库

联合创作 · 2023-09-26 05:40

PaddleOCR是基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

## CPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle

## GPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。

特性

  • 超轻量级中文OCR,总模型仅8.6M
    • 单模型支持中英文数字组合识别、竖排文本识别、长文本识别
    • 检测模型DB(4.1M)+识别模型CRNN(4.5M)
  • 多种文本检测训练算法,EAST、DB
  • 多种文本识别训练算法,Rosetta、CRNN、STAR-Net、RARE

支持的中文模型列表:

模型名称 模型简介 检测模型地址 识别模型地址
chinese_db_crnn_mobile 超轻量级中文OCR模型 inference模型 & 预训练模型 inference模型 & 预训练模型
chinese_db_crnn_server 通用中文OCR模型 inference模型 & 预训练模型 inference模型 & 预训练模型

超轻量级中文OCR在线体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr

也可以按如下教程快速体验超轻量级中文OCR和通用中文OCR模型。

超轻量级中文OCR以及通用中文OCR体验

上图是超轻量级中文OCR模型效果展示,更多效果图请见文末超轻量级中文OCR效果展示通用中文OCR效果展示

浏览 3
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报