Umi-OCR离线文字识别工具

联合创作 · 2023-09-30 13:29

Umi-OCR 是一款免费、开源、可批量的离线 OCR 软件，基于 PaddleOCR，适用于 Windows10/11 平台。

特性

免费：本项目所有代码开源，完全免费。

方便：解压即用，离线运行，无需网络。

批量：可批量导入处理图片，结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。

高效：采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够，通常比在线OCR服务更快。

精准：默认使用PPOCR-v3模型库。除了能准确辨认常规文字，对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落，得到规整的文本。

说明目录

简单上手截图、批量识别~

排版优化如何合并一个自然段内的文字？

忽略区域如何排除截图水印处的文字？

多国语言添加更多PP-OCR支持的语言模型库！

命令行调用用命令行或第三方工具来调用Umi-OCR！

更多小技巧

问题排除无法启动引擎 / 多屏幕截图异常？

下载

Umi-OCR 软件本体含 简体中文&英文 通用识别库。
配套 多国语言识别扩展包 可导入 繁中,英,日,韩,俄,德,法 识别库，请按需下载。

Github下载：Release v1.3.3

蓝奏云下载：https://hiroi-sora.lanzoul.com/s/umi-ocr

兼容性

系统支持 Win10 x64 及以上版本。

CPU必须具有AVX指令集。

出现初始化引擎失败等问题时请参考问题排除。

前言

关于忽略指定区域的特殊功能：

类似含水印的视频截图、含有UI/按钮的游戏截图等，往往只需要提取字幕区域的文本，而避免提取到水印和UI文本。本软件可设置忽略某些区域内的文字，来实现这一目的。

当有大量的影视和游戏截图需要整理归档，或者想翻找包含某一段台词/字幕的截图；将这些图片提取出文字、然后Ctrl+F是一个很有效的方法。这是开发本软件的初衷。

关于离线OCR引擎 PaddleOCR-json ：

对 PaddleOCR 2.6 cpu_avx_mkl C++ 的封装。效率高于Python版本PPOCR及部分Python编写的OCR引擎，通常比在线OCR服务更快(省去网络传输的时间)。支持更换Paddle官方模型（兼容v2和v3版本）或自己训练的模型，支持修改PPOCR各项参数。通过添加不同的语言模型，软件可识别多国语言。

简单上手

准备

下载压缩包并解压全部文件即可。

截图识别

点击截图按钮或自定义快捷键，唤起截图识别。

粘贴图片到软件

在任何地方（如文件管理器，网页，微信）复制图片，软件上点击粘贴按钮，自动识别。

批量识别本地图片文件

将图片或文件夹拖进软件，批量转换文字。也可以点击按钮打开浏览窗口导入。

识别结果将保存到本地。可选生成纯文本txt文件、带链接Markdown文件、原始信息jsonl文件等不同格式。可配置任务完成后执行关机/待机。

文本块后处理（排版优化）

OCR识别出的文本是按“块”划分的，通常一行文字分为一块，有时还会将一行误划分为多块，这给阅读带来了不便。文本块后处理就是对文本块进行再加工的过程，合并同一行或同一段落内的文字，按正确的顺序排序。

下图表示不同排版应该选用何种处理方案：

浏览 46

点赞

收藏

分享

举报

评论

图片

表情

gscan2pdfPDF文字识别工具

将文档扫描成 PDF 格式很容易，但是能搜索它的内容吗？Gscan2pdf 采用光学识别软件对您的

gscan2pdfPDF文字识别工具

将文档扫描成PDF格式很容易，但是能搜索它的内容吗？Gscan2pdf采用光学识别软件对您的PDF文档进行扫描并将图像转换为文字。

Eye OCR文字识别工具

Eye是一个使用Java开发的文字识别工具（OCR），该工具主要用来识别屏幕上的文字，不支持中文。

OCRKit图片文字识别工具

OCRKit是一款非常小巧的软件，直接拖拽，就能将pdf文档与图片转换为可检索的pdf文档。采用OCR(OpticalCharacterRecognition光学字符识别)技术，对图像文件进行分析处理

Eye OCR文字识别工具

Eye 是一个使用 Java 开发的文字识别工具（OCR），该工具主要用来识别屏幕上的文字，不支持中

[cp]所谓的移动警务通，移动端证件识别信息采集是指，使用成熟的OCR文字识别技术，通过手机或者带有摄像头的终端设备对身份证在做视频流扫描识别，提取证件的照片做OCR文字识别，实现提取身份证信息，裁剪头像，并且存入证件信息数据库，不仅集合了身份证识别还包括驾驶证识别，行驶证识别，护照识别、港澳台胞证识别等。优点是：方案成本低，用于智能移动设备，使用环境方便，功能容易扩展。可提供SDK做二次开发（现在可以提供安卓、iOS、私有云、公有云等的证件识别SDK）证件识别应用场景：出租屋证件识别：入住旅客登记流动人口管理：入户普查特种行业：开锁业、家政、中介等行业证件识别登记展会、访

金山云文字识别（KOCR）基于业界领先的深度学习技术，可将图片中的文字内容智能识别为可编辑的文本，支持通用类、票据类、卡证类等多场景的文本识别，支持提供定制化服务，实现信息录入效率的有效提升

常用文字识别提取工具推荐

随着大家对办公需求的加大，也出了很多的办公软件，其中有一种就是图片文字提取软件。毕竟现在制作图片的要求是比较高的，所以在图片上加入文字也很常见。那么，我们要怎么才可以将图片上的文字提取出来呢？一、在线AI智能识别文字在线AI转换官网-在线文字转语音,在线语音转文字,在线文字识别,在线图像处理在线图片识别提取：http://www.zaixianai.cn/textDiscern 小伙儿们可以看看，他们这个在线网站的识别是完全免费的，而且可以看看他们放的事例图片，直接就是手写的都能精准识别，更别说我们拍的老师的PPT这种正正方方的文字图片了。文件的识别提取有2种方式：通过本地的图片直接上传；2.通过图片的链

印刷文字识别-通用文字识别/OCR文字识别-极速数据

可识别一般的网络图片，返回图片中的文本信息。

Speech_Evaluation_Recognition离线语音识别

离线语音识别，语音评测，支持中文，英文识别，中文，英文评价。（与讯飞百度等无关）包含调用实例，接口说明，未混淆jar包。

点赞

收藏

分享

举报