MMOCR基于 PyTorch 的文本检测工具

联合创作 · 2023-09-29 22:58

MMOCR 是基于 PyTorch 和 mmdetection 的开源工具箱，专注于文本检测，文本识别以及相应的下游任务，如关键信息提取。它是 OpenMMLab 项目的一部分。

主分支目前支持 PyTorch 1.6 以上的版本。

文档：https://mmocr.readthedocs.io/en/latest/。

主要特性

-全流程

该工具箱不仅支持文本检测和文本识别，还支持其下游任务，例如关键信息提取。

-多种模型

该工具箱支持用于文本检测，文本识别和关键信息提取的各种最新模型。

-模块化设计

MMOCR 的模块化设计使用户可以定义自己的优化器，数据预处理器，模型组件如主干模块，颈部模块和头部模块，以及损失函数。有关如何构建自定义模型的信息，请参考快速入门。

-众多实用工具

该工具箱提供了一套全面的实用程序，可以帮助用户评估模型的性能。它包括可对图像，标注的真值以及预测结果进行可视化的可视化工具，以及用于在训练过程中评估模型的验证工具。它还包括数据转换器，演示了如何将用户自建的标注数据转换为 MMOCR 支持的标注文件。

模型库

支持的算法：

文字检测

DBNet (AAAI'2020)

Mask R-CNN (ICCV'2017)

PANet (ICCV'2019)

PSENet (CVPR'2019)

TextSnake (ECCV'2018)

DRRG (CVPR'2020)

FCENet (CVPR'2021)

文字识别

CRNN (TPAMI'2016)

NRTR (ICDAR'2019)

RobustScanner (ECCV'2020)

SAR (AAAI'2019)

SATRN (CVPR'2020 Workshop on Text and Documents in the Deep Learning Era)

SegOCR (Manuscript'2021)

关键信息提取

SDMG-R (ArXiv'2021)

命名实体识别

Bert-Softmax (NAACL'2019)

浏览 35

点赞

收藏

分享

举报

评论

图片

表情

Vedastr:基于PyTorch的场景文本识别工具箱

Franc文本语言检测工具

franc是检测文本语言的JavaScript库，支持比其他任何库更多的语言，甚至是Google。在线演示

基于pytorch的densenet

pytorch玩转深度学习

Franc文本语言检测工具

franc 是检测文本语言的 JavaScript 库，支持比其他任何库更多的语言，甚至是 Goog

基于pytorch的resnet

pytorch玩转深度学习

unit_perf基于 OpenWrt 的性能检测工具

unit_perf 是一个作为性能补充的性能测量工具。目前工作是基于 OpenWrt 开发，经常要改

ThreatMapper基于 Go 的漏洞检测工具

DeepfenceThreatMapper是一个帮助用户监控和保护在云、Kubernetes、Docker和FargateServerless中运行的应用程序的工具。DeepfenceThreatMa

unit_perf基于 OpenWrt 的性能检测工具

unit_perf 是一个作为性能补充的性能测量工具。目前工作是基于OpenWrt开发，经常要改善代码性能，但是OpenWrt又不支持perf。所以查找性能瓶颈时，就比较麻烦。于是利用业余时间写了个小

13层基于文本的冒险游戏

这是一款类似于小黑屋的放置型经营游戏，你可以建造多种建筑和收集多种资源，来一步步探索13个层面。特

13层基于文本的冒险游戏

这是一款类似于小黑屋的放置型经营游戏，你可以建造多种建筑和收集多种资源，来一步步探索13个层面。特征生存与探索基地建设和资源管理随机生成的地图物品、设备和环境危害慢慢解锁游戏新的技术

点赞

收藏

分享

举报