Vedastr:基于PyTorch的场景文本识别工具箱
加入极市专业CV交流群,与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度 等名校名企视觉开发者互动交流!
同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。关注 极市平台 公众号 ,回复 加群,立刻申请入群~
就在明天,极市平台与重磅邀请到ICML 2020杰出论文一作魏恺轩,为我们深度讲解论文相关工作:免调试即插即用的近端优化算法。请大家锁定直播时间7月22日(周三)20:00。详情戳这里,在极市平台后台回复“62”,即可获取直播链接。本次直播由极市平台和中国图象图形学学会青年工作委员联合组织。
1. Vedastr的特性STR(Scene Text Recognition)的任务是识别文字框中的内容。我们在做关于STR的项目时发现,相关开源的toolbox较少,调研后发现现有的toolbox存在以下几个问题:
模块化程度较低
提供可配置接口较少
更新维护较少
模块化
易拓展性
配置简单
较完善的日志系统
及时的更新维护
2. Vedastr的运行方式
2.1 配置文件
optimizer = dict(type='Adam', lr=0.001)
lr_scheduler = dict(type='StepLR', max_epochs=3, milestones=[100000, 200000])
2.2 Train、test和demo
Train
python tools/train.py config-path
Test
python tools/test.py config-path checkpoint-path
Demo
python tools/demo.py config-path checkpoint-path img-path
3. 预训练模型
3.1 使用Vedastr复现的模型性能
TPS-ResNet-BiLSTM-Attention:What Is Wrong With Scene Text Recognition Model Comparisons?
Small-SATRN:On Recognizing Texts of Arbitrary Shapes with 2D Self-Attention
下载 TPS-ResNet-BiLSTM-Attention
下载vedastr,按照Installation进行安装
激活conda环境,运行demo文件,识别的结果就会显示在你的终端窗口上
python tools/demo.py configs/tps-resnet-bilstm-attention TPS-ResNet-BiLSTM-Attention.pth input-img
input-img:
终端窗口:
Vedastr项目链接如下,欢迎使用和star!https://github.com/Media-Smart/vedastr
推荐阅读
添加极市小助手微信(ID : cv-mart),备注:研究方向-姓名-学校/公司-城市(如:目标检测-小极-北大-深圳),即可申请加入极市技术交流群,更有每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、行业技术交流,一起来让思想之光照的更远吧~
△长按添加极市小助手
△长按关注极市平台,获取最新CV干货
觉得有用麻烦给个在看啦~
评论