deep_ocr中文识别
deep_ocr 是使得 OCR 比 tesseract 更好的中文识别、身份证识别等等。
估计很多开发员使用 tesseract 做中文识别,但是结果不是一般的差,譬如下面的图片
$ tesseract -l chi_sim test_data.png out_test_data
看到恨多公司在招腭大改癫和机器字习胸人 v 我有3个建议 (T) 忧T ' 2个上t较靠遭 胸人就譬了 v不是越多越好 (2) 这T '2个人要能给大蒙上踝'倩邂知L目 (3) 不要招 不宣代四胸人:虹大改癫和机器字习胸v不裹目宣 (或者宣过) 大量代四v基本上就 只会忽悠了
其实现在做文字识别不是很难,特别基于深度学习,这里是这个项目的reco_chars.py脚本,基于caffe的识别效果,是不是好很多?而且代码比tesseract短很多。
$ python reco_chars.py
看很多公苘在招聘天数据和机器学习人我有个建议找个较靠谱 的人就够了不是越多越好这个人要给大家上课传递知识不要招 不写代码的人做天数据机器学习的不亲写或者写过天且代码基本上就 只会忽悠了
大家可以基于caffe训练自己的字体,系统基于这个文章开发单个字的识别:
Deep Convolutional Network for Handwritten Chinese Character Recognition http://cs231n.stanford.edu/reports/zyh_project.pdf
评论
cnn_handwritten_chinese_recognitionCNN在线识别手写中文。
cnn_handwritten_chinese_recognition 使用python+flask搭建的一个网站,然后从网页的写字板上获取鼠标手写的汉字经过转码后传回后台,并经过图片裁剪处理之
cnn_handwritten_chinese_recognitionCNN在线识别手写中文。
0
cnn_handwritten_chinese_recognitionCNN在线识别手写中文。
cnn_handwritten_chinese_recognition 使用python+f
cnn_handwritten_chinese_recognitionCNN在线识别手写中文。
0
HyperLPR高性能中文车牌识别框架
HyperLPR是基于深度学习的高性能中文车牌识别框架,支持Python、Android、C++等编程语言调用,接入简单、准确度较高。可识别的车牌类型单行蓝牌单行黄牌新能源车牌白色警用车牌使馆/港澳车
HyperLPR高性能中文车牌识别框架
0
TimeNLP中文语言中的时间识别
Time-NLP中文语句中的时间语义识别author:shinyke本工具是由复旦NLP中的时间分析功能修改而来,做了很多细节和功能的优化,具体如下:泛指时间的支持,如:早上、晚上、中午、傍晚等。时间
TimeNLP中文语言中的时间识别
0