【干货】centos下搭建图像文字识别

A小天

共 1468字,需浏览 3分钟

 ·

2022-05-23 18:36

下载

  1. wget https://github.com/tesseract-ocr/tesseract/archive/4.1.0.tar.gz

  2. leptnica下载地址:https://gitee.com/mirrors/leptonica.git

安装依赖:yum install autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel gcc gcc-c++ gcc-g77

安装leptonica

  1. tar -xzvf leptonica-1.74.4.tar.gz

  2. cd leptonica-1.74.4

  3. ./autobuild

  4. ./configure --prefix=/usr/local/leptonica

  5. make

  6. sudo make install

配置一下 leptonica 的环境变量。

打开 /etc/profile

  1. vim /etc/profile

添加以下字段

  1. PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/leptonica/lib/pkgconfig

  2. export PKG_CONFIG_PATH

  3. CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/leptonica/include/leptonica

  4. export CPLUS_INCLUDE_PATH

  5. C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica

  6. export C_INCLUDE_PATH

  7. LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/leptonica/lib

  8. export LD_LIBRARY_PATH

  9. LIBRARY_PATH=$LIBRARY_PATH:/usr/local/leptonica/lib

  10. export LIBRARY_PATH

  11. LIBLEPT_HEADERSDIR=/usr/local/leptonica/include/leptonica

  12. export LIBLEPT_HEADERSDIR

应用配置

  1. source /etc/profile

OK,现在我们就可以开始安装 tesseract。

安装 tesseract

  1. tar -xzvf 4.1.0.tar.gz

  2. cd tesseract-4.1.0

  3. ./autogen.sh

  4. ./configure --prefix=/usr/local/tesseract

  5. make

  6. sudo make install

接下来配置 tesseract 环境变量

打开 /etc/profile

  1. vim /etc/profile

追加以下字段

  1. PATH=$PATH:/usr/local/tesseract/bin

  2. export PATH

应用配置

  1. source /etc/profile

测试一下:

  1. tesseract -v

9cbbdcc7885d5cb41769658da8f17847.webp


上传 tesseract训练数据

下载地址:https://gitee.com/superaskar/tessdata.git

解压所有文件到/usr/local/tesseract/share/tessdata目录下


测试 tesseract

上传一张图片到/opt/tools目录,并进入该目录,然后输入命令

tesseract t1.png t1opt -l chi_sim

fde8c3bb141c95ec2fbcd78a65d9183c.webp

5a5c19282b5d90fb3d5dd80e18abc9c8.webp

e9fda10036c960c2e3fe26b812884c5b.webp


浏览 31
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报