【程序源代码】python数据提取工具
程序源代码
共 1317字,需浏览 3分钟
·
2021-03-29 21:29
01
—
一款使用 Python 编写的图像内表格数据提取工具,可以高效识别 PDF 原件、扫描件、复印件、彩色(黑白)照片、截图内的数据表格,提取后转为 Excel 文件输出。这是一款开源工具,我给它取名叫Any2Excel。顾名思义,往后的目标就是提取任意格式文件中的数据图表到可被结构化处理的 Excel 文件。识别度高,操作简单,使用场景广泛。支持手机拍照、扫描件、原件、复印件等等
02
—
使用方法
Python PIP 依赖
pip install -r .\requirements.txt
外部依赖
poppler 安装后将其bin路径加入系统变量中
配置腾讯云
cp config+sample.yml config.yml
后补全config.yml
中的配置信息
—
源码
https://gitee.com/itcode-itcode/any-to-excel
—
更多内容请关注视频号
联
方
式
公众号ID: itcode
视频号: 程序源代码
微信ID: itcoder
免
声
明
—————————————
———————————————
【你的每一份打赏就是对我最真诚的鼓励
评论