【程序源代码】python数据提取工具

共 1317字,需浏览 3分钟

 ·

2021-03-29 21:29

 关键字:实用小工具” 

正文:python数据提取工具

一款使用Python编写的图像内表格数据提取工具,可以高效识别PDF原件、扫描件、复印件、彩色(黑白)照片、截图内的数据表格,提取后转为Excel文件输出。


01

概述

一款使用 Python 编写的图像内表格数据提取工具,可以高效识别 PDF 原件、扫描件、复印件、彩色(黑白)照片、截图内的数据表格,提取后转为 Excel 文件输出。这是一款开源工具,我给它取名叫Any2Excel。顾名思义,往后的目标就是提取任意格式文件中的数据图表到可被结构化处理的 Excel 文件。识别度高,操作简单,使用场景广泛。支持手机拍照、扫描件、原件、复印件等等


02



使用方法

  1. Python PIP 依赖

  2. pip install -r .\requirements.txt
  3. 外部依赖

  4. poppler 安装后将其bin路径加入系统变量中
  5. 配置腾讯云

  6. cp config+sample.yml config.yml后补全config.yml中的配置信息



源码

https://gitee.com/itcode-itcode/any-to-excel



更多内容请关注视频号






公众号ID:  itcode


视频号:  程序源代码

微信ID:  itcoder





【写作说明】以上文章属于此公众号原创所有,如需转载请注明出处。【免责申明】本公众号不是广告商,也没有为其他三方网站或者个人做广告宣传。文章发布源代码和文章均来源于各类开源网站社区或者是小编在项目中、学习中整理的一些实例项目。主要目的是将开源代码分享给喜欢编程、有梦想的程序员,希望能帮助到你们与他们共同成长。其中用户产生的一些自愿下载、打赏或者付费行为,原则与平台没有直接关系。如果涉及开源程序侵犯到原作者相关权益,可联系小编进行相关处理。
【投稿邮箱】315997972@qq.com

—————————————

目前已有1000000+优秀的程序员加入我们
                          
                         

——————————————

【你的每一份打赏就是对我最真诚的鼓励

浏览 63
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报