请问如何将带有斜纹水印pdf的转成Excel呢?

Python爬虫与数据挖掘

共 1925字,需浏览 4分钟

 ·

2024-07-17 09:29

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

红豆生南国,春来发几枝。

大家好,我是Python进阶者。

一、前言

前几天在Python最强王者交流群【wen】问了一个Python自动化办公的问题,问题如下:请问如何将带有斜纹水印pdf的转成Excel呢?目前我把pdf转成图片,根据水印的颜色进行清除,但是在脱网环境下无法将图片转成Excel。

二、实现过程

后来【隔壁😼山楂】给了一个指导:联网的情况下用的什么工具。

【wen】:一直没联网,现在的处理方法是先转成Excel再通过Python处理,通过pdf的软件转换格式,Acrobat。

【隔壁😼山楂】:意思就是之前没有操作过,现在想把图片内容提取到execl中,一般的方法就是用ocr技术做,联不联网都可以做的。

【黑科技·鼓包】:图片转xls联网方案很多,脱机方案不太清楚ocr可能准确性不太高

【wen】:只能把斜纹的水印去除就可以 没水印的转化已经处理好了

顺利地解决了粉丝的问题,给粉丝节约了时间、金钱和精力,非常奈斯。这个宝藏群,大家值得加入!

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python自动化办公的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【杨又串🍻】提出的问题,感谢【隔壁😼山楂】给出的思路,感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

大家在学习过程中如果有遇到问题,欢迎随时联系我解决(我的微信:pdcfighting1),应粉丝要求,我创建了一些高质量的Python付费学习交流群和付费接单群,欢迎大家加入我的Python学习交流群和接单群!

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

------------------- End -------------------

往期精彩文章推荐:

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

浏览 22
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报