爬虫验证码识别免费开源版(5行代码解决)

小张学Python

共 1051字,需浏览 3分钟

 · 2021-12-11

背景

爬取数据的过程中难免遇到登录的问题,为了绕过登录,保存cookie是常见的的解决方法.在遇到有验证码的问题时,无疑增加了获取cookie的难度.该python包,解决你的实际问题,避免了购买云打码或者自己搭建机器学习,训练模型的过程,话不多说,直接进入主题.

环境要求

目前已经支持python3.8以下的了,python3.8以上毫无问题。

调用方法

pip install ddddocr

如何使用

import ddddocr ocr = ddddocr.DdddOcr() with open('test.png', 'rb') as f:     img_bytes = f.read() res = ocr.classification(img_bytes) print(res)

参数说明

DdddOcr 接受两个参数:

参数名

默认值

说明

use_gpu

False

Bool 是否使用gpu进行推理,如果该值为False则device_id不生效

device_id

0

int cuda设备号,目前仅支持单张显卡

        
classification参数:
            


参数名

默认值

说明

img

0

bytes 图片的bytes格式

我试了试很不错,而且是cpu的情况下,几毫秒返回结果。
我的验证码如下:

往期:

1.首例爬虫禁令:法院裁定立即停止擅自爬取微信公众号相关数据行为

2.爬虫相关日志监控+自动告警

3.用不到十行代码实现新闻类网站的通用爬虫。经过测试数百个新闻网站,准确率接近100%

4.请不要污名化爬虫!

5.只因写了一段爬虫,公司200多人被抓!

6.如何让Python代码加速运行?

7.Python 3.10 明年发布,看看都有哪些新特性?

8.Python记录日志模块推荐-loguru

9.把 14 亿人拉到一个微信群,如何实现?

10.Python 之ConfigParser模块

11.Python入门专辑

小张学Python公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流Python、AI等相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。

浏览 22
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报