爬虫验证码识别免费开源版(5行代码解决)-技术圈

背景

爬取数据的过程中难免遇到登录的问题,为了绕过登录,保存cookie是常见的的解决方法.在遇到有验证码的问题时,无疑增加了获取cookie的难度.该python包,解决你的实际问题,避免了购买云打码或者自己搭建机器学习,训练模型的过程,话不多说,直接进入主题.

目前已经支持python3.8以下的了，python3.8以上毫无问题。

pip install ddddocr

import ddddocr ocr = ddddocr.DdddOcr() with open('test.png', 'rb') as f:     img_bytes = f.read() res = ocr.classification(img_bytes) print(res)

DdddOcr 接受两个参数:

参数名	默认值	说明
use_gpu	False	Bool 是否使用gpu进行推理，如果该值为False则device_id不生效
device_id	0	int cuda设备号，目前仅支持单张显卡

classification参数:

参数名	默认值	说明
img	0	bytes 图片的bytes格式

我试了试很不错，而且是cpu的情况下，几毫秒返回结果。
我的验证码如下:

往期:

小张学Python公众号的交流群已经建立，许多小伙伴已经加入其中，感谢大家的支持。大家可以在群里交流Python、AI等相关内容，还没有加入的小伙伴可以扫描下方管理员二维码，进群前一定要关注公众号奥，关注后让管理员帮忙拉进群，期待大家的加入。