玩爬虫不会登陆?这个工具拿走不谢!

数据管道

共 848字,需浏览 2分钟

 ·

2021-01-13 15:36

大家好,我是宝器!
在日常学习当中,我们或多或少都会到网上抓取一些数据,比如豆瓣、微博等等,但是这些网站在非登录的情况只能拿到部分数据,有很多数据都是需要登陆之后才可以获取的。
那么模拟登陆就成为了爬虫的第一步,我们可以自行研究,如何通过代码来模拟登陆目标网站,这样最为契合我们的需求;但是有时,我们可以通过某些造好的轮子来代替我们完成登陆的过程,今天推荐的这个工具就非常棒,一起来看看吧

工具介绍

工具名称: 

DecryptLogin 


GitHub 地址:

https://github.com/CharlesPikachu/DecryptLogin 


Star:1.3K

先什么都不说,只看这个 star 数量就足以说明一切的,妥妥的神器!
这是一个一键式登陆各大网站的工具,真的是一键登录啊,所有的登陆代码,只需要3行,如果去除 import 和初始化代码,则完全实现了1行代码登陆网站~

代码举例

微博登陆

舆情分析,肯定少不了微博啊


可以看到,首先初始化一个 login 实例,然后方法 weibo 即可,这个时候会弹出登陆二维码,直接扫描登陆就可以获取到对应的登陆信息了

GiHub

登陆 G 站不在话下

淘宝

听说淘宝反爬比较厉害,来尝试下

轻松破了,牛皮~

B 站

B 站近些年风头正盛,我们来实验下

毫无压力,轻松搞定
还有其他很多网站可以一键登陆,这里就不一一介绍了,大家可以自行查看文档

好了,今天的分享就到这里了
·················END·················

推荐阅读

  1. 写给所有数据人。

  2. 从留存率业务案例谈0-1的数据指标体系

  3. NB,真PDF神处理工具!

  4. 超级菜鸟如何入门数据分析?

  5. 后来,我去了拼多多,做了数据分析师。


欢迎长按扫码关注「数据管道」

浏览 27
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报