推荐一款神奇的爬虫工具箱
【公众号回复 “1024”,免费领取程序员赚钱实操经验】
大家好,我是章鱼猫。
之前我们推荐过一篇爬虫集合:简单暴力的爬虫集合
今天推荐的这个项目是「INFO-SPIDER」,是一个集众多数据源于一身的爬虫工具箱。
INFO-SPIDER 旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。
支持数据源包括 GitHub、QQ 邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail 邮箱、Outlook 邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ 好友、QQ 群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN 博客、开源中国博客、简书。
特性:
安全可靠:本项目为开源项目,代码简洁,所有源码可见,本地运行,安全可靠。
使用简单:提供 GUI 界面,只需点击所需获取的数据源并根据提示操作即可。
结构清晰:本项目的所有数据源相互独立,可移植性高,所有爬虫脚本在项目的 Spiders 文件下。
数据源丰富:本项目目前支持多达 24+ 个数据源,持续更新。
数据格式统一:爬取的所有数据都将存储为 json 格式,方便后期数据分析。
个人数据丰富:本项目将尽可能多地为你爬取个人数据,后期数据处理可根据需要删减。
数据分析:本项目提供个人数据的可视化分析,目前仅部分支持。
文档丰富:本项目包含完整全面的使用说明文档和视频教程
是不是很强大,点击阅读原文,查看使用说明文档和视频教程。
开源项目地址:https://github.com/kangvcar/InfoSpider
开源项目作者:Kangvcar
推荐阅读:
标星 7 万多的知名开源项目,惨遭 GitHub 强行封杀下架
GitHub Star 3.2K Java 图片缩略图生成库
---特别推荐---
特别推荐:一个新的优质的推荐高效工具,软件,插件的公众号,每天给大家分享优秀的效率工具,「程序员掘金」,专门为程序员挖掘好东西的一个公众号,非常值得大家关注。