Python 爬虫的故事:这是人干的事么?
爬虫原理
我是一个爬虫,每天穿行于互联网之上,爬取我需要的一切

说起来还要感谢 HTTP 协议,因为它,全世界的网站和浏览器才能够连接通信,而我也是借助 HTTP 协议,获取我想要的数据
我只需要伪装成一个浏览器,向服务器发送 HTTP 请求,就能拿到网页 HTML 文件或者数据
接着,我再按照 HTML 的格式规范,去解析其中的图片、链接 、表单
评论
我是一个爬虫,每天穿行于互联网之上,爬取我需要的一切
说起来还要感谢 HTTP 协议,因为它,全世界的网站和浏览器才能够连接通信,而我也是借助 HTTP 协议,获取我想要的数据
我只需要伪装成一个浏览器,向服务器发送 HTTP 请求,就能拿到网页 HTML 文件或者数据
接着,我再按照 HTML 的格式规范,去解析其中的图片、链接 、表单