XCrawler轻量级的 PHP 爬虫框架
XCrawler - 轻量级、易维护的PHP爬虫框架
特性:
极易上手,具备完善的文档和示例
支持多并发爬取
支持基于 xpath、css 选择器解析内容
模拟浏览器行为,如 user-agent、cookie、提交表单
支持断点续爬、失败重试、代理、并有完善的爬取日志
健壮的底层库,HTTP 客户端基于 guzzle,dom 解析基于 symfony/dom-crawler 库
评论
特性:
极易上手,具备完善的文档和示例
支持多并发爬取
支持基于 xpath、css 选择器解析内容
模拟浏览器行为,如 user-agent、cookie、提交表单
支持断点续爬、失败重试、代理、并有完善的爬取日志
健壮的底层库,HTTP 客户端基于 guzzle,dom 解析基于 symfony/dom-crawler 库