微博超话爬虫,它来了

月小水长

共 784字,需浏览 2分钟

 ·

2022-03-16 06:33

  点击上方 月小水长 并 设为星标,第一时间接收干货推送

这是 月小水长 的第 119 篇原创干货

目前公众号平台改变了推送机制,点“赞”、点“在看”、添加过“星标”的同学,都会优先接收到我的文章推送,所以大家读完文章后,记得点一下“在看”和“赞”。

as we all known,微博有关键词,话题和超话之分。

首先 #buyixiao# 这个就是话题, 而 buyixiao 是关键词;使用关键词可以同时搜到同名话题,话题却不能搜到同名关键词。

在 2021 新版微博话题爬虫发布 中的新版话题爬虫,把 keyword 设置成 buyixiao 就能抓取关键词微博,设置成 #buyixiao# 就能抓取话题微博。

超话,意即超级话题,又不等同于一般的微博话题,它具有独立的页面地址和样式,但是依然可以用 2021 新版微博话题爬虫发布 里面的话题爬虫抓取。只需要将 keyword 设置为 buyixiao超话 即可。其余限制时间范围,是否原创等的配置同话题关键词。保存字段也一样。包含微博 id、用户 id、内容、微博链接,用户名、用户链接、图片(s)链接,转评赞数等十余字段。

由于平台文章不支持修改,之前发布的文章有些内容可能已经不对了,最新配置及回答可以直接查看下面博客网站教程,但是相关文件获取依然在公众号。

https://buyixiao.github.io/blog/weibo-super-spider.html

点击阅读原文直达。
总结下,就是使用微博话题爬虫就能抓取超话, keyword 设置时加个超话即可。
浏览 84
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报