微博水军账号 spammer 检测模型上线
月小水长
共 571字,需浏览 2分钟
·
2022-12-30 22:54
用过 twitter 的 botometer 的同学都知道,botometer 可以通过检测 twitter 帐户的活动评价该账号属于机器人的可能性。
但是据笔者所知(可能笔者孤陋寡闻),weibo 并没有对应的产品或服务。于是我磨洋工(几个月前就说着要做了)做出了这个服务:检测微博账号是 spammer 的可能性。
笔者正常搜集了微博的一些 spammer 账号和正常账号共计 3000 余,手动打上标签。并爬取账号的关系网络特征、微博内容特征约 10 余特征,PCA 降维后抽取其中 6 个特征,搭建四层全连接网络,sigmod 激活加上BCE Loss,L2 normal 等常用方法,再调整 batch_size 和 lr 最后训练的模型,在测试集准确度 85% 左右,召回率很高但是精确度偏低。
最后把模型部署上线,直接在网页上输入微博账号 uid 就能看到该账号的检测结果,如下。
输入的 uid ,可以查看
https://weibo.com/u/3580036505
明显是一个 spammer 账号,模型预测正确,可信度为 0.985。
模型会一直迭代优化,欢迎体验,复制下述网址到浏览器或者点击阅读原文直达。
https://weibo-crawl-visual.buyixiao.xyz/weibo-spammer-evaluator
评论