爬虫玩的好,监狱进的早
共 1566字,需浏览 4分钟
·
2021-11-09 18:48
点击关注公众号,Java干货及时送达👇
“爬虫玩的好,监狱进的早;爬虫爬得欢,监狱要坐穿;数据玩的溜,牢饭吃个够。”这句技术圈内广泛流传的调侃并非是危言耸听,因为近些年来有太多的优秀的爬虫程序员们因此而面临牢狱之灾!
最近,北京某互联网公司就被警方一锅端了……
在市局网安总队等有关部门的支持下,经过半个多月的缜密侦查,将一个非法获取计算机信息系统数据的犯罪团伙一网打尽,抓获 23 名犯罪嫌疑人。
据朝阳警方称,某购物网站工作人员近期报警,其网络购物“直播间”存在异常访问情况,怀疑直播数据被非法窃取。
朝阳分局立即部署网络安全保卫大队开展调查。民警发现,该购物网站“直播间”时常出现瞬时的流量激增现象。
进一步工作后,民警确认这种异常情况系有人在直播期间通过“爬虫”软件窃取相关数据而产生。
朝阳分局网络安全保卫大队会同团结湖派出所等有关单位成立专案组开展专案攻坚。
专案组趁热打铁,立即对该网站开展调查。民警发现,被“爬虫”窃取来的直播数据经过一定处理后,都会在这个网站上对外出售。
专案组通过大量走访调查,在确定嫌疑人身份,查清网站幕后的运维人员后锁定一家位于朝阳区某写字楼内的网络公司。
很快,一个以王某漪、杨某宁和杨某为首的犯罪团伙进入民警视线。三人在网上招募相关工作人员,通过“爬虫”软件非法窃取直播数据,而后在网上高价出售牟利。
在摸清该团伙活动规律、固定好相关犯罪证据后,9 月 15 日专案组进行收网,将犯罪团伙 23 名嫌疑人全部抓获。
经审讯,王某漪、杨某宁和杨某等人交代了他们利用“爬虫”软件非法获取网站数据,进行数据处理后倒卖获利 40 余万元的犯罪事实。
目前,王某漪等 23 人均已被朝阳公安分局依法采取刑事强制措施,案件正在进一步审理中。
最后告诫各位程序员朋友们,为避免惹上一些不必要的麻烦,请你务必要记住以下两点:
遵守爬虫协议。每个网站都有会有自己禁止爬取本站信息的爬虫名单,在爬取一个网站上的信息之前一定要仔细查看此名单!可以通过网站域名 +robots.txt 方式查看。比如百度的名单就可以通过,百度反爬名单。
切忌不可以爬取一些敏感信息,尤其是不可以借助这些敏感信息去进行非法牟利,不然真的会被叫去喝茶!
最近面试BAT,整理一份面试资料《Java面试BATJ通关手册》,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。
获取方式:点“在看”,关注公众号并回复 Java 领取,更多内容陆续奉上。
文章有帮助的话,在看,转发吧。
谢谢支持哟 (*^__^*)