爬虫玩的好,监狱进的早

小哈学Java

共 1566字,需浏览 4分钟

 ·

2021-11-09 18:48

点击关注公众号,Java干货及时送达👇

来自公众号:51CTO技术栈

“爬虫玩的好,监狱进的早;爬虫爬得欢,监狱要坐穿;数据玩的溜,牢饭吃个够。”这句技术圈内广泛流传的调侃并非是危言耸听,因为近些年来有太多的优秀的爬虫程序员们因此而面临牢狱之灾!


最近,北京某互联网公司就被警方一锅端了……

10 月 15 日,北京市朝阳公安分局对外公开,按照公安部“净网 2021”专项行动整体部署,朝阳警方深入落实打击网络违法犯罪。


在市局网安总队等有关部门的支持下,经过半个多月的缜密侦查,将一个非法获取计算机信息系统数据的犯罪团伙一网打尽,抓获 23 名犯罪嫌疑人。

据朝阳警方称,某购物网站工作人员近期报警,其网络购物“直播间”存在异常访问情况,怀疑直播数据被非法窃取。


朝阳分局立即部署网络安全保卫大队开展调查。民警发现,该购物网站“直播间”时常出现瞬时的流量激增现象。


进一步工作后,民警确认这种异常情况系有人在直播期间通过“爬虫”软件窃取相关数据而产生。


朝阳分局网络安全保卫大队会同团结湖派出所等有关单位成立专案组开展专案攻坚。


专案组通过大量工作发现,除该购物网站外,许多热门 APP 的“直播间”里也都出现过类似现象,而相关的异常流量情况均指向同一网站。

专案组趁热打铁,立即对该网站开展调查。民警发现,被“爬虫”窃取来的直播数据经过一定处理后,都会在这个网站上对外出售。


可见,该网站不仅是不法分子窃取来的数据“集中营”,更是其实施买卖的“商铺”。

专案组通过大量走访调查,在确定嫌疑人身份,查清网站幕后的运维人员后锁定一家位于朝阳区某写字楼内的网络公司。


很快,一个以王某漪、杨某宁和杨某为首的犯罪团伙进入民警视线。三人在网上招募相关工作人员,通过“爬虫”软件非法窃取直播数据,而后在网上高价出售牟利。


这家公司便是他们对外招工的幌子,而该网站则是他们为买卖有关信息专门建成的。

在摸清该团伙活动规律、固定好相关犯罪证据后,9 月 15 日专案组进行收网,将犯罪团伙 23 名嫌疑人全部抓获。


经审讯,王某漪、杨某宁和杨某等人交代了他们利用“爬虫”软件非法获取网站数据,进行数据处理后倒卖获利 40 余万元的犯罪事实。


据悉,王某漪等人此前曾合伙创业,但因经营不善没有赚到钱,心灰意冷之际,他们发现买卖购物网站上的客户信息可以赚大钱,于是便走上了这条违法犯罪的不归路。

目前,王某漪等 23 人均已被朝阳公安分局依法采取刑事强制措施,案件正在进一步审理中。


最后告诫各位程序员朋友们,为避免惹上一些不必要的麻烦,请你务必要记住以下两点:

  • 遵守爬虫协议。每个网站都有会有自己禁止爬取本站信息的爬虫名单,在爬取一个网站上的信息之前一定要仔细查看此名单!可以通过网站域名 +robots.txt 方式查看。比如百度的名单就可以通过,百度反爬名单。

  • 切忌不可以爬取一些敏感信息,尤其是不可以借助这些敏感信息去进行非法牟利,不然真的会被叫去喝茶!

1. 3行代码写出8个接口,开挂了?

2. 读懂Redis源码,我总结了这7点心得

3. 老大让我优化数据库,我上来就分库分表,他过来就是一jio

4. 彻底理解HashMap及LinkedHashMap

最近面试BAT,整理一份面试资料Java面试BATJ通关手册,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。

获取方式:点“在看”,关注公众号并回复 Java 领取,更多内容陆续奉上。

文章有帮助的话,在看,转发吧。

谢谢支持哟 (*^__^*)

浏览 38
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报