主播胖球_【爬虫浅谈】胖球数据23人被抓,我们该如何安全爬虫?
前言
2021年9月15日直播数据平台“胖球数据”因涉嫌用爬虫窃取直播相关数据,涉案23人被北京市朝阳公安分局全部抓获。
胖球数据隶属于北京七彩焕腾科技有限公司,2018年获得两轮千万投资,主要是通过大数据监测主播的历史的每场每单品的数据、同行店铺与主播合作的数据、短视频带货数据、带货主播的粉丝用户画像、异常主播数据等。
目前涉案人员已全部抓获,胖球数据网站出现卡顿、无法使用情况,网站提示“后端服务器出现故障,请联系管理员处理”。
俗话说:爬虫学得好,监狱进得早;数据玩得溜,牢饭吃个够。
爬虫作为获取数据的技术手段之一,由于部分数据存在敏感性。
如果你不能甄别哪些数据是可以爬的,那些数据会犯法,那你可能就是“进的早”了。
2021年9月15日直播数据平台“胖球数据”因涉嫌用爬虫窃取直播相关数据,涉案23人被北京市朝阳公安分局全部抓获。
据朝阳警方称主播胖球,某购物网站工作人员报警,其网络购物“直播间”存在异常访问情况,而相关的异常流量情况均指向同一网站。
民警发现,被“爬虫”窃取来的直播数据经过一定处理后,都会在这个网站上对外出售。
经过调查,王某漪、杨某宁和杨某三人在网上招募相关工作人员,通过“爬虫”软件非法窃取直播数据,而后在网上高价出售牟利。
在固定好相关犯罪证据后,9月15日专案组进行收网,将犯罪团伙23名嫌疑人全部抓获。
经审讯,王某漪、杨某宁和杨某等人交代了他们利用“爬虫”软件非法获取网站数据,进行数据处理后倒卖获利40余万元的犯罪事实。
那么,哪些信息是爬虫不能爬取的?
爬虫抓取的信息属于著作权保护的作品。
爬虫抓取的信息属于商业机密。
爬虫抓取的信息属于用户的个人隐私。
爬虫抓取的信息属于用户的个人信息。
爬虫抓取的信息属于反不正当保护的数据。
此外,未经被收集者同意,即便是将合法收集的公民信息向他人提供的,也属于《刑法》第二百五十三条之一规定的“提供公民个人信息”,可能构成犯罪。
当然,现实中的爬与反爬行为情况要远远复杂得多,难以通过简单的原则全面说明。还是需要针对不同的具体情况再具体进行分析。
写在最后:
关注:在说爬虫,每天发点好玩的~