情人节来了!没有50W彩礼,女朋友被强行拖走。。。

俊红的数据分析之路

共 3862字,需浏览 8分钟

 ·

2022-02-16 18:41

刚过完春节,作为到了已婚甚至被催婚年龄的我们也开始讨论一个自古既有的话题“彩礼”!

这两天,看到朋友圈刷屏了一个B站UP主的视频“没有50W彩礼,女朋友被强行拖走,我该怎么办”,看完视频只想说“**”!

https://www.bilibili.com/video/BV1HR4y1775Z

我们在一起已经6年了,通过努力,我们去年有了自己的房子,开始计划成立一个家庭。为了让她母亲放心,房子的名字填了她的。但是我们仍然遭到了强烈的反对,除非50w彩礼,就算把我们的房子卖了也得凑够。

到下午4点,B站这条视频的评论已经高达1万多条了,而且也上了微博热搜!

微博热搜

这次,我们用Python采集一下B站评论,也看看不同网友们怎么看待这件事以及这个话题!

目录:

1. 点赞最多的评论

2. 发表最早的一些评论

3. 全部评论关键词

4. 评论发表时间分布

5. 罗翔语录(关于彩礼)

6. 全国彩礼地图

7. 完整爬虫代码


1. 点赞最多的评论

除了up主本身的评论之外,我们可以看到点赞最多评论的是在2022-02-12 06:58:30(比较早)来自B站用户名无卡恩诺的网友,他感慨到“本以为是幸福的小两口加一大群。结果也是现实挣扎的苦命人。”。

(这条截图没找到了)

小编从朋友圈一些了解这位UP主的朋友得知,UP主家里养了很多猫猫狗狗小动物,日常发的视频都是很温馨很幸福的!

所以,今早这个UP主的视频直接让很多关注他的网友破防了,可以看到这条简单的评论,确实......

另外就是一个叫乐乐是我的宝贝的女性网友的评论,结合着自己的正向经历。

来自伍一伍一的评论,其实在从这个视频里女方更难,毕竟这样的原生家庭就在那里,有点像此前电视剧《欢乐颂》里的樊胜美的家庭,只希望这样的家庭越来越少,更希望这样的家庭能得到缓和!


2. 发表最早的一些评论


视频发布时间是2022-02-12 05:50:58,最早的评论是在发布不到1分钟后就有了。

ctimecontentlikeunamesex
2022-02-12 05:51:48失眠的人有惊喜?4百里桃夭丶保密
2022-02-12 05:51:48啊?1L-whywhywhy保密
2022-02-12 05:51:49这不报警先?1smile一XAXED保密
2022-02-12 05:51:54一个能熬的都没有0赐老子个名字吧
2022-02-12 05:51:57我的天。。1_极爱自己保密
2022-02-12 05:51:59修仙党的胜利0木蛤蛤
2022-02-12 05:52:06卧槽,这是啥1凋零之季保密
2022-02-12 05:52:07卧槽!!!我以为是标题党狗狗猫猫的故事没想到是真的!!卧槽太可怕了6227甜尾江江
2022-02-12 05:52:12剧情很抽象1在黑土地上保密
2022-02-12 05:52:18失眠的人有惊喜1李二胖咕咕咕保密


3. 全部评论关键词

用我们的《词云绘制工具》进行评论关键词词云图绘制,可以看到 父母 是广大网友评论的核心,大家都在鼓励女方加油,很多人对Up主遇到此事表示没想到

就是还有罗翔老师被提及较多,因为他在B站太火了,而且也有过关于彩礼的看法。

其实,彩礼本身无对错,天价彩礼以及只收不回父母才是“被针对”的!


4. 评论发表时间分布

从这个视频发布之后,其实一直有着较高的关注度,随着时间的推移其热度也越来越高了。毕竟,这个情况虽然极端却也不会是个例,且很多人也会真切经历类似的可能情况。


5. 罗翔语录(关于彩礼)

https://www.bilibili.com/video/BV1Hh411Y7Cw/

现在很多地方嫁闺女都要收彩礼,大家知道中国哪个地方收的彩礼是最低的吗?哪个省市彩礼要的是最低的呀?广东省要的彩礼是最低的。有些地方的彩礼要的还是蛮高的,有些地方的彩礼是万紫千红一点绿,万紫一万张紫色的钞票,紫色是几块的,5块的;千红,万紫千红,100块的,那就是10万块;一点绿,绿是多少呢,50的。所以至少娶一个媳妇都要拿出十几万,好几十万。大家觉得多吗?其实对很多家庭来说是多的,尤其是对农村家庭是很沉重的负担。大家觉得这是在卖闺女还是嫁闺女?这个还是在嫁闺女,好像不能解读为卖。因为法律还是要考虑社会生活的实际需要。但是司法实践中还有一种情况是放鸽子,结果我跟这个女的串通,今天把她买到张三家收了5万块,明天她又飞回来卖给李四家,这才属于诈骗行为。


6. 全国彩礼地图

这是公众号谷雨数据2020年发布的全国彩礼地图,现在估计又涨了不少吧!

彩礼地图


7. 完整爬虫代码

附上完整爬虫代码,运行过程可能出现报错,具体或与B站反爬有关,大家可自行查看报错提示进行debug!

import requests     
import re
import json
import pandas as pd

def get_json_data(page):
    url = 'https://api.bilibili.com/x/v2/reply/main?'
    headers = {
        "User-Agent""Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36",
        "referer""https://www.bilibili.com/video/BV1HR4y1775Z"
        }
    params = {
        'callback''jQuery17206752522958787988_1644651682110',
        'jsonp''jsonp',
        'next': page,
        'type'1,
        'oid'338896747,
        'mode'2,
        'plat'1,
        '_'1644654903971
        } 
    resp = requests.get(url, headers=headers, params=params)
    
    text = resp.text
    json_str = re.findall(r'\(({.*})\)', text)[0]
    json_data = json.loads(json_str)
    return json_data


data = get_json_data(1)['data']
# 总评论数
total = data['cursor']['all_count']
# 评论总页数
pages = total//20
df = pd.DataFrame(columns=['id','content','ctime','like','uname','sex','mid'])
for page in range(pages):
    print(page)
    data = get_json_data(page)
    replies = data['data']['replies']
    for reply in replies:
        df = df.append({
                'id':reply['rpid'],
                'content':reply['content']['message'],
                'ctime':reply['ctime'],
                'like':reply['like'],
                'uname':reply['member']['uname'],
                'sex':reply['member']['sex'],
                'mid':reply['member']['mid'],    
                },
                ignore_index=True
                )
df['ctime'] = pd.to_datetime(df['ctime'], unit='s') + pd.Timedelta(days=8/24)
df.drop_duplicates(inplace=True)
df.to_excel('50万彩礼.xlsx',index=None)

以上就是本次全部内容,小编觉得有句话说的很好“彩礼和嫁妆应该是作为一个新婚家庭更好生活与发展的启动资金,而不应该是某一方家长为了私利下的一种手段”。

最后,马上情人节了,祝福大家有情人终成眷属

END -

本文为转载分享&推荐阅读,若侵权请联系后台删除


对比Excel系列图书累积销量达15w册,让你轻松掌握数据分析技能,可以在全网搜索书名进行了解:


浏览 22
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报