再见了, 达叔!我用Python回顾一代喜剧大师203部作品,太经典了!
共 2328字,需浏览 5分钟
·
2021-03-04 10:39
公众号 “菜鸟学Python”, 设为 “星标”
第447篇原创,和30w+一起学Python!
前段时间看浙江卫视的王牌对王牌时,还看到达叔上了这档综艺,发现达叔老了很多。
期间主持人还问了达叔:“什么时候能和周星驰再次合作”?
达叔笑着回答:“他还没有退休,我还没有死,就一定有机会”。
没有想到,现在这句话已经成了遗憾了~~我们再也没有机会,看到这对黄金搭档在电影里出现了。
一代喜剧大师就这么走了,让人感慨万千,小编决定用Python来回顾 “达叔”的一生的电影。
01.数据获取
对于数据的获取,我们是通过对于豆瓣电影中所收录的关于达叔的影视作品为基础,获取达叔电影作品的数据信息。
上图中,大家可以按照上述的步骤,打开webscraper后,创建新的sitemap,并在网页中选择自己需要抓取的元素,webscraper会自动的提取对应的元素,点击“done selecting”后,保存selector执行抓取,就可以获得得到豆瓣电影中关于达叔的电影数据。
02.数据清洗
通过上图可以看到,抓取到的数据,虽然非常的全面,但是却很乱,需要针对数据内容进行清洗,并提取关键的数据。这里我们以提取电影的上映时间、评分和电影时长数据的提取为例,进行数据的简单清洗,程序如下图所示。
03.数据分析
1).电影年份分布
2).电影类型分布
3).电影评分分布
一部影片的好坏,通过大家的评分就能够很好的进行判断,我们接下来看一下达叔电影的评分,如下图所示:
4).合作过的明星
而在达叔的平生电影中,合作最多的明星通过统计可以得制,周星驰是和达叔合作最多的影星,在豆瓣抓取到的数据中,二人合作了24部电影,时间横跨了十余年,可谓是一生的挚友。
达叔电影中评分最高的《大话西游之月光宝盒》达到了9.0分的高分,虽然上映距今已经有26年之久,但是今天看来仍旧是一部百看不厌的影片。最后我们来看一下豆瓣影评中的词云对这部电影的评论。
可以看到,大家对于这部影片最大的评价是“经典”,一部能够让大家至今都觉得非常好看的电影,是对电影人最好的褒奖,也是对于达叔电影生涯的肯定。
以上就是小编对于达叔电影的分析,通过分析达叔的电影,让我们再一次的感受达叔带给我们的欢笑和回忆,大家对于达叔电影的哪几部影响比较深刻呢?欢迎大家在下方留言。
程序员GitHub,已经正式上线
专注于分享GitHub上趣味的开源库,开源工具,不限于Java, Python ,Go, Javascript等语言,欢迎关注。
年度爆款文案
点这里,直达菜鸟学PythonB站!!