再见达叔!回顾一代喜剧大师203部作品
前段时间看浙江卫视的王牌对王牌时,还看到达叔上了这档综艺,发现达叔老了很多。
期间主持人还问了达叔:“什么时候能和周星驰再次合作”?
达叔笑着回答:“他还没有退休,我还没有死,就一定有机会”。
没有想到,现在这句话竟一语成谶。观众们再也没有机会,看到这对黄金搭档在电影里同框出现了。
一代喜剧大师就这么走了,让人感慨万千。在这里,我们用Python从数据上回顾达叔的电影人生,缅怀大师。
01.数据获取
对于数据的获取,我们是通过对于豆瓣电影中所收录的关于达叔的影视作品为基础,获取达叔电影作品的数据信息。
上图中,大家可以按照上述的步骤,打开webscraper后,创建新的sitemap,并在网页中选择自己需要抓取的元素,webscraper会自动的提取对应的元素,点击“done selecting”后,保存selector执行抓取,就可以获得得到豆瓣电影中关于达叔的电影数据。
02.数据清洗
通过上图可以看到,抓取到的数据,虽然非常的全面,但是却很乱,需要针对数据内容进行清洗,并提取关键的数据。这里我们以提取电影的上映时间、评分和电影时长数据的提取为例,进行数据的简单清洗,程序如下图所示。
03.数据分析
1).电影年份分布
2).电影类型分布
3).电影评分分布
一部影片的好坏,通过大家的评分就能够很好的进行判断,我们接下来看一下达叔电影的评分,如下图所示:
可以看到,达叔的电影评分,成绩大都分布在6-8分之间,可以说达叔的电影不仅高产而且影片质量都是比较不错的。
4).合作过的明星
而在达叔的平生电影中,合作最多的明星通过统计可以发现,就是周星驰。在豆瓣抓取到的数据中,二人合作了24部电影,时间横跨了十余年,可谓是一生的挚友。
可以看到,大家对于这部影片最大的评价是“经典”,一部能够让大家至今都觉得非常好看的电影,是对电影人最好的褒奖,也是对于达叔电影生涯的肯定。
以上就是对于达叔电影的数据分析。通过分析这些数据,让我们再一次的感受达叔带给我们的欢笑和回忆。在你的心目中,其中哪部又是最印象深刻的呢?
_往期文章推荐_