9 个小而经典的数据集
共 965字,需浏览 2分钟
·
2020-12-08 23:17
三步加星标
你好,我是 zhenguo
经常有粉丝问我,手上有没有数据集,几M大小的,尽量真实点的。今天我为你推荐10个这类小而经典的数据集。
1 covid-19
新冠肺炎已伴随2020快一年,世纪各地每日新增人数等数据,网上有公开数据集和下载API接口。亲身经历过的事件,沉淀下来的数据,拿来做分析,最令人印象深刻。
2 fashion-mnist
论经典数据集,非手写字莫属,而fashion意味着终结了老套的手写字,取而代之的是人类必需品:十类服饰小图。
3 tmdb_5000_movies
如果你是电影爱好者,这里为你准备 5000 部电影,并有电影分类,名称,打分,评论等数据,玩数据提升分析能力同时,还能补缺未看过的高分影片。
4 美国股市交易数据
炒股炒基俨然已成为当下时代,尤其上班族参与的重要课余活动,确实有人从中获取了丰厚的回报,很多交易员、IT 人士都想借助历史股市交易数据,从中挖掘出涨跌规律。所以,这份数据集或许对相关爱好者有些许参考意义。
5 幸福指数
全球各个国家近 5 年的幸福指数,以及影响它的主要因素,都在这 5 个 csv 文件中了,2019年中国的 happiness score 排在全球第 93 位。
6 信用卡欺诈交易
这也是一个再经典不过的数据集了
7 全球恐怖袭击事件统计
了解全球最近几年发生过的类似事件,从这个数据集中获得答案
8 google 娱乐商店
你可能对 apple 商店不陌生,但是对 google 的娱乐商店里的 app 都有哪些,下载次数,评分等可能也会感兴趣。
9 女性创业和劳动力
Women Entrepreneurship and Labor Force ,全球女性企业家都有谁,她们影响力指数又是怎样,可以试着分析这个数据集。
最近连载 5 篇 Pandas 数据分析小技巧,可以基于这些数据实战一下,想要的在下面微信里,回复:数据