[数据分析]Pandas自测20题

Crossin的编程教室

共 2005字,需浏览 5分钟

 · 2020-09-20




Pandas 是用 Python 进行数据分析时最常用也是最强大的工具库。今天我们通过习题的形式整理了 pandas 中一些比较基础的常用操作。如果你是位 Pandas 新手,不妨通过此练习检验一下自己对基础的掌握情况;如果你是高手,欢迎留言给出与答案的不同解法。Here we go!


 
1
创建DataFrame


题目:将下面的字典创建为DataFrame
data = {"grammer":["Python","C","Java","GO",np.nan,"SQL","PHP","Python"],
       "score":[1,2,np.nan,4,5,6,7,10]}
难度:⭐
期望结果

答案
df = pd.DataFrame(data)
下文所有题目均基于该数据框给出


 2
数据提取

题目:提取含有字符串"Python"的行
难度:⭐⭐
期望结果
grammer  score
0 Python    1.0
7 Python   10.0
答案
result=df[df['grammer'].str.contains("Python")]

 3
提取列名


题目:输出df的所有列名
难度
期望结果
Index(['grammer', 'score'], dtype='object')
答案
df.columns

 4
修改列名

题目:修改第二列列名为'popularity'
难度:⭐⭐
答案
df.rename(columns={'score':'popularity'}, inplace = True)

 5
字符统计


题目:统计grammer列中每种编程语言出现的次数
难度:⭐⭐
答案
df['grammer'].value_counts()

 6
缺失值处理


题目:将空值用上下值的平均值填充
难度⭐⭐⭐
答案
df['popularity'] = df['popularity'].fillna(df['popularity'].interpolate())

7
数据提取

题目:提取popularity列中值大于3的行
难度:⭐⭐
答案
df[df['popularity'] > 3]

 8
数据去重


题目:按照grammer进行去重
难度⭐⭐
答案
df.drop_duplicates(['grammer'])

 9
数据计算


题目:计算popularity平均值
难度⭐⭐
答案
df['popularity'].mean()

10
格式转换


题目:将grammer转换为list
难度⭐⭐
答案
df['grammer'].to_list()

11
数据保存


题目:将DataFrame保存为EXCEL
难度⭐⭐
答案
df.to_excel('filename.xlsx')

12
数据查看


题目:查看数据行列数
难度
答案
df.shape

13
数据提取


题目:提取popularity值大于3小于7的行
难度⭐⭐
答案
df[(df['popularity'] > 3) & (df['popularity'] < 7)]


14
位置处理


题目:交换两列位置
难度⭐⭐⭐
答案
temp = df['popularity']
df.drop(labels=['popularity'], axis=1,inplace = True)
df.insert(0, 'popularity', temp)

15
数据提取


题目:提取popularity列最大值所在行
难度⭐⭐
答案
df[df['popularity'] == df['popularity'].max()]


16
数据查看


题目:查看最后5行数据
难度
答案
df.tail()


17
数据修改


题目:删除最后一行数据
难度
答案
df = df.drop(labels=0)

18
数据修改


题目:添加一行数据['Perl',6.6]
难度⭐⭐
答案
row={'grammer':'Perl','popularity':6.6}
df = df.append(row,ignore_index=True)


19
数据整理


题目:对数据按照"popularity"列值的大小进行排序
难度⭐⭐
答案
df.sort_values("popularity",inplace=True)


20
字符统计


题目:统计grammer列每个字符串的长度
难度⭐⭐⭐
答案
df['grammer'].map(lambda x: len(x))

以上就是 Pandas 基础20题,当然我们给出的答案并非唯一解法,如果你有有其他实现代码或有相关建议欢迎留言补充。

作者:刘早起早起 

来源:早起Python




_往期文章推荐_

46个常用Pandas方法速查表




浏览 8
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报