[数据分析]Pandas自测20题-技术圈

“

Pandas 是用 Python 进行数据分析时最常用也是最强大的工具库。今天我们通过习题的形式整理了 pandas 中一些比较基础的常用操作。如果你是位 Pandas 新手，不妨通过此练习检验一下自己对基础的掌握情况；如果你是高手，欢迎留言给出与答案的不同解法。Here we go！

”

创建DataFrame

题目：将下面的字典创建为DataFrame

data = {"grammer":["Python","C","Java","GO",np.nan,"SQL","PHP","Python"],
       "score":[1,2,np.nan,4,5,6,7,10]}

难度：⭐

期望结果

答案：

df = pd.DataFrame(data)

下文所有题目均基于该数据框给出

数据提取

题目：提取含有字符串"Python"的行

难度：⭐⭐

期望结果

grammer  score
0 Python    1.0
7 Python   10.0

答案：

result=df[df['grammer'].str.contains("Python")]

提取列名

题目：输出df的所有列名

难度：⭐

期望结果

Index(['grammer', 'score'], dtype='object')

答案

df.columns

修改列名

题目：修改第二列列名为'popularity'

难度：⭐⭐

答案

df.rename(columns={'score':'popularity'}, inplace = True)

字符统计

题目：统计grammer列中每种编程语言出现的次数

难度：⭐⭐

答案

df['grammer'].value_counts()

缺失值处理

题目：将空值用上下值的平均值填充

难度：⭐⭐⭐

答案

df['popularity'] = df['popularity'].fillna(df['popularity'].interpolate())

数据提取

题目：提取popularity列中值大于3的行

难度：⭐⭐

答案

df[df['popularity'] > 3]

数据去重

题目：按照grammer列进行去重

难度：⭐⭐

答案

df.drop_duplicates(['grammer'])

数据计算

题目：计算popularity列平均值

难度：⭐⭐

答案

df['popularity'].mean()

格式转换

题目：将grammer列转换为list

难度：⭐⭐

答案

df['grammer'].to_list()

数据保存

题目：将DataFrame保存为EXCEL

难度：⭐⭐

答案

df.to_excel('filename.xlsx')

数据查看

题目：查看数据行列数

难度：⭐

答案

df.shape

数据提取

题目：提取popularity列值大于3小于7的行

难度：⭐⭐

答案

df[(df['popularity'] > 3) & (df['popularity'] < 7)]

位置处理

题目：交换两列位置

难度：⭐⭐⭐

答案

temp = df['popularity']
df.drop(labels=['popularity'], axis=1,inplace = True)
df.insert(0, 'popularity', temp)

数据提取

题目：提取popularity列最大值所在行

难度：⭐⭐

答案

df[df['popularity'] == df['popularity'].max()]

数据查看

题目：查看最后5行数据

难度：⭐

答案

df.tail()

数据修改

题目：删除最后一行数据

难度：⭐

答案

df = df.drop(labels=0)

数据修改

题目：添加一行数据['Perl',6.6]

难度：⭐⭐

答案

row={'grammer':'Perl','popularity':6.6}
df = df.append(row,ignore_index=True)

数据整理

题目：对数据按照"popularity"列值的大小进行排序

难度：⭐⭐

答案

df.sort_values("popularity",inplace=True)

字符统计

题目：统计grammer列每个字符串的长度

难度：⭐⭐⭐

答案

df['grammer'].map(lambda x: len(x))

以上就是 Pandas 基础20题，当然我们给出的答案并非唯一解法，如果你有有其他实现代码或有相关建议欢迎留言补充。

作者：刘早起早起

来源：早起Python

_往期文章推荐_

46个常用Pandas方法速查表