Pandas,还能做这些
各位看官们里面请,今天慕寒再来接着说一下这Pandas的用法。在本系列的前一篇中,慕寒已经介绍过了一些基本的数据结构,今天我们就来看看Pandas到底为我们提供了哪些神奇的工具。我们都知道,Pandas库可以用来处理数据,既然如此,那数据的读写就是最基本的了Pandas库内置的数据读写函数支持CSV、JSON、txt等多种数据,我们就以CSV格式为例。Pandas库提供了“read_csv”函数来进行CSV数据的读入操作,该函数的语法结构及参数说明如下:
filepath_or_buffer:需要读写的文件名
sep:指定分隔符,默认使用逗号
header:指定某行作为列名,默认为0行,设为None表示不设置列名
index_col:指定某列作为行名
names:可作为结果的列名列表,若没有列的标题行可设为None
dtype:表明每列的数据类型
path_or_buf:写入的文件名
sep:指定分隔符,默认使用逗号
header:写入文件的列名,默认为true
columns:选择写入文件的列
index:写入的行名
encoding:写入文件时的编码方式
dtypes:返回每列的数据类型
empty:如果数据帧为空,返回true,否则false
size:返回元素数
head(n):返回前n行数据
tail(n):返回后n行数据
cov:计算数据帧指定列的协方差
corr:计算数据帧各列数据的相关系数
lower:将字符转为小写
upper:将字符转为大写
info:返回数据帧的基本信息
describe:返回数据帧各列的统计信息
isnull/notnull:检查数据帧中的缺失数据
fillna:用指定的数值填充缺失值
dropna:删除缺失值
bar:条形图,stacked参数表示是否堆积,默认false,不堆积
hist:直方图
box:箱形图
area:面积图
scatter:散点图,可用作回归分析
pie:饼状图
评论