Pandas教程
数据科学与人工智能
共 4123字,需浏览 9分钟
· 2021-08-09
Pandas 是为了解决数据分析任务而创建的一种基于 NumPy 的工具包,囊括了许多其他工具包的功能,具有易用、直观、快速等优点。要想成为一名高效的数据科学家,不会 Pandas 怎么行?
import pandas as pd
data = pd.read_csv( my_file.csv )
data = pd.read_csv( my_file.csv , sep= ; , encoding= latin-1 , nrows=1000, skiprows=[2,5])
最常用的功能:read_csv, read_excel
其他一些很棒的功能:read_clipboard, read_sql
data.to_csv( my_new_file.csv , index=None)
Gives (#rows, #columns)
data.describe()
data.head(3)
data.loc[8]
data.loc[8, column_1 ]
data.loc[range(4,6)]
data[data[ column_1 ]== french ]
data[(data[ column_1 ]== french ) & (data[ year_born ]==1990)]
data[(data[ column_1 ]== french ) & (data[ year_born ]==1990) & ~(data[ city ]== London )]
data[data[ column_1 ].isin([ french , english ])]
data[ column_numerical ].plot()
data[ column_numerical ].hist()
%matplotlib inline
data.loc[8, column_1 ] = english 将第八行名为 column_1 的列替换为「english」
data.loc[data[ column_1 ]== french , column_1 ] = French
data[ column_1 ].value_counts()
data[ column_1 ].map(len)
data[ column_1 ].map(len).map(lambda x: x/100).plot()
data.apply(sum)
from tqdm import tqdm_notebook
tqdm_notebook().pandas()
data[ column_1 ].progress_map(lambda x: x.count( e ))
data.corr()
data.corr().applymap(lambda x: int(x*100)/100)
pd.plotting.scatter_matrix(data, figsize=(12,8))
data.merge(other_data, on=[ column_1 , column_2 , column_3 ])
data.groupby( column_1 )[ column_2 ].apply(sum).reset_index()
dictionary = {}
for i,row in data.iterrows():
dictionary[row[ column_1 ]] = row[ column_2 ]
易用,将所有复杂、抽象的计算都隐藏在背后了;
直观;
快速,即使不是最快的也是非常快的。
看完本文有收获?请转发分享给更多人
你想成为数据人才吗?你要找数据工作吗?
关注「数据人才」,找满意数据工作
我们创建了Python语言交流群,
请扫码下方二维码
备注:姓名-Python,邀请你加入群
评论
Java与lua互相调用简单教程
来源:网络👉 欢迎加入小哈的星球 ,你将获得: 专属的项目实战 / Java 学习路线 / 一对一提问 / 学习打卡 / 赠书福利全栈前后端分离博客项目 2.0 版本完结啦, 演示链接:http://116.62.199.48/ ,新项目
小哈学Java
0
超赞!这个ChatGPT提问教程,PDF免费下载
你好,我是郭震AI来袭,我们该如何学习?今天先分享给大家一份超好的GPT提问指南。教程的详细介绍参考下面视频:这个PDF资料旨在教我们更好的给GPT发送指令,让GPT更准确的回答我们的提问。一共有30页,内容包括7个小章节,按照逻辑展开。分别介绍文本回答,代码辅助,结构化结果输出,非结构化结构输出,
Python与算法社区
3
怎么才能用pandas删除第一列第0行?
点击上方“Python共享之家”,进行关注回复“资源”即可获赠Python学习资料今日鸡汤乡书不可寄,秋雁又南回。大家好,我是皮皮。一、前言前几天在Python白银交流群【unswervingly】问了一个Pandas处理的问题,提问截图如下:问题截图如下:二、实现过程这里【dcpeng】给了一个思
IT共享之家
0
侠盗猎车手免安装教程,支持安卓+PC!
前几天有粉丝朋友问我有没有侠盗猎车手罪恶都市这个游戏,今天就从解决实际问题的角度上,亲测这款游戏从安装到试玩,当然这篇文章使用的免安装版本,方便大家解压即玩!废话不多说先来看一下实测结果吧,我两台电脑都可以玩,一台是Win10,一台是Win11免安装,解完压缩就可以直接玩:非常经典的游戏开始画面:《
dotNET全栈开发
10
2024版,尚硅谷Java学科全套教程(289.1GB),含最新技术
尚硅谷 Java 学科全套视频,很早之前分享过一次,大概是 200G 左右,今天这个是《2024 版尚硅谷 Java 学科全套教程》,新增了 80 多个 GB,里面涵盖了 2023 年、2024 年最新更新的技术,基本上涵盖了 Java 所有的技术,共 289.1GB,文末附网盘地址。目录 基础部分
路人甲Java
0
终于来了,2024 最新版 SpringCloud 教程,收藏好,慢慢看
2024 最新版 SpringCloud 最强教程来了,目录如下,文末附教程地址。SpringCloud-前言闲聊开篇简介01_SpringBoot和SpringCloud版本选型02_SpringCloud是什么能干吗03_SpringCloud各组件的停更升级替换说明04_项目实战之需求说明05
路人甲Java
0
实践教程 | 在yolov5上验证一些不成熟的想法
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨王小二@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/388246083编辑丨极市平台极市导读 本文做了两件事:一是把基于mxnet的训练代码迁移到pytorch上,二是在yolov
小白学视觉
10
yfinance使用教程-《开源项目巡礼》-介绍流行的数据科学开源项目
✔️引言Python 是目前在数据科学领域最流行的编程语言,其不仅语法简洁,更是有丰富的第三方库支持,比如 Pandas、Matplotlib、Numpy 等大名鼎鼎的第三方库,也有众多在特定领域,比如 scikit-learn 之于机器学习,pytorch 之于深度学习等出色的第三方库支持。Pyt
数据科学实战
45