【机器学习】Pandas练习题-提高你的数据分析技能

机器学习初学者

共 1761字,需浏览 4分钟

 ·

2022-03-10 22:24

本文总结了pandas的常用操作,并做成练习题,练习题附答案,并且有完整数据集,建议读者把练习题完成。作者认为,做完练习题,pandas的基本操作没有问题了,以后碰到问题也可以查这些习题。(文末提供下载)


Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。

网上可以搜到大量的pandas教程和官方文档,但没有简单的方法来练习。教程是很好的资源,但要付诸实践。只有实践,才能更好的加深学习。

本站从github搜索到了一些pandas的练习题,含完整数据集,并进行整理:

原代码作者:Guilherme Samora


本练习代码可以在github下载:

https://github.com/fengdu78/machine_learning_beginner/tree/master/pandas/Pandas_Exercises


Pandas练习题目录

1.Getting and knowing  

  • Chipotle  

  • Occupation  

  • World Food Facts

2.Filtering and Sorting

  • Chipotle  

  • Euro12  

  • Fictional Army

3.Grouping

  • Alcohol Consumption  

  • Occupation  

  • Regiment

4.Apply

  • Students 

  • Alcohol Consumption  

  • US_Crime_Rates     

5.Merge

  • Auto_MPG  

  • Fictitious Names  

  • House Market  

6.Stats

  • US_Baby_Names  

  • Wind_Stats

7.Visualization

  • Chipotle  

  • Titanic Disaster  

  • Scores  

  • Online Retail  

  • Tips  

8.Creating Series and DataFrames  

  • Pokemon  

9.Time Series  

  • Apple_Stock  

  • Getting_Financial_Data  

  • Investor_Flow_of_Funds_US  

10.Deleting  

  • Iris  

  • Wine  


使用方法

每个练习文件夹有三个不同类型的文件: 

1. Exercises.ipynb

没有答案代码的文件,这个是你做的练习

2.Solutions.ipynb

运行代码后的结果(不要改动)

3.Exercise_with_Solutions.ipynb

有答案代码和注释的文件

你可以在Exercises.ipynb里输入代码,看看运行结果是否和Solutions.ipynb里面的内容一致,如果真的完成不了再看下Exercise_with_Solutions.ipynb的答案。

典型的例题如图所示:

练习题截图


总结

本文把pandas的常用操作做成练习题,练习题附答案,并且有完整数据集。希望初学者能认真完成练习题,以便提高数据分析技能。

本练习代码可以在github下载:https://github.com/fengdu78/machine_learning_beginner/tree/master/pandas/Pandas_Exercises

若下载不了,可以用百度云:

链接:https://pan.baidu.com/s/1qzIZAsirJSZLyVm5okcicA 提取码:umgg

往期精彩回顾




浏览 24
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报