​【Python基础】介绍一本零基础入门Python数据分析的书

机器学习初学者

共 1979字,需浏览 4分钟

 · 2020-12-01

  作者:Lemon

来源:Python数据之道


介绍一本零基础入门

Python数据分析的书


有不少读者在询问如何入门Python、如何入门Python数据分析,之前跟大家分享了两本零基础入门Python的书籍:《Python编程从入门到实践》《笨办法学Python3》

今天来给大家分享一本Python数据分析入门的书籍,书名是《Python数据分析基础》。

本书面向的读者

按照书中的介绍:

本书面向的读者主要是那些经常使用电子表格软件进行数据处理,但从未写过一行代码的人。

Lemon 觉得这个范畴还是很清晰的,当然,Lemon 阅读完这本书之后,觉得范围也可以适当的拓宽些,包括经常处理电子表格的、需要定期生成报表的、有一定的数据可视化需求的、以及需要对数据进行统计性描述的,都可以参考下本书的部分内容。

对于这点,Lemon 也是深有感触。前些年,Lemon 还没有开始学 Python ,当时管理许多的项目,用 excel 处理数据感觉有些力不从心,于是开始寻找解决方案,找了一圈,最后用微软的 access 用 sql 语句撸了一个小型的项目管理工具。现在看来,如果当时会 Python,会要方便很多。

书中的Python环境

书中的代码使用的Python版本是 Python 3.5版,本书作者是在 windows 平台对代码进行测试的, 如果你的电脑上的 Python 版本是 3.5 以及之上的,应该是可以运行的。

由于 Python 是跨平台的,因此,windows、Linux 以及 MacOS 系统应该都没问题。

对用 Python 的安装,书中推荐安装 Anaconda , Lemon 一般也是直接安装 Anaconda,主要是比较省事。

关于 Python 环境的安装,这个还是需要自己去弄,不同的电脑环境,有时候会出现一些小小的问题,这个主要还是需要自己通过搜索来解决。

书中的代码,原书作者已经发布在其 Github 上,大家可以免费去获取,地址如下:

https://github.com/cbrownley/foundations-for-analytics-with-python

数据文件处理

书中花了比较大的篇幅来讲解关于数据文件的处理,主要包括 csv文件、excel文件以及 数据库。

对于数据分析入门而言,可能遇到比较多的文件类型还是 excel 和 csv ,所以书中对这两类介绍也是比较多。

书中介绍了用纯 Python、内置模块、第三方库等途径来操作这两类文件,涉及到 内置 csv模块、xlrd、xlwt 等。对于需要读取数据,尤其是需要写入数据,用这些工具还是挺方便的。

如果只是读取数据,然后进行数据清洗等处理,Lemon 一般喜欢用 Pandas 。

此外,对于数据库,书中也介绍了 内置的 sqlite3 模块,以及 以及流行的数据库 MySQL 。

数据可视化

主要涉及四个可视化库,分别是 MatplotlibPandasggplotseaborn

除了 ggplot ,其余三个, Lemon 也是经常使用的。

下面分享一个随书的案例:

运行后效果如下:

关于 Matplotlib,前不久 Lemon 整理了一份 100个项目入门 Matplotlib 的内容,有兴趣的同学可以前往查看:

100个案例,Matplotlib从入门到大神

自动运行脚本

Lemon 觉得还有一个内容估计大家是感兴趣的,那就是使用 Python 来按计划自动运行脚本,由于是在商业环境中,有一些需要定期上报的内容,比如日报、周报、月报、季报、年报等(特别烦!!!)。

前不久,阿里取消周报,都能上热搜,可见这些报表都么重要,又是多么招人厌!

如果你用 Python 来自动运行一些格式高度一致的内容,那自然会省事很多。别人在埋头苦干的时候,估计你就有功夫摸鱼啦。

小结

在本书的封面,给本书的定位是“零基础经验也可学会用最火的Python语言进行数据分析”,如果你对使用Python来进行数据分析有兴趣,本书可以作为初级参考书来使用。

如果你觉得这本书不错,可以去购买一本,仔细阅读下。

往期精彩回顾





获取本站知识星球优惠券,复制链接直接打开:

https://t.zsxq.com/qFiUFMV

本站qq群704220115。

加入微信群请扫码:

浏览 20
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报