pandas创始人手把手教你利用Python进行数据分析(思维导图)
↑↑↑关注后"星标"简说Python 人人都可以简单入门Python、爬虫、数据分析 简说Python推荐
来源|大数据DT 作者|徐敬一
导读:Python是目前数据科学领域的王者语言,众多科学家、工程师、分析师都使用它来完成数据相关的工作。由于Python具有简单易学、语法灵活的特点,很多需要处理数据的人士想要学习,主要有两大类:
财经类、统计类背景人员,他们的日常工作有大量数据需要处理、分析,但对于学习使用计算机领域的编程语言Python又感到无从下手。
一些想要学习Python的计算机人员,他们工作较忙,没有太多时间通过互联网去系统学习Python数据技术
针对这两类人员的需求,近期出版上市的《利用Python进行数据分析》第2版是很好的选择。下面我们结合本书内容,大致介绍下如何利用Python进行数据分析。
01 Python数据分析流程及学习路径
数据分析的流程概括起来主要是:读写、处理计算、分析建模和可视化四个部分。在不同的步骤中会用到不同的Python工具。每一步的主题也包含众多内容。
根据每个部分需要用到的工具,Python数据分析的学习路径如下:
02 利用Python读写数据
Python读写数据,主要包括以下内容:
我们以一小段代码来看:
可见,仅需简短的两三行代码即可实现Python读入EXCEL文件。
03 利用Python处理和计算数据
在第一步和第二步,我们主要使用的是Python的工具库NumPy和pandas。其中,NumPy主要用于矢量化的科学计算,pandas主要用于表型数据处理。
▲NumPy
▲pandas
04 利用Python分析建模
在分析和建模方面,本书主要介绍了Statsmdels和Scikit-learn两个库。
.Statsmodels允许用户浏览数据,估计统计模型和执行统计测试。可以为不同类型的数据和每个估算器提供广泛的描述性统计,统计测试,绘图函数和结果统计列表。
▲.Statsmodels
Scikit-leran则是著名的机器学习库,可以迅速使用各类机器学习算法。
▲Scikit-leran
05 利用Python数据可视化
数据可视化是数据工作中的一项重要内容,它可以辅助分析也可以展示结果。本书主要介绍了Python众多可视化库中最为主流的Matplotlib:
06 总结:为什么要选这本书
《利用Python进行数据分析》第2版原作者是美国的数据科学家Wes McKinney,他毕业于麻省理工学院,是大名鼎鼎的Python数据技术类库pandas的创始人,在多家投资银行从事过数据科学类的工作。本书第一版由Wes McKinney写于2010年,经过7年的技术发展,第一版中的部分技术已不再适用,因此他于2017年发表了本书的第二版,对书中的大量技术、代码、示例进行了更新。由于本书大受好评,国内旋即引进。
关于作者:徐敬一,是《利用Python进行数据分析》第2版的译者,中国工商银行的数据分析师,他在工作中大量使用各类Python数据技术,对于Python的数学科学技术栈十分了解,同时英语水平良好,使本书的翻译质量得以保证。
延伸阅读《利用Python进行数据分析》
推荐语:适合刚学Python的数据分析师或刚学数据科学以及科学计算的Python编程者。阅读本书可以获得一份关于在Python下操作、处理、清洗、规整数据集的完整说明。
这里老表也联系到了机械工业出版社华章公司,为大家争取到了五本《利用Python进行数据分析(第二版)》赠书,赠书规则如下。
【赠书规则】
本文留言说说你对数据分析的认识或者为什么想要这本书,留言字数需要超过15个字,留言点赞倒数第一到倒数第五的朋友将获得赠书《利用Python进行数据分析(第二版)》一本。
活动截止时间:2021.3.23 20:00
注意:公众号留言仅展示前100条留言;活动截止前一天内的留言不入选;与留言主题无关留言或者留言字数不足15字的中奖无效,顺延至相关留言。
【更多福利】
扫码查看我朋友圈
获取最新学习资源
推荐大家关注两个公号
分享程序员生活、互联网资讯、理财复盘日记等
专注于Java学习分享,从零和你一起学Java
关注后回复【1024】
送上独家资料
◆◆◆
欢迎大家围观朋友圈,我的微信:pythonbrief
学习更多:
整理了我开始分享学习笔记到现在超过250篇优质文章,涵盖数据分析、爬虫、机器学习等方面,别再说不知道该从哪开始,实战哪里找了
“点赞”传统美德不能丢
推荐大家关注两个公号
学习更多: 整理了我开始分享学习笔记到现在超过250篇优质文章,涵盖数据分析、爬虫、机器学习等方面,别再说不知道该从哪开始,实战哪里找了
“点赞”传统美德不能丢