403页数据处理+300页数据分析学习资料,带你用Python进阶数据分析师

Python知识圈

共 1739字,需浏览 4分钟

 ·

2021-08-24 16:54

Python 适用于数据处理与分析的显著特点,是其具有大量的标准模块、附加模块以及函数,可以非常方便地完成一般的数据处理与分析操作。内建库和标准库中的模块和函数是Python 的标准配置,所以只要你下载并安装了Python,就可以立即使用这些内建的模块和函数。


一、《Python数据处理》


这本资料采用基于项目的方法,介绍用Python 完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括:Python 基础知识,如何从CSV、Excel、XML、JSON 和PDF 文件中提取数据,如何获取与存储数据,各种数据清洗与分析技术,数据可视化方法,如何从网站和API 中提取数据。


全书共计12个章节,403页内容。

第1章 Python 简介


第2章 Python 基础



第3章 供机器读取的数据


第4章 处理Excel 文件


第5章 处理PDF 文件,以及用Python 解决问题

第6章 数据获取与存储
第7章 数据清洗:研究、匹配与格式化
第8章 数据清洗:标准化和脚本化
第9章 数据探索和分析
第10章 展示数据
第11章 网页抓取:获取并存储网络数据
第12章 高级网页抓取:屏幕抓取器与爬虫
第13章 应用编程接口
第14章 自动化和规模化
第15章 结论

领取方式见文末

二、《Python数据分析基础

本书展示如何用Python 程序将不同格式的数据处理和分析任务规模化和自动化。主要内容包括:Python 基础知识介绍、CSV 文件和Excel 文件读写、数据库的操作、示例程序演示、图表的创建,等等。

本书要讨论和使用的附加模块如下所示。

xlrd 和xlwt

  功能:解析与读写Microsoft Excel 工作簿。


mysqlclient/MySQL-python/MySQLdb

  功能:连接MySQL 数据库,在数据库表上运行查询。


pandas

  功能:读取各种类型的文件;管理、筛选和转换数据;聚合数据并计算基本统计量;创建各种类型的统计图表。


statsmodels

  功能:估计各种统计模型,包括线性回归模型、广义线性模型和分类模型。


scikit-learn

  功能:估计机器学习统计模型,包括回归、分类和聚类,以及执行数据处理、维度归约和交叉验证。


全书共计9大章节,近300页内容



第一章:Python基础


第二章:CSV文件


第三章:Excel文件


第四章:数据库


第五章:应用程序


第六章:图与图表


第七章:描述性统计与建模


第八章:按计划自动运行脚本


第九章:从这里启航


内容较多,就不做一一展示了

资料都带索引,方便阅读,两本书有各有长处,相辅相成!


完整资料,请扫描下方二维码领取

添加小助理的人数较多,请耐心等待哦


浏览 49
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报