搭建机器学习开发环境及Python基础,108页PDF

共 5005字,需浏览 11分钟

 ·

2024-06-24 09:51






大家好,我是章北海


我正在撰写《机器学习算法与Python实战》专栏,分为基础篇、数学篇、模型篇、实战篇。


最近我把基础篇的6章内容整理了一下,做成了这个106页的PDF小册子


目录如下



一. 机器学习开发环境搭建


1.1 Python & Anaconda 安装及配置


1.2 Jupyter Notebook





  • 1.2.1 拓展插件





  • 1.2.2 自动检查代码错误




1.3 JupyterLab





  • 1.3.1 安装 Jupyterlab





  • 1.3.2 设置工作路径/取消密码





  • 1.3.3 添加JupyterLab快捷方式





  • 1.3.4 mito




1.4 VSCode





  • 1.4.1 安装





  • 1.4.2 配置





  • 1.4.3 插件





  • 1.4.4 主题




1.5 环境管理


1.6 包管理





  • 1.6.1 pip freeze





  • 1.6.2 pip cache





  • 1.6.3 pip list





  • 1.6.4 pip.init




1.7 必备工具





  • 1.7.1 Cmder





  • 1.7.2 Git




二. Python基础


2.0 Python 怎么学


2.1 Python版本和解释器


2.2 Python基本语法





  • 缩进





  • 注释





  • 标识符





  • 引号





  • 命名规范





  • 样式指南




2.3 数据类型





  • 2.3.1 数值类型





  • 2.3.2 文本类型:str





  • 2.3.3 布尔类型:bool





  • 2.3.4 序列类型





  • 2.3.5 映射类型:dict





  • 2.3.6 集合类型:set




2.4 运算符





  • 2.4.1 算术运算符





  • 2.4.2 比较运算符





  • 2.4.3 赋值运算符





  • 2.4.4 位运算符





  • 2.4.5 逻辑运算符





  • 2.4.6 成员运算符





  • 2.4.7 身份运算符




2.5 控制语句





  • 2.5.1 条件语句 - if





  • 2.5.1 循环语句 - while





  • 2.5.2 break和continue





  • 2.5.3 循环语句 - for




2.6 函数





  • 2.6.1 定义函数





  • 2.6.2 参数传递





  • 2.6.3 返回值





  • 2.6.4 作用域





  • 2.6.5 递归函数




2.7 包和模块





  • 2.7.1 模块





  • 2.7.2 包






    • 导入模块和包



三. Numpy


3.1 NumPy简介


3.2 数组基础





  • 3.2.1 创建NumPy数组





  • 3.2.2 数组的属性




3.3 数据操作





  • 3.3.1 基础操作





  • 3.3.2 数组运算





  • 3.3.3 数组索引与切片





  • 3.3.4 数组拼接





  • 3.3.5 Numpy与线性代数





  • 3.3.6 广播机制




3.4 NumPy的应用





  • 3.4.1 数据预处理





  • 3.4.2 公式表示





  • 3.4.3 模型实现




四. Pandas


4.1 Pandas简介





  • 4.1.1 创建Series:一维数组





  • 4.1.2 创建DateFrame:二维数组




4.2 数据读写





  • 4.2.1 在 pandas 中导入数据





  • 4.2.2 保存 DataFrame 数据




4.3 数据探索





  • 4.3.1 查看数据





  • 4.3.2 排序





  • 4.3.3 Pandas切片




4.4 数据清洗


4.5 数据操作





  • 4.5.1 选择数据





  • 4.5.2 数据合并




4.6 数据统计





  • 4.6.1 数据统计和描述





  • 4.6.2 分组、聚合、透视




4.7 数据可视化





  • 4.7.1 基础可视化





  • 4.7.2 高级可视化




4.8 Pandas AI


五. Matplotlib & Seaborn


5.1 Matplotlib简介


5.2 图表构成


5.3 常用设置





  • 5.3.1 figure






    • figure的常用设置





    • 设置figure标题





    • 添加文本





    • 设置图例





    • 设置子图间距






  • 5.3.2 axes






    • 创建axes





    • axes的常用设置





    • 设置标题





    • 设置图例





    • 设置坐标轴名称





    • 设置坐标轴范围





    • 隐藏边框





    • 显示网格





    • 添加注释






  • 5.3.3 axis






    • 设置坐标轴名称





    • 设置坐标轴刻度标签样式





    • 设置坐标轴刻度位置





    • 设置坐标轴位置





5.4 基本步骤


5.5 Seaborn简介





  • 5.5.1 Seaborn与matplotlib的关系





  • 5.5.2 Seaborn API





  • 5.5.3 Seaborn 实例




5.6 实战项目


5.7 补充资料/代码


六. Scikit-learn


6.1 简介


6.2 使用方法





  • 6.2.1 机器学习基本概念





  • 6.2.2 scikit-learn极简实例




6.3 Scikit-learn 机器学习完整流程、示例





  • 数据加载





  • 数据探索





  • 数据预处理





  • 模型训练





  • 模型评估




6.4 pipeline处理机制





  • 6.4.1 pipeline简介





  • 6.4.2 Pipeline的原理





  • 6.4.3 Pipeline的用法





  • 6.4.4 Pipeline妙用:模块化Feature Transform





  • 6.4.5 Pipeline妙用:自动化 Grid Search





  • 6.4.6 Pipeline其他用法










108页PDF小册子,售价39元,获取方式:


加我微信,发39元红包🧧即可








浏览 41
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报