双十一、不如买一本书吧

Python之王

共 3932字,需浏览 8分钟

 ·

2021-11-12 15:22

我的第一本书出版了:《人工智能数学基础与Python机器学习实战》。

内容简介

通常来说,人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能的研究领域包括机器人、语音识别、图像识别、自然语言处理和专家系统等。

机器学习就是用算法解析数据,不断学习,对世界中发生的事做出判断和预测的一项技术。生活中很多机器学习的书籍只注重算法理论方法,并没有注重算法的落地。本书是初学者非常期待的入门书,书中有很多的示例可以帮助初学者快速上手。

本书包括3个部分:

  • 第1部分介绍基本的数学工具和机器学习的概念;

  • 第2部分系统深入地讲解现今已成熟的机器学习方法和技术;

  • 第3部分介绍了SparkSpark机器学习

本书适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充深度学习知识,以便在实际产品或平台中应用的软件工程师。

本书特色

有些读者在学习时会有这样一种感觉:一门课学完了、考试过了,却不知道学了有什么用,尤其是数学类的课程。这是因为传统教材大多数是按照“定义—例题—计算”的步骤来大篇幅罗列数学概念,偏重理论定义和运算技巧,不注重梳理学科内在的逻辑脉络,更没能深刻挖掘出本学科与当下前沿技术的交汇点。因此,本书采用了很多的案例和代码,不局限于算法本身,更注重于实践方面。

本书具有以下特点:。

  • 脉络清晰:数学基础、算法详解和持续探索。

  • 系统全面:网罗监督学习回归、监督学习分类、无监督学习、半监督学习等机器学习算法。

  • 注重实战:使用Python进行机器学习的项目实战,使用sklearn实现算法模型的搭建。

  • 紧跟发展:不局限于Python中的sklearn的学习,还紧跟大数据时代的发展。

  • 知识范围广:本书的知识广度比较大,涉及了高等数学、线性代数、概率论、数据处理和机器学习算法等方面。

具体大纲

下面是本书的具体具体大纲

第一章:走进机器学习的世界

  • 1.1 机器学习概述
    • 1.1.1 什么是机器学习
    • 1.1.2 机器学习的分类
  • 1.2 Python编程语言
    • 1.2.1 Python环境搭建
    • 1.2.2 机器学习相关软件包介绍
  • 1.3 机器学习的数学知识
    • 1.3.1 导数
    • 1.3.2 基本函数的求导公式
    • 1.3.3 求导法则
    • 1.3.4 Python实现求导
    • 1.3.5 泰勒展开式
    • 1.3.6 微积分基本定理
    • 1.3.7 基本函数的积分公式
    • 1.3.8 Python实现积分

第二章:人工智能数学基础

  • 2.1 线性代数
    • 2.1.1 向量及其线性运算
    • 2.1.2 矩阵及其线性运算
  • 2.2 随机变量
    • 2.2.1 离散型随机变量
    • 2.2.2 连续型随机变量
  • 2.3 随机变量概率分布
    • 2.3.1 伯努利分布
    • 2.3.2 泊松分布
    • 2.3.3 指数分布
    • 2.3.4 二项分布
    • 2.3.5 正态分布
    • 2.3.6 伽马分布
    • 2.3.7 贝塔分布
    • 2.3.8 卡方分布
    • 2.3.9 t分布
    • 2.3.10 F分布

第三章:数据获取和预处理

  • 3.1 数据获取
    • 3.1.1 自带和下载数据集
    • 3.1.2 创建数据集
    • 3.1.3数据集
  • 3.2 标准化
    • 3.2.1 z-score标准化
    • 3.2.2 Min-max标准化
  • 3.3二值化
    • 3.3.1 特征二值化
    • 3.3.2 标签二值化
  • 3.4 特征处理
    • 3.4.1 独热编码
    • 3.4.2 多项式特征
    • 3.4.3 PCA降维
  • 3.5 数据消洗
    • 3.5.1 Pandas数据消洗
    • 3.5.2 sklearn处理缺失值
  • 3.6 文本特征提取
    • 3.6.1 字典提取器
    • 3.6.2 词袋模型
    • 3.6.3 权重向量
  • 3.7 图像特征提取
    • 3.7.1 提取像素矩阵
    • 3.7.2 提取角点
    • 3.7.3 提取轮廓
    • 3.7.4 提取局部特征点
  • 3.8 特征选择
    • 3.8.1 Filter过滤去
    • 3.8.2 Wrapper包装法
    • 3.8.3 Embedded嵌入法

第4章:线性回归和逻辑回归

  • 4.1 线性回归
    • 4.1.1 最小二乘法
    • 4.1.2 梯度下降法
    • 4.1.3 线性回归实现
    • 4.1.4 Lasso回归和岭回归
    • 4.1.5 回归模型评估
    • 4.1.6 多项式回归
  • 4.2 逻辑回归
    • 4.2.1 逻辑回归算法
    • 4.2.2 逻辑回归实现
    • 4.2.3 分类模型评估

第5章 KNN和贝叶斯分类算法

  • 5.1 KNN算法
    • 5.1.1 KNN算法的距离度量
    • 5.1.2 KNN算法的代码实现
    • 5.1.3 交叉验证
    • 5.1.4 KD树
  • 5.2 贝叶斯分类算法
    • 5.2.1 贝叶斯定理
    • 5.2.2 高斯朴素贝叶斯
    • 5.2.3 多项式朴素贝叶斯
    • 5.2.4 伯努利朴素贝叶斯

第6章 决策树和随机森林

  • 6.1 决策树
    • 6.1.1 熵
    • 6.1.2 决策树算法
    • 6.1.3 剪枝算法
  • 6.2 决策树代码实现
    • 6.2.1 可视化决策树
    • 6.2.2 分类树
    • 6.2.3 回归树
  • 6.3 随机森林
    • 6.3.1 集成学习算法
    • 6.3.2 随机森林分类
    • 6.3.3 随机森林回归

第7章 支持向量机

  • 7.1 SVM核心概念
    • 7.1.1 线性可分
    • 7.1.2 核函数
    • 7.1.3 剪枝算法
  • 7.2 SVM代码实现
    • 7.2.1 SVC
    • 7.2.2 SVM人脸识别
    • 7.2.3 SVR

第8章 聚类算法

  • 8.1 K-means聚类算法
    • 8.1.1 K- means聚类算法原理
    • 8.1.2 模型评估
    • 8.1.3 图像处理
    • 8.1.4 K-means聚类算法实例

    • 8.2.1 层次聚类算法原理
    • 8.2.2 层次聚类算法实例
    1. 层次聚类算法
  • 8.3 密度聚类算法
    • 8.3.1 密度聚类算法原理
    • 8.3.2 密度聚类算法实例

第9章 EM和HMM聚类算法

  • 9.1 EM聚类算法
    • 9.1.1 最大似然估计
    • 9.1.2 詹森不等式
    • 9.1.3 EM算法原理
  • 9.2 EM算法代码实现
  • 9.3 HMM聚类算法
    • 9.3.1 马尔可夫过程
    • 9.3.2 隐马尔可夫模型

第10章 主题模型

  • 10.1 LDA主题模型
    • 10.1.1 Dirichlet分布
    • 10.1.2 LDA贝叶斯模型
  • 10.2 自然语言处理常用工具包
    • 10.2.1 NLTK
    • 10.2.2 spacy
    • 10.2.3 Gensim
    • 10.2.4 jieba
    • 10.2.5 Stanford nlp
    • 10.2.6 Fuzzywuzzy
    • 10.2.7 Hanlp
  • 10.3 LDA主题模型实例

第11章 推荐算法

  • 11.1关联规则
    • 11.1.1 置信度
    • 11.1.2 支持度
    • 11.1.3 提升度
    • 11.1.4 代码实现
  • 11.2 基于用户行为的推荐算法
    • 11.2.1 矩阵分解
    • 11.2.2 SVD代码实现
  • 11.3 基于评分的推荐算法
    • 11.3.1 Slope One算法
    • 11.3.2 Slopeonef代码实现
  • 11.4 协同过滤

第12章 数据建模

  • 12.1 监督学习
    • 12.1.1 监督学习回归
    • 12.1.2 监督学习分类
  • 12.2 半监督学习
    • 12.2.1 标签传播算法
    • 12.2.2 半监督学习分类
  • 11.3 保存模型
    • 12.3.1 pickle
    • 12.3.2 joblib
    • 12.3.3 sklearn2pmml
  • 第12章 数据建模
  • 12.1 监督学习
    • 12.1.1 监督学习回归
    • 12.1.2 监督学习分类
  • 12.2 半监督学习
    • 12.2.1 标签传播算法
    • 12.2.2 半监督学习分类
  • 12.3 保存模型
    • 12.3.1 pickle
    • 12.3.2 joblib
    • 12.3.3 sklearn2pmml

第13章 Spark机器学习

  • 13.1 Spak分布式集群搭建
    • 13.1.1 创建Centos7虚拟机
    • 13.1.2 设置静态ip
    • 13.1.3 配置SSH服务
    • 13.1.4 安装Java
    • 13.1.5 搭建三台Centos7主机
    • 13.1.6 修改hosts文件
    • 13.1.7  配置SSH免密码登录
    • 13.1.8 搭建Hadoop集群
    • 13.1.9 搭建Zookeeper集群
    • 13.1.10 启动Hadoop和Zookeeper集群
    • 13.1.11 搭建Spark集群
  • 13.2 Hadoop和Spark的基础知识
    • 13.2.1 HDFS
    • 13.2.2 Spark Shell
    • 13.2.3 RDD编程
    • 13.2.4 Spark SQL
  • 13.3 Spark mllib
    • 13.3.1 回归模型
    • 13.3.2 分类模型

笔者感触

笔者:刘润森,熟悉PyTorch、TensorFlow等深度学习框架,对计算机视觉、机器学习和深度学习有深入研究

笔者最早从大一下学期开始接续学习机器学习,也曾在 CSDN 中分享一些相关机器学习的教程和其他IT领域的学习笔记,因此有出版社的朋友找到笔者,希望可以将这些内容整理成书,于是就有 了这本书。

对笔者而言,本书也是对自己学习成果的总结。大家千万不要认为学习机器学习就是调包,而忽视了里面数学的美,也不要过于在意里面的复杂算法。就国内而言,除少数公司的少数机器学习部门是推公式、做理论优化外,大部分机器学习岗位都是在用成熟的工具做开发、搞特征、调模型、上线产品。

例如,阿里云机器学习PAI平台,封装了上百种算法,提供了完整的机器学习链路,重点是具有可视化操作界面,通过拖曳操作,进行少量配置,即可完成业务处理。这里提醒一句,数学对于机器学习来说也是非常重要的。同时,数据分析也很重要,这里包括对数据的理解、对统计学的认知等,可以说,一个好的机器学习算法工程师也一定是一个好的数据分析师。

购买链接

下面是这本书在京东上的购买链接,淘宝天猫等购物平台均有销售,喜欢就看看,不喜欢静静走开即可。


更多的详情,点击阅读原文查看

浏览 6
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报