双十一、不如买一本书吧
共 3932字,需浏览 8分钟
·
2021-11-12 15:22
我的第一本书出版了:《人工智能数学基础与Python机器学习实战》。
内容简介
通常来说,人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能的研究领域包括机器人、语音识别、图像识别、自然语言处理和专家系统等。
机器学习就是用算法解析数据,不断学习,对世界中发生的事做出判断和预测的一项技术。生活中很多机器学习的书籍只注重算法理论方法,并没有注重算法的落地。本书是初学者非常期待的入门书,书中有很多的示例可以帮助初学者快速上手。
本书包括3个部分:
第1部分介绍基本的数学工具和机器学习的概念;
第2部分系统深入地讲解现今已成熟的机器学习方法和技术;
第3部分介绍了SparkSpark机器学习
本书适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充深度学习知识,以便在实际产品或平台中应用的软件工程师。
本书特色
有些读者在学习时会有这样一种感觉:一门课学完了、考试过了,却不知道学了有什么用,尤其是数学类的课程。这是因为传统教材大多数是按照“定义—例题—计算”的步骤来大篇幅罗列数学概念,偏重理论定义和运算技巧,不注重梳理学科内在的逻辑脉络,更没能深刻挖掘出本学科与当下前沿技术的交汇点。因此,本书采用了很多的案例和代码,不局限于算法本身,更注重于实践方面。
本书具有以下特点:。
脉络清晰:数学基础、算法详解和持续探索。
系统全面:网罗监督学习回归、监督学习分类、无监督学习、半监督学习等机器学习算法。
注重实战:使用Python进行机器学习的项目实战,使用sklearn实现算法模型的搭建。
紧跟发展:不局限于Python中的sklearn的学习,还紧跟大数据时代的发展。
知识范围广:本书的知识广度比较大,涉及了高等数学、线性代数、概率论、数据处理和机器学习算法等方面。
具体大纲
下面是本书的具体具体大纲
第一章:走进机器学习的世界
1.1 机器学习概述 1.1.1 什么是机器学习 1.1.2 机器学习的分类 1.2 Python编程语言 1.2.1 Python环境搭建 1.2.2 机器学习相关软件包介绍 1.3 机器学习的数学知识 1.3.1 导数 1.3.2 基本函数的求导公式 1.3.3 求导法则 1.3.4 Python实现求导 1.3.5 泰勒展开式 1.3.6 微积分基本定理 1.3.7 基本函数的积分公式 1.3.8 Python实现积分
第二章:人工智能数学基础
2.1 线性代数 2.1.1 向量及其线性运算 2.1.2 矩阵及其线性运算 2.2 随机变量 2.2.1 离散型随机变量 2.2.2 连续型随机变量 2.3 随机变量概率分布 2.3.1 伯努利分布 2.3.2 泊松分布 2.3.3 指数分布 2.3.4 二项分布 2.3.5 正态分布 2.3.6 伽马分布 2.3.7 贝塔分布 2.3.8 卡方分布 2.3.9 t分布 2.3.10 F分布
第三章:数据获取和预处理
3.1 数据获取 3.1.1 自带和下载数据集 3.1.2 创建数据集 3.1.3数据集 3.2 标准化 3.2.1 z-score标准化 3.2.2 Min-max标准化 3.3二值化 3.3.1 特征二值化 3.3.2 标签二值化 3.4 特征处理 3.4.1 独热编码 3.4.2 多项式特征 3.4.3 PCA降维 3.5 数据消洗 3.5.1 Pandas数据消洗 3.5.2 sklearn处理缺失值 3.6 文本特征提取 3.6.1 字典提取器 3.6.2 词袋模型 3.6.3 权重向量 3.7 图像特征提取 3.7.1 提取像素矩阵 3.7.2 提取角点 3.7.3 提取轮廓 3.7.4 提取局部特征点 3.8 特征选择 3.8.1 Filter过滤去 3.8.2 Wrapper包装法 3.8.3 Embedded嵌入法
第4章:线性回归和逻辑回归
4.1 线性回归 4.1.1 最小二乘法 4.1.2 梯度下降法 4.1.3 线性回归实现 4.1.4 Lasso回归和岭回归 4.1.5 回归模型评估 4.1.6 多项式回归 4.2 逻辑回归 4.2.1 逻辑回归算法 4.2.2 逻辑回归实现 4.2.3 分类模型评估
第5章 KNN和贝叶斯分类算法
5.1 KNN算法 5.1.1 KNN算法的距离度量 5.1.2 KNN算法的代码实现 5.1.3 交叉验证 5.1.4 KD树 5.2 贝叶斯分类算法 5.2.1 贝叶斯定理 5.2.2 高斯朴素贝叶斯 5.2.3 多项式朴素贝叶斯 5.2.4 伯努利朴素贝叶斯
第6章 决策树和随机森林
6.1 决策树 6.1.1 熵 6.1.2 决策树算法 6.1.3 剪枝算法 6.2 决策树代码实现 6.2.1 可视化决策树 6.2.2 分类树 6.2.3 回归树 6.3 随机森林 6.3.1 集成学习算法 6.3.2 随机森林分类 6.3.3 随机森林回归
第7章 支持向量机
7.1 SVM核心概念 7.1.1 线性可分 7.1.2 核函数 7.1.3 剪枝算法 7.2 SVM代码实现 7.2.1 SVC 7.2.2 SVM人脸识别 7.2.3 SVR
第8章 聚类算法
8.1 K-means聚类算法 8.1.1 K- means聚类算法原理 8.1.2 模型评估 8.1.3 图像处理 8.1.4 K-means聚类算法实例 8.2.1 层次聚类算法原理 8.2.2 层次聚类算法实例 层次聚类算法 8.3 密度聚类算法 8.3.1 密度聚类算法原理 8.3.2 密度聚类算法实例
第9章 EM和HMM聚类算法
9.1 EM聚类算法 9.1.1 最大似然估计 9.1.2 詹森不等式 9.1.3 EM算法原理 9.2 EM算法代码实现 9.3 HMM聚类算法 9.3.1 马尔可夫过程 9.3.2 隐马尔可夫模型
第10章 主题模型
10.1 LDA主题模型 10.1.1 Dirichlet分布 10.1.2 LDA贝叶斯模型 10.2 自然语言处理常用工具包 10.2.1 NLTK 10.2.2 spacy 10.2.3 Gensim 10.2.4 jieba 10.2.5 Stanford nlp 10.2.6 Fuzzywuzzy 10.2.7 Hanlp 10.3 LDA主题模型实例
第11章 推荐算法
11.1关联规则 11.1.1 置信度 11.1.2 支持度 11.1.3 提升度 11.1.4 代码实现 11.2 基于用户行为的推荐算法 11.2.1 矩阵分解 11.2.2 SVD代码实现 11.3 基于评分的推荐算法 11.3.1 Slope One算法 11.3.2 Slopeonef代码实现 11.4 协同过滤
第12章 数据建模
12.1 监督学习 12.1.1 监督学习回归 12.1.2 监督学习分类 12.2 半监督学习 12.2.1 标签传播算法 12.2.2 半监督学习分类 11.3 保存模型 12.3.1 pickle 12.3.2 joblib 12.3.3 sklearn2pmml 第12章 数据建模 12.1 监督学习 12.1.1 监督学习回归 12.1.2 监督学习分类 12.2 半监督学习 12.2.1 标签传播算法 12.2.2 半监督学习分类 12.3 保存模型 12.3.1 pickle 12.3.2 joblib 12.3.3 sklearn2pmml
第13章 Spark机器学习
13.1 Spak分布式集群搭建 13.1.1 创建Centos7虚拟机 13.1.2 设置静态ip 13.1.3 配置SSH服务 13.1.4 安装Java 13.1.5 搭建三台Centos7主机 13.1.6 修改hosts文件 13.1.7 配置SSH免密码登录 13.1.8 搭建Hadoop集群 13.1.9 搭建Zookeeper集群 13.1.10 启动Hadoop和Zookeeper集群 13.1.11 搭建Spark集群 13.2 Hadoop和Spark的基础知识 13.2.1 HDFS 13.2.2 Spark Shell 13.2.3 RDD编程 13.2.4 Spark SQL 13.3 Spark mllib 13.3.1 回归模型 13.3.2 分类模型
笔者感触
笔者:刘润森,熟悉PyTorch、TensorFlow等深度学习框架,对计算机视觉、机器学习和深度学习有深入研究
笔者最早从大一下学期开始接续学习机器学习,也曾在 CSDN 中分享一些相关机器学习的教程和其他IT领域的学习笔记,因此有出版社的朋友找到笔者,希望可以将这些内容整理成书,于是就有 了这本书。
对笔者而言,本书也是对自己学习成果的总结。大家千万不要认为学习机器学习就是调包,而忽视了里面数学的美,也不要过于在意里面的复杂算法。就国内而言,除少数公司的少数机器学习部门是推公式、做理论优化外,大部分机器学习岗位都是在用成熟的工具做开发、搞特征、调模型、上线产品。
例如,阿里云机器学习PAI平台,封装了上百种算法,提供了完整的机器学习链路,重点是具有可视化操作界面,通过拖曳操作,进行少量配置,即可完成业务处理。这里提醒一句,数学对于机器学习来说也是非常重要的。同时,数据分析也很重要,这里包括对数据的理解、对统计学的认知等,可以说,一个好的机器学习算法工程师也一定是一个好的数据分析师。
购买链接
下面是这本书在京东上的购买链接,淘宝天猫等购物平台均有销售,喜欢就看看,不喜欢静静走开即可。
更多的详情,点击阅读原文查看