图解 72 个机器学习基础知识点
数据分析1480
共 7986字,需浏览 16分钟
·
2023-07-27 07:25
1. 机器学习概述
1)什么是机器学习
2)机器学习三要素
(1)数据
(2)模型&算法
3)机器学习发展历程
4)机器学习核心技术
5)机器学习基本流程
6)机器学习应用场景
2.机器学习基本名词
3.机器学习算法分类
1)机器学习算法依托的问题场景
更多监督学习的算法模型总结,可以查看ShowMeAI的文章 AI知识技能速查 | 机器学习-监督学习(公众号不能跳转,本文链接见文末)。
更多无监督学习的算法模型总结可以查看ShowMeAI的文章 AI知识技能速查 | 机器学习-无监督学习。
2)分类问题
了解更多机器学习分类算法:KNN算法、逻辑回归算法、朴素贝叶斯算法、决策树模型、随机森林分类模型、GBDT模型、XGBoost模型、支持向量机模型等。(公众号不能跳转,本文链接见文末)
3)回归问题
了解更多机器学习回归算法:决策树模型、随机森林分类模型、GBDT模型、回归树模型、支持向量机模型等。
4)聚类问题
了解更多机器学习聚类算法:聚类算法。
5)降维问题
了解更多机器学习降维算法:PCA降维算法。
4.机器学习模型评估与选择
1)机器学习与数据拟合
2)训练集与数据集
3)经验误差
4)过拟合
5)偏差
8)性能度量指标
(1)回归问题
(2)分类问题
从一个比较高的角度来认识AUC:仍然以异常用户的识别为例,高的AUC值意味着,模型在能够尽可能多地识别异常用户的情况下,仍然对正常用户有着一个较低的误判率(不会因为为了识别异常用户,而将大量的正常用户给误判为异常。
9)评估方法
10)模型调优与选择准则
表达力好的模型,可以较好地对训练数据中的规律和模式进行学习;
-
复杂度低的模型,方差较小,不容易过拟合,有较好的泛化表达。
11)如何选择最优的模型
(1)验证集评估选择
切分数据为训练集和验证集。
对于准备好的候选超参数,在训练集上进行模型,在验证集上评估。
(2)网格搜索/随机搜索交叉验证
通过网格搜索/随机搜索产出候选的超参数组。
对参数组的每一组超参数,使用交叉验证评估效果。
选出效果最好的超参数。
(3)贝叶斯优化
-
基于贝叶斯优化的超参数调优。
评论