想成为数据科学家,需要多少数学技能?
导读:本文为大家介绍了在数据科学和机器学习中所需要的基本数学技能,并且分类给出了相应的主题建议。
01 引言
我几乎没有数学背景,可以成为一个数据科学家吗? 数据科学中的哪些基本数学技能很重要?
Ggplot2 Matplotlib Seaborn Scikit-learn Caret TensorFlow PyTorch Keras
02 案例:建立多元回归模型
我的数据集有多大? 我的特征变量和目标变量是什么? 哪些预测特征与目标变量最相关? 哪些特征很重要? 我应该进行特征缩放吗? 我的数据集应如何划分为训练集和测试集? 什么是主成分分析(PCA)? 我应该使用PCA删除冗余特征吗? 如何评估我的模型?我应该使用R2_score,平均平方误差(MSE)还是平均绝对误差(MAE)? 如何提高模型的预测能力? 我应该使用正则化回归模型吗? 哪些是回归系数? 哪些是截距? 我应该使用非参数回归模型,例如K近邻回归还是支持向量回归(SVR)? 我的模型中有哪些超参数,如何对其进行微调以获得性能最佳的模型?
03 数据科学和机器学习的基本数学技能
均值,中位数,众数,标准差/方差,相关系数,协方差矩阵; 概率分布(二项分布、泊松分布、正态分布),p值,贝叶斯定理(精度、召回率、阳性预测值、阴性预测值、混淆矩阵、ROC曲线); 中心极限定理,R2_score,MSE(均方误差),A / B测试,蒙特卡洛模拟…
多变量函数; 导数和梯度; 阶跃函数,Sigmoid函数,Logit函数,ReLU函数(整流线性单位函数,Rectified Linear Unit); 成本函数; 函数绘图; 函数的最小值和最大值…
向量; 向量的范数; 矩阵,转置矩阵,矩阵的逆,矩阵的行列式,矩阵的迹; 点积,特征值,特征向量…
成本函数/目标函数; 似然函数; 损失函数; 梯度下降算法及其变体(例如,随机梯度下降算法)…
04 结论
参考资料
延伸阅读👇
评论