机器学习需要掌握的 13 个概率分布
作者的 Github 开源地址: https://github.com/graykode/distribution-is-all-you-needgithub.com
1、均匀分布(连续)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/uniform.py
2、伯努利分布(离散)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/bernoulli.py
先验概率 p(x)不考虑伯努利分布。因此,如果我们对最大似然进行优化,那么我们很容易被过度拟合。
利用二元交叉熵对二项分类进行分类。它的形式与伯努利分布的负对数相同。
参数为 n 和 p 的二项分布是一系列 n 个独立实验中成功次数的离散概率分布。
二项式分布是指通过指定要提前挑选的数量而考虑先验概率的分布。
4、多伯努利分布/分类分布(离散)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/categorical.py
多伯努利称为分类分布。交叉熵和采取负对数的多伯努利分布具有相同的形式。
5、多项式分布(离散)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/multinomial.py
多项式分布与分类分布的关系与伯努尔分布与二项分布的关系相同。
6、β 分布(连续)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/beta.py
7、Dirichlet 分布(连续)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/dirichlet.py
8、伽马分布(连续)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/gamma.py
9、指数分布(连续)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/exponential.py
指数分布是 α 为 1 时 γ 分布的特例。
10、高斯分布(连续)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/gaussian.py
11、正态分布(连续)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/normal.py
正态分布为标准高斯分布,平均值为 0,标准差为 1。
12、卡方分布(连续)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/chi-squared.py
卡方分布是 β 分布的特例。
13、t 分布(连续)代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/student-t.py
t 分布是对称的钟形分布,与正态分布类似,但尾部较重,这意味着它更容易产生远低于平均值的值。