数据分布和各种检验
数据管道
共 1724字,需浏览 4分钟
·
2021-12-19 00:11
左偏的话偏度<0,右偏的话偏度>0
正态分布的峰度是3,所以一般峰度-3。越尖越大
正确的异常值
错误的异常值
下限:Q1 - 1.5IQR
上限:Q3 + 1.5IQR
中位数:Q2
异常值:上下限之外的数值
误差和置信水平有关,置信水平越高(99%),则区间越大;
误差和样本方差有关,样本方差越大,区间越大
误差和样本数量有关,样本数量越小,区间越大
【第一类错误】如果原假设为真,而被我们拒绝了(新功能并没有比原功能更好,却被我们误以为新功能更好)的错误,叫做第一类错误。犯第一类错误的概率叫做显著性水平,一般我们会取0.05,0.1。
【第二类错误】如果备则假设为假,而被我们拒绝了(新功能比原功能更好,却没有被发现)的错误,叫做第二类错误。犯第二种错误的概率一般取0.2,反过来一般我们称之为统计功效 power = 1-
https://zhuanlan.zhihu.com/p/69888032
推荐阅读
欢迎长按扫码关注「数据管道」
评论