R语言中的Theil-Sen回归分析
数据派THU
共 2561字,需浏览 6分钟
· 2024-04-12
来源:拓端数据部落 本文约1000字,建议阅读5分钟 Theil-Sen估计器是一种在社会科学中不常用的简单线性回归估计器。
在数据中所有点之间绘制一条线
计算每条线的斜率
中位数斜率是回归斜率
用这种方法计算斜率非常可靠。当误差呈正态分布且没有异常值时,斜率与OLS非常相似。
相关视频
有几种获取截距的方法。如果关心回归中的截距,那么知道软件在做什么是很合理的。
当我对异常值和异方差性有担忧时,请在上方针对Theil-Sen进行简单线性回归的评论。
我进行了一次模拟,以了解Theil-Sen如何在异方差下与OLS比较。它是更有效的估计器。
library(simglm)
library(ggplot2)
library(dplyr)
library(WRS)
# Hetero
nRep <- 100
n.s <- c(seq(50, 300, 50), 400, 550, 750, 1000)
samp.dat <- sample((1:(nRep*length(n.s))), 25)
lm.coefs.0 <- matrix(ncol = 3, nrow = nRep*length(n.s))
ts.coefs.0 <- matrix(ncol = 3, nrow = nRep*length(n.s))
lmt.coefs.0 <- matrix(ncol = 3, nrow = nRep*length(n.s))
dat.s <- list()
ggplot(dat.frms.0, aes(x = age, y = sim_data)) +
geom_point(shape = 1, size = .5) +
geom_smooth(method = "lm", se = FALSE) +
facet_wrap(~ random.sample, nrow = 5) +
labs(x = "Predictor", y = "Outcome",
title = "Random sample of 25 datasets from 15000 datasets for simulation",
subtitle = "Heteroscedastic relationships")
ggplot(coefs.0, aes(x = n, colour = Estimator)) +
geom_boxplot(
aes(ymin = q025, lower = q25, middle = q50, upper = q75, ymax = q975), data = summarise(
group_by(coefs.0, n, Estimator), q025 = quantile(Slope, .025),
q25 = quantile(Slope, .25), q50 = quantile(Slope, .5),
q75 = quantile(Slope, .75), q975 = quantile(Slope, .975)), stat = "identity") +
geom_hline(yintercept = 2, linetype = 2) + scale_y_continuous(breaks = seq(1, 3, .05)) +
labs(x = "Sample size", y = "Slope",
title = "Estimation of regression slope in simple linear regression under heteroscedasticity",
subtitle = "1500 replications - Population slope is 2",
caption = paste(
"Boxes are IQR, whiskers are middle 95% of slopes",
"Both estimators are unbiased in the long run, however, OLS has higher variability",
sep = "\n"
))
原文链接:http://tecdat.cn/?p=10080
编辑:于腾凯
校对:林亦霖
评论
如何画出漂亮的神经网络图?神经网络可视化工具集锦搜集
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达1. draw_convnet一个用于画卷积神经网络的Python脚本https://github.com/gwding/draw_convnet2. NNSVGhttp://alexlenail.me/NN-SVG/LeNet.
小白学视觉
0
如何看待稚晖君的时间管理水平?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达计算机视觉life整理原文链接:https://www.zhihu.com/question/491456524/answer/2183081310稚晖君究竟是如何安排业余时间去做这么多高水平的项目?而且每个项目的用时也很少,普通
小白学视觉
2
三个优秀的PyTorch实现语义分割框架
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达转自 | 机器学习AI算法工程使用的VOC数据集链接开放在文章中,预训练模型已上传Github,环境我使用Colab pro,大家下载模型做预测即可。代码链接: https://github.com/lixiang007
小白学视觉
0
如何确定神经网络的层数和隐藏层神经元数量?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达公众号:尤而小屋作者:呦呦鹿鸣编辑:Peter大家好,我是Peter~关于神经网络中隐藏层的层数和神经元个数充满了疑惑。刚好看到一篇文章很好地答疑了,分享给大家~https://zhuanlan.zhihu.com/p/10041
小白学视觉
0
神经网络之CNN与RNN的关系
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达1、CNN介绍CNN是一种利用卷积计算的神经网络。它可以通过卷积计算将原像素很大的图片保留主要特征变成很小的像素图片。本文以李宏毅老师ppt内容展开具体介绍。1.1 Why CNN for Image①为什么引入CNN ?图片示意
小白学视觉
0
“海优最初弄出来可并不是为了给大佬弟子开后门的, 学术界现在几乎不存在任何套利空间,不要相信有什么办法可以投机取巧”
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达知乎问题:为什么部分同学倾向土博+国外博后而不是直接国外读博?感觉身边土博越来越多,基本都是土博➕海博后,申国外phd的明显减少(相比较疫情之前几年)知乎Tianteman: 这个问题下,可以看得出一部分国内硕博信息检索能力差的离
小白学视觉
0
真高!比亚迪员工爆料比亚迪在越南的薪资水平:基本工资480万,全勤奖35万,交通补助20万,餐补110万,每周6天,每天10小时
上一篇:某大公司为逼迫员工离职,竟然把他的工位安排到厕所旁,没想到他直接开始记录领导的如厕时间,还发到公司大群...对此,你怎么看?--完--PS:欢迎在留言区留下你的观点,一起讨论提高。如果今天的文章让你有新的启发,欢迎转发分享给更多人。全文完,感谢你的耐心阅读。如果你还想看到我的文章,请一定给本
开发者全社区
0
太敢穿了!透视纱裙!性感火辣的身材
绝了呀今天的厂花:吴宣仪1995年1月26日,吴宣仪出生于海南省海口市,中国内地流行乐女歌手、影视演员。2016年2月,吴宣仪随宇宙少女发行首张迷你专辑正式出道。2018年4月,她参加《创造101》综艺选秀,获得第二名,成功加入火箭少女101组合。吴宣仪的颜值一直备受称赞,她的五官立体精致,皮肤白皙
逆锋起笔
0