r - R中的钟形百分位曲线

我有一个包含学生分数的变量。我正在寻找绘制分数百分位数的最佳方法。让我的数据一瞥,

[1] 26 30 27 28 27 27 29 28  3 12 27 24 29 25 26 30 25 27 28 27 25 14 30 28 24 28 27
  [28] 19 18 25 28 24 24  6 20 28 28 27 22 27 19 22 21 20 30 29 26 30 28 29 28 29 25 25
  [55] 27 26 20 26 10 21 20 16 24 24 26 27 28 27 29 29 27 23 20 18 19 26 21 25 17 22 28
  [82] 26 27 27 25 26 25 29 29 28 25 22 30 29 28 28 25 29 30 27 28 28 30 28 29 29 30 29
 [109] 27 27 28 24 25 15 20 25 24 25 28 26 27 21 18 24 24 23 30 23 28 22 29 26 29 25 29
 [136] 20 25 28 12 16 23 13 17 12 17 26 13 26 28 26 25 27 21 30 30 30 27 20 24 21 28 26
 [163] 22 21 26 29 28 24 30 22 21 25 26 28 26 23 27 25 24 27 15 21 13 28 30 29 28 27 23
 [190] 27 23 28 29 18 27 23 24 28 30 30 30 29 18 24 21 17 16 12 28 22 23 26 21 12 20 20
 [217] 26 28 27 27 30 26 29 27 24 23 27 26 14 23 16 15 26 28 27 27 25 29 15 23 22 29 26
 [244] 20 20 21 21 24 24 20 25 23 22 24 22 26 28 28 27 24 28 28 27 27 27 21 23 21 24 28
 [271] 25 23 19 21 20 21 23

为了可重现的目的,我使用了以下代码,

x <- seq(0,50,length=100)
quantile(x,c(.10,.20,.30,.40,.50,.60,.70,.80,.90,1)) 

10%  20%  30%  40%  50%  60%  70%  80%  90% 100% 
   5   10   15   20   25   30   35   40   45   50 

我尝试了 plot(quantile(x,c(.10,.20,.30,.40,.50,.60,.70,.80,.90,1))) 但情节并未以理想的方式呈现。我看起来像一个正态分布的钟形曲线,它会显示如下所示的百分比,

为了做到这一点,我认为我应该将变量转换为正态分布变量并使用以下内容,

 y <- dnorm(x)
plot(x,y,type="l")

得到如下输出,

> z <- scale(x)
> y <- dnorm(z)
> plot(z,y, type= "l")

最佳答案

我想你正在寻找这样的东西:

x <- c(26 ,30 ,27 ,28 ,27 ,27 ,29 ,28 , 3 ,12 ,27 ,24 ,29 ,25 ,26 ,30 ,25 ,27 ,28 ,27 ,25 ,14 ,30 ,28 ,24 ,28 ,27
       ,19 ,18 ,25 ,28 ,24 ,24 , 6 ,20 ,28 ,28 ,27 ,22 ,27 ,19 ,22 ,21 ,20 ,30 ,29 ,26 ,30 ,28 ,29 ,28 ,29 ,25 ,25
       ,27 ,26 ,20 ,26 ,10 ,21 ,20 ,16 ,24 ,24 ,26 ,27 ,28 ,27 ,29 ,29 ,27 ,23 ,20 ,18 ,19 ,26 ,21 ,25 ,17 ,22 ,28
       ,26 ,27 ,27 ,25 ,26 ,25 ,29 ,29 ,28 ,25 ,22 ,30 ,29 ,28 ,28 ,25 ,29 ,30 ,27 ,28 ,28 ,30 ,28 ,29 ,29 ,30 ,29
       ,27 ,27 ,28 ,24 ,25 ,15 ,20 ,25 ,24 ,25 ,28 ,26 ,27 ,21 ,18 ,24 ,24 ,23 ,30 ,23 ,28 ,22 ,29 ,26 ,29 ,25 ,29
       ,20 ,25 ,28 ,12 ,16 ,23 ,13 ,17 ,12 ,17 ,26 ,13 ,26 ,28 ,26 ,25 ,27 ,21 ,30 ,30 ,30 ,27 ,20 ,24 ,21 ,28 ,26
       ,22 ,21 ,26 ,29 ,28 ,24 ,30 ,22 ,21 ,25 ,26 ,28 ,26 ,23 ,27 ,25 ,24 ,27 ,15 ,21 ,13 ,28 ,30 ,29 ,28 ,27 ,23
       ,27 ,23 ,28 ,29 ,18 ,27 ,23 ,24 ,28 ,30 ,30 ,30 ,29 ,18 ,24 ,21 ,17 ,16 ,12 ,28 ,22 ,23 ,26 ,21 ,12 ,20 ,20
       ,26 ,28 ,27 ,27 ,30 ,26 ,29 ,27 ,24 ,23 ,27 ,26 ,14 ,23 ,16 ,15 ,26 ,28 ,27 ,27 ,25 ,29 ,15 ,23 ,22 ,29 ,26
       ,20 ,20 ,21 ,21 ,24 ,24 ,20 ,25 ,23 ,22 ,24 ,22 ,26 ,28 ,28 ,27 ,24 ,28 ,28 ,27 ,27 ,27 ,21 ,23 ,21 ,24 ,28
       ,25 ,23 ,19 ,21 ,20 ,21 ,23)

dens <- density(x)
plot(dens)
tot <- sum(dens$y)
qs <- sapply(c(0.25, 0.5, 0.75), function (i) max(which(cumsum(dens$y) <= tot*i)))
lines(x = dens$x[qs], y = dens$y[qs], type = "h")
text(x = c(20, 24, 26.6, 29.5), y = 0.02, labels = c("25%", "50%", "75%", "100%"))

我觉得可能有更简单的方法来获取 qs 值,但这似乎也有效。您可以使用“25%、50%... 到这里为止”或将它们全部设为 25%。

https://stackoverflow.com/questions/33906101/

相关文章:

python - 如何在python中为字符串添加前缀和后缀

java - 当新阶段弹出时,我如何禁用初级阶段

css - 输入内的响应式 fa-icon

solr - 使用身份验证在控制台中创建 Solr 核心

c# - 还有其他更好的方法可以将参数传递给 backgroundworker runasync 吗

arrays - 将数组附加到数组

cordova - react 路由器和 Cordova 不工作

php - 编译PHP7错误

php - 使用 Prestashop 1.6 在模块中获取产品类别名称

rx-java - 将热 Observable 转换为冷 Observable