考虑以下几点:
> foo
[1] 0 0 159 24 0 829 0 157 46 12 5 5 166 166 5 12 5 5 166 166 5 35
> mean(foo)
[1] 89.45455
> summary(fivenum(foo))
Min. 1st Qu. Median Mean 3rd Qu. Max.
0 5 12 201 159 829
这是什么垃圾?我不明白为什么 fivenum 计算的数字与“平均值”不同。我想问题出在我身上,但我不知道自己做错了什么。
最佳答案
为什么要在 fivenum
上调用 summary
?
比较:
foo <- c(0, 0, 159, 24, 0, 829, 0, 157, 46, 12, 5, 5, 166, 166, 5, 12,
5, 5, 166, 166, 5, 35)
> mean(foo)
[1] 89.45455
> summary(foo)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.00 5.00 12.00 89.45 158.50 829.00
> fivenum(foo)
[1] 0 5 12 159 829
> mean(fivenum(foo))
[1] 201
> summary(fivenum(foo))
Min. 1st Qu. Median Mean 3rd Qu. Max.
0 5 12 201 159 829
fivenum
返回一个长度为 5 的向量,“返回输入数据的 Tukey 五数摘要(最小值、下铰链、中值、上铰链、最大值)。”。请注意,那里没有提到 mean
:)
因此,当您执行 summary(fivenum(foo))
时,您正在计算向量 c(0, 5, 12, 159, 829)
的摘要统计信息。对于该向量,均值
确实是 201。
https://stackoverflow.com/questions/15941783/