
230
|
第
9
章
#> 5%
#> 0.0451
如果我们将概率的含义理解为相对概率,那么函数 quantile 的文档将该函数的第二个
参数称为“概率”。
在真正的 R 风格中,第二个参数可以是由概率值构成的向量;在这种情况下,quantile
函数返回相应的分位数向量,每个分位数对应一个概率值:
quantile(vec, c(.05, .95))
#> 5% 95%
#> 0.0451 0.9363
上例是一个方便的识别数据中间的 90%观测值的方法。
如果你完全省略第二个参数,那么 R 假定你想要的概率值为 0、0.25、0.50、0.75 和 1.0,
即四分位数:
quantile(vec)
#> 0% 25% 50% 75% 100%
#> 0.000405 0.235529 0.479543 0.737619 0.999379
令人惊讶的是,函数 quantile 实现了九种不同的算法用于计算分位数。在假设默认算
法是最适合你的算法之前,请先研究该函数的帮助页面。
9.6 求分位数的逆
9.6.1 问题
给定数据中的一个观测值
x
,你想知道其相应的分位数。 也就是说,你想知道小于
x
的
数据的比例。
9.6.2 解决方案
假设数据存储在一个向量 vec 中,把数据与观察值进行比较,然后使用 mean 计算小于
x
的观测值(例如 1.6)的相对频数,如下例所示:
mean(vec < 1.6)
#> [1] 0.948
9.6.3 讨论
表达式vec<
x
将 vec 向量的每个元素与
x
进行比较并返回逻辑值的向量,如果