如何在 R 中轻松计算百分位数(附示例) 您所在的位置:网站首页 R语言提取数字前几位 如何在 R 中轻松计算百分位数(附示例)

如何在 R 中轻松计算百分位数(附示例)

2024-05-09 00:38| 来源: 网络整理| 查看: 265

如何在 r 中轻松计算百分位数(附示例)经过 本杰明·安德森博 7月 29, 2023 指导 0 条评论

数据集的第n个百分位数是当所有值从小到大排序时截掉前n %的数据值的值。

例如,数据集的第 90 个百分位数是将底部 90% 的数据值与顶部 10% 的数据值分开的值。

最常用的百分位数之一是第 50 个百分位数,它表示数据集的中值:这是所有数据值中 50% 低于该值的值。

百分位数可用于回答以下问题:

学生需要在特定测试中取得多少分数才能进入前 10%?为了回答这个问题,我们需要找到所有分数的第 90 个百分位数,该值是将排名后 90% 的分数与排名前 10% 的分数分开的值。特定学校学生平均身高的一半是多少?为了回答这个问题,我们需要找到身高的第 75 个百分位数和身高的第 25 个百分位数,这两个值决定了中间 50% 身高的上限和下限。如何在 R 中计算百分位数

我们可以使用quantile()函数轻松计算 R 中的百分位数,该函数使用以下语法:

分位数(x, probs = seq(0, 1, 0.25))

x:我们希望找到其百分位数的数值向量probs: [0,1] 中的概率数值向量,表示我们希望找到的百分位数查找向量的百分位数

以下代码说明了如何在 R 中查找给定向量的不同百分位数:

#create vector of 100 random values uniformly distributed between 0 and 500 data % summarize (percent90 = quantile(Sepal.Length, probs = .9)) # A tibble: 3 x 2 #Speciespercent90 # #1 setosa 5.41 #2 versicolor 6.7 #3 virginica 7.61

以下代码说明了如何按物种查找所有变量的第 90 个百分位:

iris %>% group_by (Species) %>% summarize (percent90_SL = quantile(Sepal.Length, probs = .9), percent90_SW = quantile(Sepal.Width, probs = .9), percent90_PL = quantile(Petal.Length, probs = .9), percent90_PW = quantile(Petal.Width, probs = .9)) # A tibble: 3 x 5 # Species percent90_SL percent90_SW percent90_PL percent90_PW # #1 setosa 5.41 3.9 1.7 0.4 #2 versicolor 6.7 3.11 4.8 1.51 #3 virginica 7.61 3.31 6.31 2.4 查看百分位数

R 中没有内置函数来可视化数据集的百分位数,但我们可以创建一个绘图来相对轻松地可视化百分位数。

以下代码演示了如何为iris数据集中的Sepal.Length数据值创建百分位图:

n = length(iris$Sepal.Length) plot((1:n - 1)/(n - 1), sort(iris$Sepal.Length), type="l", main = "Visualizing Percentiles", xlab = "Percentile", ylab = "Value")其他资源

R 中 apply()、lapply()、sapply() 和 tapply() 指南使用 mutate() 和 case_when() 在 R 中创建新变量

关于作者安德森博本杰明·安德森博

大家好,我是本杰明,一位退休的统计学教授,后来成为 Statorials 的热心教师。 凭借在统计领域的丰富经验和专业知识,我渴望分享我的知识,通过 Statorials 增强学生的能力。了解更多

添加评论取消回复


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有