您所在的位置：网站首页 › wilcox › R

R

2024-04-23 18:07| 来源: 网络整理| 查看: 265

wilcox.test Wilcoxon 秩和和符号秩检验 Description

对数据向量执行一样本和二样本 Wilcoxon 检验；后者也称为“曼-惠特尼”测试。

Usage wilcox.test(x, ...) ## Default S3 method: wilcox.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, exact = NULL, correct = TRUE, conf.int = FALSE, conf.level = 0.95, tol.root = 1e-4, digits.rank = Inf, ...) ## S3 method for class 'formula' wilcox.test(formula, data, subset, na.action, ...) Arguments x

数据值的数值向量。非有限（例如无限或缺失）值将被省略。

数据值的可选数字向量：与 x 一样，非有限值将被省略。

alternative

指定备择假设的字符串，必须是 "two.sided" （默认）、 "greater" 或 "less" 之一。您可以仅指定首字母。

指定用于形成 null 假设的可选参数的数字。查看具体信息'。

paired

指示您是否想要配对测试的逻辑。

exact

指示是否应计算精确 p 值的逻辑。

correct

指示是否在 p 值的正态近似中应用连续性校正的逻辑。

conf.int

指示是否应计算置信区间的逻辑。

conf.level

区间的置信水平。

tol.root

（当 conf.int 为 true 时：）正数值容差，用于 uniroot(*, tol=tol.root) 调用。

digits.rank

一个号码; 如果有限， rank(signif(r, digits.rank)) 将用于计算检验统计量的排名，而不是（默认） rank(r) 。

formula

lhs ~ rhs 形式的公式，其中 lhs 是给出数据值的数值变量，T4074T 是用于单样本或配对测试的 1 ，或者是给出相应组的两个水平的因子。如果 lhs 属于 "Pair" 类且 rhs 属于 1 ，则完成配对测试

data

包含公式 formula 中的变量的可选矩阵或数据框（或类似：请参阅 model.frame ）。默认情况下，变量取自 environment(formula) 。

subset

一个可选向量，指定要使用的观测子集。

na.action

一个函数，指示当数据包含 NA 时应该发生什么。默认为 getOption("na.action") 。

...

要传递给方法或从方法传递的更多参数。

Details

公式界面仅适用于2样本检验。

如果仅给出 x ，或者如果同时给出 x 和 y 并且 paired 是 TRUE ，则对 null 进行 Wilcoxon 符号秩检验，得出 x （在一个样本情况下）或 x - y （在配对的两个样本情况下）的分布关于 mu 对称。

否则，如果同时给出 x 和 y 并且 paired 是 FALSE ，则执行 Wilcoxon 秩和检验（相当于 Mann-Whitney 检验：参见注释）。在这种情况下， null 假设是 x 和 y 的分布因 mu 的位置偏移而不同，另一种情况是它们因其他位置偏移而不同（单方面的替代方案 "greater" 是 x 向右偏移） y ）。

默认情况下（如果未指定 exact ），如果样本包含的有限值少于 50 个并且不存在联系，则会计算精确的 p 值。否则，使用正态近似。

出于稳定性原因，建议使用舍入数据或设置 digits.rank = 7 ，以便关系的确定不依赖于非常小的数字差异（请参见示例）。

可选地（如果参数 conf.int 为 true），计算伪中值（单样本情况）或位置参数 x-y 差值的非参数置信区间和估计量。（分布的伪中位数F是分布的中位数(u+v)/2, whereuandv是独立的，各自有分布F. IfF是对称的，则伪中位数和中位数重合。请参见 Hollander & Wolfe (1973)，第 34 页。）请注意，在两个样本的情况下，位置参数差异的估计器不会估计中位数的差异（常见的误解），而是估计样本之间差异的中位数来自 x 的样本和来自 y 的样本。

如果精确的 p 值可用，则可以通过 Bauer (1972) 中描述的算法获得精确的置信区间，并采用 Hodges-Lehmann 估计器。否则，返回的置信区间和点估计基于正态近似。这些是针对间隔而不是估计进行的连续性校正（因为校正取决于 alternative ）。

对于小样本，可能无法实现非常高的置信区间覆盖范围。如果发生这种情况，将发出警告，并用覆盖率较低的间隔进行替换。

当 x （和 y 如果适用）有效时，该函数现在始终返回，在无法计算置信区间的 conf.int = TRUE 情况下也是如此，在这种情况下，区间边界和有时 estimate 现在包含 NaN 。

Value

包含以下组件的 "htest" 类列表：

statistic

检验统计量的值及其描述名称。

parameter

检验统计量的精确分布的参数。

p.value

检验的 p 值。

null.value

位置参数 mu 。

alternative

描述备择假设的字符串。

method

所应用的测试类型。

data.name

给出数据名称的字符串。

conf.int

位置参数的置信区间。（仅在参数 conf.int = TRUE 时出现。）

estimate

位置参数的估计。（仅在参数 conf.int = TRUE 时出现。）

Warning

如果 exact = TRUE 和一个样本很大（几千个或更多），此函数可能会使用大量内存和堆栈（如果超过堆栈限制，甚至会导致 R 崩溃）。

Note

文献对于 Wilcoxon 秩和和 Mann-Whitney 检验的定义并不一致。两个最常见的定义对应于第一个样本的排名之和减去或不减去最小值： R 减去而 S-PLUS 不减去，给出的值比m(m+1)/2对于第一个尺寸的样本m。（威尔科克森的原始论文似乎使用了未经调整的排名总和，但随后的表格减去了最小值。）

R 的值也可以计算为 y[j] 不大于 x[i] 的所有对 (x[i], y[j]) 的数量，这是 Mann-Whitney 测试的最常见定义。

References

大卫·F·鲍尔 (1972)。使用排名统计构建置信集。美国统计协会杂志67，687-690。土井： 10.1080/01621459.1972.10481279 。

迈尔斯·霍兰德和道格拉斯·A·沃尔夫 (1973)。非参数统计方法。纽约：约翰·威利父子公司。第 27–33 页（一个样本）、第 68–75 页（两个样本）。或第二版（1999）。