R 您所在的位置:网站首页 标准正态分布密度公式 R

R

2022-11-27 16:07| 来源: 网络整理| 查看: 265

目录

一、图表检验1、概率密度曲线比较法

A. 样本曲线:将样本数据从小到大排列,求出每个值在总样本中出现的概率,绘制样本概率密度曲线 B. 理论曲线:基于样本均值和标准差,用正态分布概率密度函数算出理论概率密度曲线。 如果两条曲线挨得很近,则数据正态分布的可能性就越大。在实际过程中,也经常对y进行变换,将曲线变为直线便于观察。

2、P-P图

与概率密度曲线原理类似,以实际的累计概率和期望的累积概率相对比,坐标轴分比为实际累积概率和期望累积概率,如果服从正态分布,则数据点应和理论直线(对角线)基本重合。

3、Q-Q图

原理与P-P图类似,但P-P图比较的是两者的累积概率分布,Q-Q图则是根据变量的实际百分位数与理论百分位数进行绘制。要利用Q-Q图鉴别样本数据是否近似于正态分布,只需看Q-Q图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值。

二、数值检验

对偏度系数和峰度系数进行假设检验,从而判断数据的正态性。

(1)峰度Kurtosis:对于分布的标准四阶中心距(standardized 4th central moment),正态分布的峰度为3。当曲线峰值比正态分布的高时,峰度大于3;当比正态分布的低时,峰度小于3。

为了描述的方便,可使用exceessK = K-3 来标准化。如果exceessK >0, 表示波形更平坦(flatness); 如果exceess_K

正态分布的Skewness=0。如果Skewness>0代表波形有右侧长尾,如果Skewness3且7。

结果

A值:A越小,越接近0,表示样本数据越接近正态分布

p值:如果p-value小于显著性水平α(0.05),则拒绝H0

4、Lilliefor test

(1)基于Kolmogorov–Smirnov test的一种正态性检验。原假设H0:数据符合正态分布,其检验没有确定来自哪一个具体的正态分布,易受异常值的影响。

(2)R函数:lillie.test {nortest}

lillie.test(x)

参数

x:观测值向量,是数字向量即可,可以存在缺失值;非缺失值数量必须>4。

结果

D值:D越小,越接近0,表示样本数据越接近正态分布

p值:如果p-value小于显著性水平α(0.05),则拒绝H0

四、实例1、概率密度曲线法:ggplot2包library(ggplot2) library(easyGgplot2) # 一页多图 # 样本数据 set.seed(15) s qqplot.das(s, distribution = "norm", ylab = "Empirical cumulative distribution", + xlab = "Theoretical cumulative distribution",envelope = 0.95)

3、偏峰度检验:moments包

> library(moments) # 加载所需包 > kurtosis(s) # 计算峰度 [1] 3.098452 > anscombe.test(s) # 峰度检验 Anscombe-Glynn kurtosis test data: s kurt = 3.09850, z = 0.72682, p-value = 0.4673 alternative hypothesis: kurtosis is not equal to 3 > skewness(s) # 计算偏度 [1] -0.1861181 > agostino.test(s) # 偏度检验 D'Agostino skewness test data: s skew = -0.18612, z = -2.40040, p-value = 0.01638 alternative hypothesis: data have a skewness

检验结果显示,样本数据的峰度为3.0985,p值为0.4673>0.05,不拒绝为正态分布的假设;偏度为-0.18612,p值为 0.01<0.01638<0.05,存在一定的偏度,但在接受范围内,数据符合正态分布。

4、精确经验:S-W检验> shapiro.test(s) # S-W检验 Shapiro-Wilk normality test data: s W = 0.99728, p-value = 0.09025



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有