抽样分布概念及其三大重要分布 |
您所在的位置:网站首页 › 随机数字抽样法有哪些特点和作用 › 抽样分布概念及其三大重要分布 |
抽样分布概念
总体的容量很大,我们需要从总体抽出的样本进行一些规律的分析,进而对总体的分布情况进行推断,因此抽样分布具有重要意义。 分析抽样样本规律的过程中,需要对抽样特征进行提取,进而对原始数据进行运算得出的具有代表性的数字对原始信息进行提取,这些代表性的数字叫做统计量。 抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。 常用统计量如下图,总体样本X,还有一系列随机选取的样本。样本不是单个个体,而是一堆随机个体集合。样本是总体样本中随机抽取一系列个体组成的集合,它是总体样本的一部分。 (1),样本的均值,反应出总体的X数学期望的信息。 (2),样本方差,样本中的每个值与样本平均值的平方和除以样本数减去1的值,反应总体X方差的信息。 (3),变异系数,是标准差与均值的商,反应总体变异系数C的信息,表示各观测值离散程度的统计量,如果变异系数大于15%,则要考虑该数据可能不正常,应该剔除。变异系数无量纲,可以比较不同组之间的离散程度,例如可以比较一组学生中的身高和体重那个离散程度更大。 (4),样本K阶矩。反应总体k阶矩的信息。 (5),样本K阶中心距。反应总体的K阶中心距的信息。V2是样本方差。 (6)样本偏度,同样反应总体偏度信息,反应抽样的样本低于众数和高于众数的数量分布情况。 (7)样本峰度,反应总体峰度的信息,反应抽样的样本低于众数和高于众数的数量中具体的数据的分布情况。 三大重要分布 卡方分布(X²)若n个相互独立的随机变量X1,X2,…,Xn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其卡方分布分布规律称为χ²(n)分布,其中参数 n 称为自由度,自由度不同就是另一个χ²分布,正如正态分布中均值或方差不同就是另一个正态分布一样。示意图如下所示: χ²分布的均值为自由度 n,记为 E(χ²)=n,χ²分布的方差为2倍的自由度(2n),记为 D(χ²)=2n。 χ²分布具有可加性:若有K个服从χ²分布且相互独立的随机变量,则它们之和仍是χ²分布,新的χ²分布的自由度为原来K个χ²分布自由度之和。表示为: T分布设随机变量X~N (0,1),Y~χ²(n),且X与Y独立,则, 其分布称为t分布,记为t(n),其中,n为自由度。自由度为1的分布称为柯西分布,随着自由度n的增加,t分布的密度函数越来越接近标准正态分布的密度函数。一般当样本数n>=30时,t分布与标准正态分布就非常接近。示意图如下所示: t分布的自由度越大,则该t分布的曲线就越接近标准正态分布。当自由度大于30时,与标准正态分布的差异很小 F分布设X、Y为两个独立的随机变量,X服从自由度为k1的χ²分布,Y服从自由度为k2的χ²分布,这2 个独立的χ²分布 被各自的自由度除以后的比率这一统计量的分布,随机变量X有如下表达式: 即:上式X服从第一自由度为k1,第二自由度为k2的F分布,即为F(m,n),如下图所示: 中心极限定理中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近正态分布。 其中要注意的几点: 1.总体本身的分布不要求正态分布 上面的例子中,人的体重是正态分布的。但如果我们的例子是掷一个骰子(平均分布),最后每组的平均值也会组成一个正态分布。(神奇!) 2.样本每组要足够大,但也不需要太大 取样本的时候,一般认为,每组大于等于30个,即可让中心极限定理发挥作用。 样本的期望和方差: |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |