数理统计11:区间估计,t分布,F分布

您所在的位置:网站首页 区间变量有哪些 数理统计11:区间估计,t分布,F分布

数理统计11:区间估计,t分布,F分布

2024-07-09 12:22:15| 来源: 网络整理| 查看: 265

在之前的十篇文章中,我们用了九篇文章的篇幅讨论了点估计的相关知识,现在来稍作回顾。

首先,我们讨论了正态分布两个参数——均值、方差的点估计,给出了它们的分布信息,并指出它们是相互独立的;然后,我们讨论到其他的分布族,介绍了点估计的评判标准——无偏性、相合性、有效性;之后,我们基于无偏性和相合性的讨论给出了常用分布的参数点估计,并介绍了两种常用于寻找点估计量的方法——矩法与极大似然法;最后,我们对点估计的有效性进行了讨论,给出了一些验证、寻找UMVUE的方法,并介绍了CR不等式,给出了无偏估计效率的定义。以上就是我们在前九篇文章中提到的主要内容,还顺便介绍了一些常用的分布:\(\Gamma\)分布、\(\beta\)分布、\(\chi^2\)分布。

今天开始,我们将进入区间估计与假设检验部分。由于本系列为我独自完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!

目录Part 1:什么是区间估计Part 2:如何评价区间估计Part 3:\(t\)分布和\(F\)分布

Part 1:什么是区间估计

区间估计同样是参数估计的一种方法,不同于点估计用样本计算出的一个统计量直接作为原始参数的估计,区间估计会根据抽取出的样本,计算出一个基于样本观测值的区间。简单说来,如果对总体\(f(x;\theta)\)中的参数\(\theta\)作估计,则首先从总体中获得样本\(\boldsymbol{X}=(X_1,\cdots,X_n)\),并确定两个具有确定大小关系的统计量\(\hat g_1(\boldsymbol{X})\le \hat g_2(\boldsymbol{X})\),根据样本观测值计算出的区间\([\hat g_1(\boldsymbol{X}),\hat g_2(\boldsymbol{X})]\)就是待估参数\(\theta\)的区间估计。

由此,我们可以看出,区间估计依然是依赖于统计量的,并且往往需要不止一个统计量。区间估计相比于点估计的特点是,区间估计给出了一个相对“粗糙”的范围,这就导致你需要使用这个参数时,不像点估计一样能直接把估计值拿来用;但是,区间估计具有涵盖参数真值的可能,因为当参数空间\(\Theta\)的取值连续时,点估计\(\hat\theta\)与真值相等的可能性\(\mathbb{P}(\hat\theta=\theta)=0\),但是区间估计包含真值的可能性\(\mathbb{P}(\theta\in[\hat g_1(\boldsymbol{X}),\hat g_2(\boldsymbol{X})])>0\),这使得区间估计比起点估计而言,增加了一定的可靠性。

这么说可能比较抽象,让我们举一个实际的例子,还记不记得第一篇文章中yhh送我们的橙子?厂家声称一箱子橙子的平均重量是80斤,而我们称量后发现橙子的平均重量是79.9斤,我们不能说厂家的声称是错误的,因为点估计与真值相等的概率为0。然而,我们通过某种手段得到了橙子重量的区间估计是\([79.5,80.5]\)斤,则你可能就会认为,橙子的重量极可能就落在这个范围内,与80斤相差不大,因此厂家的声称是可以接受的。

区间估计还有另一方面的可靠性。在上面的讨论中,我们得到的点估计是79.9斤,如果换一箱橙子,它的重量不可能还是79.9斤了。但是,新一箱橙子的重量可能是70斤吗?可能性有多大?可能是80.1斤吗?可能性又有多大?点估计无法给出直观的感受,它只会让你觉得,80.1斤的概率要比70斤大点儿。但是,如果我们获得了这样的一个区间估计:\([79.5,80.5]\),则你就会觉得80.1斤出现的可能性比较大点,而70斤几乎不可能出现。假如区间估计是\([60, 100]\),则70斤和80.1斤就都很有可能出现了。这就是区间估计带来的好处,能让我们对预测的可能取值有更直观的感受。

除了这种双侧都用统计量表示的区间估计,还存在一种单侧区间估计,即形如\((-\infty,u(\boldsymbol{X})]\)或者\([l(\boldsymbol{X}),+\infty)\)的区间估计。这一般代表我们只关注参数的一侧,而不关注另一侧,我们称这种区间估计为单侧区间估计。不过,这种区间估计不是我们所要关注的重点。

Part 2:如何评价区间估计

最早接触过的,用一个区间来表示估计范围的,应该是高中所学的\(3\sigma\)原则:正态分布的取值落在\([\mu-3\sigma,\mu+3\sigma]\)之外的概率小于0.01。虽然这并非区间估计(务必注意这不是区间估计),但我们也能据此来感受区间估计的两大评价指标:精度、可靠度。

精度用区间估计的平均长度来度量。为什么要加入“平均”二字呢?因为区间估计的上界和下界都是统计量,而统计量自身具有两重性,故区间长度\(\hat g_2(\boldsymbol{X})-\hat g_1(\boldsymbol{X})\)也是一个随机变量,其平均长度就是

\[\mathbb{E}[\hat g_2(\boldsymbol{X})-\hat g_1(\boldsymbol{X})]. \]

可靠度指的是待估参数\(\theta\)被包含在区间\([\hat g_1(\boldsymbol{X}),\hat g_2(\boldsymbol{X})]\)内的可能性,其量度不像精度那么容易度量,这里需要引入置信水平(置信度)与置信系数的概念。置信水平指的是\([\hat g_1(\boldsymbol{X}),\hat g_2(\boldsymbol{X})]\)包含待估参数\(\theta\)的概率,一般说来这个概率可能与\(\theta\)有关,在这种情况下,置信系数则是置信水平在\(\theta\in\Theta\)上的下确界。这样,即使置信水平是一个关于\(\theta\)的函数,置信系数也是一个\([0,1]\)之间的常数,不过我们之后经常会取置信水平本身就是常数的区间作为待估参数的区间估计。

显然,精度和可靠度是相互制约的,如果样本容量一定,精度低了可靠度就高,为使置信系数达到\(1\),这个区间估计一般是\(\mathbb{R}\)。我们应当在精度和可靠度中相互权衡,来挑选合适的置信区间,为此,常使用Neyman建议的方案:在保证置信系数达到指定要求的前提下,尽可能提高精度。即,首先我们需要对区间估计有一个预期的表现,在这个预期表现之下选择平均长度最小的区间估计。当然,预期的表现要合理,不能要一个\(100\%\)包含待估参数的蛮横要求,这样区间估计就会很尴尬。现行的教材一般要求这个置信系数是\(95\%\),将其一般化,可以提出如下置信区间的概念。

设\([\hat \theta_1,\hat \theta_2]\)是参数\(\theta\)的一个区间估计,其中\(\hat\theta_1=\hat\theta_1(\boldsymbol{X})\),\(\hat\theta_2=\hat\theta_2(\boldsymbol{X})\)。若对于给定的\(0



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭