正态分布与 t 分布:有什么区别? 您所在的位置:网站首页 z分布一定是标准正态分布吗 正态分布与 t 分布:有什么区别?

正态分布与 t 分布:有什么区别?

2024-07-02 09:24| 来源: 网络整理| 查看: 265

正态分布和 t 分布:有什么区别?经过 本杰明·安德森博 7月 27, 2023 指导 0 条评论

正态分布是所有统计中最常用的分布,众所周知,它是对称的、钟形的。

一个密切相关的分布是t 分布,它也是对称的、钟形的,但它的“尾巴”比正态分布更重。

换句话说,与正态分布相比,分布中位于末端的值多于位于中心的值:

正态分布与 t 分布

用统计术语来说,我们使用一种称为峰度的指标来衡量分布的“重度”。因此,我们可以说 t 分布的峰度大于正态分布的峰度。

在实践中,我们在执行假设检验或构建置信区间时最常使用 t 分布。

例如,计算总体平均值的置信区间的公式为:

置信区间 = x +/- t 1-α/2, n-1 *(s/√ n )

金子:

x :样本平均值t:临界 t 值,基于显着性水平α和样本大小ns:样本标准差n:样本量

在此公式中,当满足以下条件之一时,我们使用表 t 的临界值代替表 z 的临界值:

我们不知道总体标准差。样本量小于或等于30。

以下流程图提供了一种有用的方法来了解是否应该使用表 t 或表 z 中的临界值:

表 Z 与表 t

在构建置信区间时使用t分布和使用正态分布的主要区别在于t分布的临界值会更大,导致置信区间更宽。

例如,假设我们要为海龟种群的平均体重构建 95% 的置信区间,以便收集具有以下信息的海龟随机样本:

样本量n = 25平均样本重量x = 300样本标准差s = 18.5

95% 置信水平的临界 z 值为1.96 ,而 df = 25-1 = 24 自由度的 95% 置信区间的临界 t 值为2.0639 。

因此,使用 z 临界值的总体平均值的 95% 置信区间为:

95% CI = 300 +/- 1.96*(18.5/√ 25 ) = [292.75, 307.25]

而使用 t 临界值的总体平均值的 95% 置信区间为:

95% CI = 300 +/- 2.0639*(18.5/√25) = [292.36, 307.64]

请注意,t 临界值的置信区间更宽。

这里的想法是,当我们的样本量较小时,我们不太确定真实的总体平均值,因此使用 t 分布来生成更宽的置信区间很有用,这样更有可能包含真实的总体平均值。

t 分布自由度的可视化

需要注意的是,随着自由度的增加,t 分布接近正态分布。

为了说明这一点,请考虑下图,它显示了具有以下自由度的 t 分布的形状:

df = 3df = 10df = 30

正态分布图或 t 分布图

自由度超过 30 度后,t 分布和正态分布变得非常相似,以至于在公式中使用 t 临界值和 z 临界值之间的差异可以忽略不计。

关于作者安德森博本杰明·安德森博

大家好,我是本杰明,一位退休的统计学教授,后来成为 Statorials 的热心教师。 凭借在统计领域的丰富经验和专业知识,我渴望分享我的知识,通过 Statorials 增强学生的能力。了解更多

添加评论取消回复


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有