如何理解 95% 置信区间

2024-07-05 16:07| 来源: 网络整理| 查看: 265

如何正确理解 95％置信区间

科技论文里经常会出现【95%CI】的评价，这个评价到底有什么意义，他和 68-95-99.7 法则的关系是什么，可能很多人没有清楚的理解，包括之前写论文评价 95%CI 的自己。

目的

理解【95%CI 置信区间】的含义，以及他和【68-95-99.7% 法则】的关系。

什么是置信区间

首先明白置信区间的定义是什么：

在统计学中，一个概率样本的置信区间（英语：Confidence interval，CI），是对产生这个样本的总体的参数分布（Parametric Distribution）中的某一个未知参数值，以区间形式给出的估计。相对于点估计（Point Estimation）用一个样本统计量来估计参数值，置信区间还蕴含了估计的精确度的信息。 1

Keyword

置信区间并非评价该组样本的发生概率置信区间是通过概率样本来推测未知的总体参数置信区间给出的是对于总体参数的区间估计，而非点估计置信区间计算例

这里假设有 10 个人的体重作为总体参数，选 5 个人作为一组抽样标本，来评价他们的平均值。10 个人的体重分别如下表

路人 1路人 2路人 3路人 4路人 5路人 6路人 7路人 8路人 9路人 1050.454.655.258.464.365.569.171.474.588.3

我们可以知道总体参数的平均值为 65.17 从这 10 个人的总体参数里，取出 5 个人作为抽样标本并计算其平均值。

路人 1~5 作为标本 1，其平均值为 56.58.路人 3~7 作为标本 2，其平均值为 62.5.路人 3,4,7,8,10 作为标本 3，其平均值为 68.48. 总平均标本 1 平均标本 2 平均标本 3 平均65.1756.5862.568.48

结果可以知道，任意一组标本跟总体平均都不一致。我们不能用标本的点推测来推测总体数据的平均值。当然，很多人会说这理所应当的，这也是总所周知的事实。

一组抽样标本，他的平均值并不能代表总体数据的平均值

换个思想，更简单的话就是：当我们在实验室对 10 台复合钢做材料实验，能获得这一组强度数据，并进行数据整理的时候，得到的是这一组标本的数据。不能代表这个复合钢全体的数据，如何通过这组标本获得的数据，来推测复合钢的性质，这时我们可能就需要用区间推测来评价复合钢的强度。

这个时候我们就可以说，复合钢强度平均值是在这个区间范围以内，这个平均值不用点表示，而用区间来表示。

95% 置信区间表示了什么

进入正题，论文里经常能看到的 95% 置信区间（95% Confidence Interval; 95%CI）到底代表了什么意思。

95% 置信区间是通过标本数据平均值对总体平均值的区间推测指标

换句话说，95% 置信区间是评价总体平均值的一个范围。我们进行 100 组实验，只有 5 组实验数据的平均值是落在这个范围之外的。置信区间怎么求得的

知道了 95% 置信区间表示了什么意思之后，来看看置信区间是怎么通过计算获得的。要理解 95%CI，首先我们得先理解标准误差（Standard Error; SE）。

标准误差 SE 和标准偏差 SD 很相似。注意不要搞混淆，这里有说明他们的区别。

简单的说标准误差 S E = 标准偏差 S D n 标准误差 SE = \frac{ 标准偏差SD }{\sqrt{n}} 标准误差SE=n 标准偏差SD

这里的 n 代表实验体个数。

这里可以看出，实验体个数越多，SE 就越小

举个简单的例子假如想知道 20 岁的平均身高。这个时候研究组 A 随机抽取了 50 个人获得了数据，研究组 B 随机抽取了 1000 个人获得了数据。但是这两组数据测得了完全一样的数据：平均值为 165cm，标准偏差为 20。我们如何评价研究组 A 和 B 的数据，能认为他们两组数据一模一样吗。

这个时候大家凭感觉也知道抽取 1000 个人的研究组 B 的可靠性比较高。

研究组名样本数平均值标准偏差 SD标准误差 SE研究组 A5016520 20 50 = 2.83 \frac{20}{\sqrt{50}} = 2.83 50 20=2.83研究组 B100016520 20 1000 = 0.63 \frac{20}{\sqrt{1000}} = 0.63 1000 20=0.63

从上面的数据我们可以看出离散程度完全一样的两组数据中，样本数的多少所表达出的对数据的可靠程度也不一样。这里我们可以得出重要的结论：

标准偏差代表了一组数据的离散程度，而标准误差代表了这个平均值的可靠程度。

通过标准误差来求得置信区间

通过上面的结论，我们知道了标准误差 SE 可以代表了平均值的可靠程度，意味着我们可以通过标准误差来推测总体数据的平均值。理解了标准误差 SE，95%CI 也能很好的理解。数据服从正太分布的时候，95%CI 可以通过如下式子计算获得：

95%CI=1.96*SE

所以 95% 置信区间为：平均值 ±1.96SE

为什么是 1.96 的系数怎么计算，核心思想是跟【68-95-99.7 法则】是一样的，是通过对概率密度函数积分所获得。首先，我们获得了总体数据里的一组样本，我们可以从中计算出其平均值。假定有多个样本有分别不同的平均值，此时我们就可以得到总体数据对于平均值的分布。当我们把样本的平均值，当作一组样本里的一个数据时。我们就可以用正太分布的性质来评价样本的平均值。也就是 n 组样本里大约有 68% 的平均值落在总体样本里的平均值 ±SE 的范围里。95.5% 的平均值落在平均值 ±2SE 的范围里。

所以 95% 的置信区间为平均值 μ ± 1.96SE

总结标准偏差用来评价一组数据内的离散程度，可以通过【68-95-99.7 法则】推测数据的分布范围标准误差是评价一组样本平均值的可靠性，并通过它可以推测总体数据的平均值的可靠范围。95% 的置信区间意思为，假设做了 100 组实验，100 组实验中有 5 组实验的平均值是不在置信区间的范围内。95% 置信区间的计算式为: 95%CI= 平均值 μ ± 1.96SE

本作品采用知识共享署名 - 非商业性使用 - 相同方式共享 4.0 国际许可协议进行许可。

en.wikipedia.org/wiki/Confidence_interval ↩︎

【本文地址】

公司简介

联系我们