统计学基础 您所在的位置:网站首页 截尾几何分布 统计学基础

统计学基础

2024-05-30 19:00| 来源: 网络整理| 查看: 265

统计学基础——负二项分布的数字特征 一、引言二、负二项分布定义的引出与理解2.1 实际意义2.2 初始定义2.3 重新定义“负”二项分布2.3 推导前的知识准备 三、数字特征推导3.1 期望3.2 方差 四、R语言中的负二项分布4.1函数表格4.2 函数参数展示 参考文献

一、引言

负二项分布(又名帕斯卡分布)和两点分布、二项分布、几何分布、超几何分布和泊松分布一样是常见的离散型分布。从定义上可以看成是几何分布的推广,从推导形式上也可以看成二项分布的推广。由于负二项分布的展开式不如二项分布那么常用,故在推导其期望方差等数字特征时,会碰到一些问题,本文展示了二项分布和其他分布的关系,并且给出了负二项分布的数字特征的推导过程,方便小伙伴理解,以减少想入门统计学的伙伴记忆负担。乔舰,范淑芬在文献[1]中具体列出了负二项分布的五种定义形式,以及多种求期望方差的方法。

黎明的清新在她的博客常见分布的数学期望、方差与特征函数推导(一)离散型分布一文中推导了常见的离散分布的数字特征。

二、负二项分布定义的引出与理解 2.1 实际意义

在实际的生活中,负二项分布可以应用到很多场景。一个人在获得r次满分前,没有获得满分的次数。一台机器在坏掉之前,可以使用的天数。可以看出负二项分布有总的次数失败两种定义方式。事实上,这两种定义方式本质等价,本文使用总的次数来定义负二项分布。

2.2 初始定义

这下面我们直接给出负二项分布的定义并解释负的含义。 定义一 X X X是服从负二项分布的随机变量,在一系列的独立的伯努利实验中,每次实验成功的概率是p,r是提前设定的成功实验次数。则 X X X的概率密度函数是: P ( x = k ) = ( k − 1 r − 1 ) p r ( 1 − p ) k − r . (1) P(x=k)=\binom{k-1}{r-1}p^{r}(1-p)^{k-r}. \tag{1} P(x=k)=(r−1k−1​)pr(1−p)k−r.(1) 其中 k k k从r取到无穷。此时 X X X~ N B ( r , p ) . NB(r,p). NB(r,p). 为了读者方便对比给出 定义二 Y Y Y是服从二项分布的随机变量,在一系列的独立的伯努利实验中,每次实验成功的概率是p,n是总的实验次数。则 Y Y Y的概率密度函数是: P ( y = k ) = ( n k ) p k ( 1 − p ) n − k . P(y=k)=\binom{n}{k}p^{k}(1-p)^{n-k}. P(y=k)=(kn​)pk(1−p)n−k. 其中 k k k从0取到n。此时 Y Y Y~ B ( n , p ) . B(n,p). B(n,p).

2.3 重新定义“负”二项分布

面对负二项分布的定义直观含义很好理解,但是对于为啥是负,很多初学的小伙伴显然很迷无从理解,下面我们对原始定义重新整理定义。

下面的公式推导来源于维基百科负二项分布词条,由于最近进不去那个网页,这里手动引用说明一下,不再注明链接。下面公式只能凭借印象自推,如有错误私信指正,不胜感激。

P ( x = k ) = ( k − 1 r − 1 ) p r ( 1 − p ) k − r = ( k − 1 ) ! ( r − 1 ) ! ( k − r ) ! p r ( 1 − p ) k − r = ( k − 1 ) ( k − 2 ) ⋯ ( k − 1 − ( k − 1 − r ) ) ( k − r ) ! p r ( 1 − p ) k − r = ( − 1 ) k − r ( − r ) ( − r + 1 ) ⋯ ( − k + 1 ) ( k − r ) ! p r ( 1 − p ) k − r = ( − 1 ) k − r ( − r k − r ) p r ( 1 − p ) k − r = ( − r k − r ) p r ( − 1 + p ) k − r \begin{aligned} P(x=k) &\left.=\binom{k-1}{r-1}p^{r}(1-p)^{k-r} \right. \\ &\left. = \frac{(k-1)!}{(r-1)!(k-r)!}p^{r}(1-p)^{k-r} \right. \\ &\left.=\frac{(k-1)(k-2)\cdots(k-1-(k-1-r))}{(k-r)!}p^{r}(1-p)^{k-r} \right.\\ &\left.=(-1)^{k-r}\frac{(-r)(-r+1)\cdots(-k+1)}{(k-r)!}p^{r}(1-p)^{k-r} \right.\\ &\left.=(-1)^{k-r}\binom{-r}{k-r}p^{r}(1-p)^{k-r} \right. \\ &\left.=\binom{-r}{k-r}p^{r}(-1+p)^{k-r} \right. \\ \end{aligned} P(x=k)​=(r−1k−1​)pr(1−p)k−r=(r−1)!(k−r)!(k−1)!​pr(1−p)k−r=(k−r)!(k−1)(k−2)⋯(k−1−(k−1−r))​pr(1−p)k−r=(−1)k−r(k−r)!(−r)(−r+1)⋯(−k+1)​pr(1−p)k−r=(−1)k−r(k−r−r​)pr(1−p)k−r=(k−r−r​)pr(−1+p)k−r​ 定义三 Z Z Z是服从负二项分布的随机变量,在一系列的独立的伯努利实验中,每次实验成功的概率是p,r是提前设定的成功实验次数。则 X X X的概率密度函数是: P ( z = k ) = ( − r k − r ) p r ( − 1 + p ) k − r P(z=k)=\binom{-r}{k-r}p^{r}(-1+p)^{k-r} P(z=k)=(k−r−r​)pr(−1+p)k−r 其中 k k k从r取到无穷。此时 Z Z Z~ N B ( r , p ) . NB(r,p). NB(r,p). 推导出上述公式显然和二项分布定义比较相似。我们知道二项分布来源于二项展开式,那么我们可以把二项展开式推广到负整指数上么?想来是可以的。我们继续从二项展开式出发进行推导。

2.3 推导前的知识准备

定义三知识帮助大家了解负二项分布“负”的来源,我们接下来的推导使用定义一中的公式。我们知道公式(1)作为概率密度函数,满足: ∑ k = r + ∞   P ( X = k ) = 1 (2) \sum_{k=r}^{+\infty~} P(X=k)=1 \tag{2} k=r∑+∞ ​P(X=k)=1(2) 将公式(1)带代入公式(2)变形的得到下面公式。 p − r = ∑ k = r + ∞   ( k − 1 r − 1 ) ( 1 − p ) k − r (3) p^{-r}=\sum_{k=r}^{+\infty~}\binom{k-1}{r-1}(1-p)^{k-r} \tag{3} p−r=k=r∑+∞ ​(r−1k−1​)(1−p)k−r(3) 设 q = 1 − p q=1-p q=1−p,则: ( 1 − q ) − r = ∑ k = r + ∞   ( k − 1 r − 1 ) q k − r (1-q)^{-r}=\sum_{k=r}^{+\infty~}\binom{k-1}{r-1}q^{k-r} (1−q)−r=k=r∑+∞ ​(r−1k−1​)qk−r 有了上述推导,我们给出广义的二项展开式的定义。 定理一 − 1 < x < 1 -1



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有