【概率论与数理统计02】那些年，正态分布、指数分布、伽马分布、卡方分布之间的发生的那些事儿（下）

#【概率论与数理统计02】那些年，正态分布、指数分布、伽马分布、卡方分布之间的发生的那些事儿（下）| 来源: 网络整理| 查看: 265

图1 四个分布关系简图 3. 简洁的三哥——指数分布指数分布及特性

形如其名，指数分布的概率密度函数应该是最简单的了，就是单纯的指数函数的形式 f ( x ) = { λ e − λ x , x > 0 0 , x ≤ 0. f(x) = \left\{ \begin{aligned} \lambda e^{-\lambda x},\quad &x>0\\ 0,\qquad&x \le0. \end{aligned} \right. f(x)={λe−λx,0,x>0x≤0.

指数分布只有一个参数 λ \lambda λ，称为率参数。指数分布的期望和方差分别为 1 / λ 1/\lambda 1/λ 和 1 / λ 2 1/\lambda^2 1/λ2。

图2 指数分布概率密度曲线

指数分布的物理意义是“要等到一个随机事件发生，需要经历多久时间”。举一个例子，例如 X ∼ E x p ( 0.25 ) X \sim \rm{Exp}(0.25) X∼Exp(0.25) 表示在单位时间内（一分钟，一小时或一年），该事件平均发生 0.25 次。那么直到事件发生需要 4 个小时，0.25 的倒数。与指数分布类似，伽马分布的物理意义是“要等到 α \alpha α 个随机事件都发生，需要经历多久时间”。因此 α \alpha α 个指数分布的和就是形状参数为 α \alpha α，尺度参数为 λ \lambda λ 的伽马分布；反之，若伽马分布中 α = 1 \alpha=1 α=1，说明只有一个指数分布参与求和，因此也就退化为指数分布。

正态分布与指数分布的关系

设随机变量 X X X 和 Y Y Y 相互独立，都服从正态分布 N ( 0 , σ 2 ) N(0,\sigma^2) N(0,σ2)，那么 Z = X 2 + Y 2 Z=X^2+Y^2 Z=X2+Y2 服从指数分布。证明如下：由于随机变量 X X X 和 Y Y Y 相互独立，则 ( X , Y ) (X,Y) (X,Y) 的联合分布密度函数为 f ( x , y ) = f X ( x ) f Y ( y ) = 1 2 π σ e − x 2 2 σ 2 × 1 2 π σ e − y 2 2 σ 2 = 1 2 π σ 2 e − x 2 + y 2 2 σ 2 f(x,y) = f_X(x)f_Y(y)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}} \times \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{y^2}{2\sigma^2}} = \frac{1}{2 \pi \sigma^2}e^{-\frac{x^2+y^2}{2\sigma^2}} f(x,y)=fX(x)fY(y)=2π σ1e−2σ2x2×2π σ1e−2σ2y2=2πσ21e−2σ2x2+y2

随机变量 Z Z Z 的分布函数 F Z ( z ) = P ( Z ≤ z ) = P ( X 2 + Y 2 ≤ z ) = ∬ x 2 + y 2 ≤ z 1 2 π σ 2 e − x 2 + y 2 2 σ 2 d x d y = 1 2 π σ 2 ∫ 0 2 π d θ ∫ 0 z e − r 2 2 σ 2 r d r = 1 − e − z 2 σ 2 \begin{aligned} F_Z(z) &= P(Z \le z) = P(X^2 + Y^2 \le z) \\ &= \iint\limits_{x^2+y^2 \le z} \frac{1}{2 \pi \sigma^2}e^{-\frac{x^2+y^2}{2\sigma^2}} dxdy \\ & = \frac{1}{2 \pi \sigma^2} \int_0^{2 \pi}d \theta \int_0^{\sqrt{z}}e^{-\frac{r^2}{2\sigma^2}}rdr \\ & =1 - e^{-\frac{z}{2\sigma^2}} \end{aligned} FZ(z)=P(Z≤z)=P(X2+Y2≤z)=x2+y2≤z∬2πσ21e−2σ2x2+y2dxdy=2πσ21∫02πdθ∫0z e−2σ2r2rdr=1−e−2σ2z

故 Z Z Z 的概率密度函数为 f Z ( z ) = F Z ′ ( z ) = 1 2 σ 2 e − z 2 σ 2 f_Z(z) = F'_Z(z) = \frac{1}{2\sigma^2}e^{-\frac{z}{2\sigma^2}} fZ(z)=FZ′(z)=2σ21e−2σ2z

很明显这是服从率参数为 1 / 2 σ 2 1/2\sigma^2 1/2σ2 的指数分布。

\newline \newline

4. 神奇的四哥——卡方分布卡方分布及特性

自由度为 n n n 的卡方分布的定义是 n n n 个标准正态分布的平方和，记为 χ 2 ( n ) \chi^2(n) χ2(n) 同时卡方分布也是伽马分布当 α = n / 2 \alpha = n/2 α=n/2， λ = 1 / 2 \lambda = 1/2 λ=1/2 时的特殊情况，其概率密度函数为 f ( x ) = 1 2 n / 2 Γ ( n / 2 ) x n / 2 − 1 e − x / 2 f(x) = \frac{1}{2^{n/2}\Gamma(n/2)}x^{n/2-1}e^{-x/2} f(x)=2n/2Γ(n/2)1xn/2−1e−x/2

图3 卡方分布概率密度曲线

期望与方差分别为 n n n 和 2 n 2n 2n，且满足独立可加性。

卡方分布与指数分布的关系

指数分布通过伽马分布构造卡方分布。设 X 1 , X 2 , . . , X n X_1,X_2,..,X_n X1,X2,..,Xn 是服从指数分布 E x p ( λ ) \rm{Exp(\lambda)} Exp(λ) 的独立随机变量，则根据指数分布与伽马分布的关系有， X i ∼ G a ( 1 , λ ) X_i \sim \rm{Ga}(1,\lambda) Xi∼Ga(1,λ)。因为伽马分布具有可加性，则 X 1 + X 2 + ⋯ + X n = ∑ i = 1 n X i ∼ G a ( n , λ ) X_1 + X_2 + \dots+ X_n = \sum_{i=1}^nX_i\sim {\rm Ga}(n,\lambda) X1+X2+⋯+Xn=i=1∑nXi∼Ga(n,λ)

由伽马分布的线性性质有 2 λ ∑ i = 1 n X i ∼ G a ( n , 1 2 ) 2\lambda\sum_{i=1}^nX_i \sim {\rm Ga}(n,\frac{1}{2}) 2λi=1∑nXi∼Ga(n,21)

因此有 2 λ ∑ i = 1 n X i ∼ χ 2 ( 2 n ) 2\lambda\sum_{i=1}^nX_i \sim \chi^2(2n) 2λ∑i=1nXi∼χ2(2n)，即完成指数分布通过伽马分布构造卡方分布。

\newline \newline

5. 小结

概率论的世界广阔而神秘，而统计分布只是其冰山一角，本文所记录的更是表面的浮冰，如有错误，恳请各位老师批评指正。愿我们大家共同进步！

【本文地址】

公司简介

联系我们