t 您所在的位置:网站首页 f分布与t分布的关系 t

t

2024-06-26 09:45| 来源: 网络整理| 查看: 265

t-分布, t-distribution 的定义及性质 摘要 t t t-分布的定义 t t t-分布与正态分布抽样的关系 t t t-分布的概率密度函数 t t t-分布的性质 t t t-分布的期望与方差 t t t-分布的平方当 p → ∞ p \rightarrow \infty p→∞ 时 t t t-分布的极限 Python包中的 t t t-分布参考文献

摘要

本文将简要介绍 t t t 分布 (学生分布)的定义及性质。 t t t分布可以由正态分布抽样的样本均值与样本方差定义得到,也可以直接通过其概率密度函数定义得到。

t t t-分布的定义 t t t-分布与正态分布抽样的关系

假设我们有一个正态分布 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2), X 1 ,   X 2 , ⋯   ,   X n X_1, \, X_2, \cdots, \, X_n X1​,X2​,⋯,Xn​ 是独立的来自 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2) 的抽样随机变量。于是, X 1 ,   X 2 , ⋯   ,   X n X_1, \, X_2, \cdots, \, X_n X1​,X2​,⋯,Xn​ 的样本均值 ( X ˉ \bar{X} Xˉ) 与样本方差 ( S 2 S^2 S2) 分别为: X ˉ = ∑ i = 1 n X i n , S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 \bar{X} = \frac{\sum_{i = 1}^n X_i}{n}, S^2 =\dfrac{1}{n - 1} \sum_{i = 1}^n (X_i - \bar{X})^2 Xˉ=n∑i=1n​Xi​​,S2=n−11​i=1∑n​(Xi​−Xˉ)2

我们在卡方分布那一篇文章 [1] 中介绍过, ( n − 1 ) S 2 / σ 2 \displaystyle (n - 1)S^2/\sigma^2 (n−1)S2/σ2 服从的是自由度为 n − 1 n - 1 n−1 的 χ 2 \chi^2 χ2 分布。

现在我们考虑 X ˉ − μ S / n \displaystyle \frac{\bar{X} - \mu}{S / \sqrt{n}} S/n ​Xˉ−μ​。经过简单的代数处理,我们有 X ˉ − μ S / n = ( X ˉ − μ ) / ( σ / n ) S 2 / σ 2 \displaystyle \frac{\bar{X} - \mu}{S / \sqrt{n}} =\frac{(\bar{X} - \mu) / (\sigma / \sqrt{n})}{\sqrt{S^2 / \sigma^2}} S/n ​Xˉ−μ​=S2/σ2 ​(Xˉ−μ)/(σ/n ​)​。

可以看到,分子 ( X ˉ − μ ) / ( σ / n ) \displaystyle (\bar{X} - \mu) / (\sigma / \sqrt{n}) (Xˉ−μ)/(σ/n ​) 服从标准正态分布,而 S 2 / σ 2 \sqrt{S^2 / \sigma^2} S2/σ2 ​ 是 χ n − 1 2 / ( n − 1 ) \sqrt{\chi^2_{n - 1} / (n - 1)} χn−12​/(n−1) ​ 。我们定义 X ˉ − μ S / n \displaystyle \frac{\bar{X} - \mu}{S / \sqrt{n}} S/n ​Xˉ−μ​ 服从的分布为自由度是 n − 1 n - 1 n−1 的 t t t-分布。

换言之,

定义 : 如果我们有两个独立的随机变量 U ,   V U, \, V U,V。 U ∼ N ( 0 , 1 ) U \sim N(0, 1) U∼N(0,1), V ∼ χ p 2 V \sim \chi^2_p V∼χp2​。即 U U U 服从标准正态分布, V V V 服从自由度为 p p p 的卡方分布。那么 U / V / p U / \sqrt{V / p} U/V/p ​ 服从的分布是一个自由度为 p p p 的 t t t-分布。

t t t-分布的概率密度函数

我们也可以直接从 t t t-分布的概率密度函数(pdf)来定义 t t t-分布。如果随机变量 X X X 的 pdf 为 f X ( t ) = Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π ( 1 + t 2 / p ) − p + 1 2 , − ∞ < t < ∞ , (1) f_{X} (t) = \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} (1 + t^2 / p)^{-\frac{p + 1}{2}}, -\infty < t < \infty ,\tag{1} fX​(t)=Γ(2p​)Γ(2p+1​)​pπ ​1​(1+t2/p)−2p+1​,−∞ 1; E(Xp​)=0,p>1; Var ( X p ) = p p − 2 , p > 2. \text{Var} (X_p) = \frac{p}{p - 2}, p > 2. Var(Xp​)=p−2p​,p>2. 而当 p = 1 p = 1 p=1 时, t t t-分布的期望不存在;当 p ≤ 2 p \leq 2 p≤2 时, t t t-分布的方差不存在。

t t t-分布的期望与方差的证明略微复杂。

我们先来看期望。

当 p = 1 p = 1 p=1, t t t-分布的期望不存在。这是因为当 p = 1 p = 1 p=1时, t t t-分布的 pdf 为 f ( t ) = 1 π 1 1 + t 2 \displaystyle f(t) = \frac{1}{\pi} \frac{1}{1 + t^2} f(t)=π1​1+t21​。正好是 Cauchy 分布的 pdf。我们知道 Cauchy 分布的期望是没定义的(undefined)。故自由度为 1 的 t t t-分布的期望也是没定义的。 当 p > 1 p > 1 p>1 时, E ( X p ) = ∫ − ∞ ∞ Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t ( 1 + t 2 / p ) p + 1 2 d t ,   p > 1 \displaystyle \mathbb{E}(X_p) = \int_{-\infty}^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt, \, p > 1 E(Xp​)=∫−∞∞​Γ(2p​)Γ(2p+1​)​pπ ​1​(1+t2/p)2p+1​t​dt,p>1。 我们要证明 E ( X p ) = 0 \displaystyle \mathbb{E}(X_p) = 0 E(Xp​)=0。 注意这里我们不能用被积分函数 Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t ( 1 + t 2 / p ) p + 1 2 \displaystyle \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } Γ(2p​)Γ(2p+1​)​pπ ​1​(1+t2/p)2p+1​t​ 是奇函数来证明它的积分等于 0。这是因为积分上下限均为无穷大,要证明这个 improper 积分有定义,我们必须证明 ∫ 0 ∞ Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t ( 1 + t 2 / p ) p + 1 2 d t \displaystyle \int_0^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt ∫0∞​Γ(2p​)Γ(2p+1​)​pπ ​1​(1+t2/p)2p+1​t​dt 是有限的(当 p > 1 p > 1 p>1 时)。下面我们来看积分 ∫ 0 ∞ Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t ( 1 + t 2 / p ) p + 1 2 d t . \displaystyle \int_0^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt. ∫0∞​Γ(2p​)Γ(2p+1​)​pπ ​1​(1+t2/p)2p+1​t​dt.

把常数提取出来,我们须要证明 ∫ 0 ∞ t ( 1 + t 2 / p ) p + 1 2 d t \displaystyle \int_0^{\infty} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt ∫0∞​(1+t2/p)2p+1​t​dt 是有限的。首先做变换 u = t p \displaystyle u = \frac{t}{\sqrt{p}} u=p ​t​,我们有 ∫ 0 ∞ t ( 1 + t 2 / p ) p + 1 2 d t = p ∫ 0 ∞ u ( 1 + u 2 ) p + 1 2 d u \displaystyle \int_0^{\infty} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt = p \int_0^{\infty} \frac{u}{ (1 + u^2)^{\frac{p + 1}{2}} } du ∫0∞​(1+t2/p)2p+1​t​dt=p∫0∞​(1+u2)2p+1​u​du。然后再做变换 y = ( 1 + u 2 ) − 1 y = (1 + u^2)^{-1} y=(1+u2)−1。于是我们有 p ∫ 0 ∞ u ( 1 + u 2 ) p + 1 2 d u = p 2 ∫ 0 1 y p − 3 2 d y \displaystyle p \int_0^{\infty} \frac{u}{ (1 + u^2)^{\frac{p + 1}{2}} } du = \frac{p}{2} \int_0^1 y^{\frac{p - 3}{2}} dy p∫0∞​(1+u2)2p+1​u​du=2p​∫01​y2p−3​dy。因为 p > 1 p > 1 p>1,所以 ∫ 0 1 y p − 3 2 d y = 2 p − 1 \displaystyle \int_0^1 y^{\frac{p - 3}{2}} dy = \frac{2}{p - 1} ∫01​y2p−3​dy=p−12​。所以 p ∫ 0 ∞ u ( 1 + u 2 ) p + 1 2 d u = p 2 ∫ 0 1 y p − 3 2 d y = p p − 1 \displaystyle p \int_0^{\infty} \frac{u}{ (1 + u^2)^{\frac{p + 1}{2}} } du = \frac{p}{2} \int_0^1 y^{\frac{p - 3}{2}} dy = \frac{p}{p - 1} p∫0∞​(1+u2)2p+1​u​du=2p​∫01​y2p−3​dy=p−1p​。从而 ∫ 0 ∞ t ( 1 + t 2 / p ) p + 1 2 d t \displaystyle \int_0^{\infty} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt ∫0∞​(1+t2/p)2p+1​t​dt 是有限的。故我们可以得出 E ( X p ) = ∫ − ∞ ∞ Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t ( 1 + t 2 / p ) p + 1 2 d t = 0 \displaystyle \mathbb{E}(X_p) = \int_{-\infty}^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt = 0 E(Xp​)=∫−∞∞​Γ(2p​)Γ(2p+1​)​pπ ​1​(1+t2/p)2p+1​t​dt=0,当 p > 1 p > 1 p>1 的时候。

E ( X p ) = 0 , p > 1 \mathbb{E} ( X_p ) = 0, p > 1 E(Xp​)=0,p>1。

下面再来看 t t t-分布的方差。当 p = 1 p = 1 p=1时,由于 t t t-分布的期望没有定义,所以其方差也没有定义。当 p = 2 p = 2 p=2时,我们要证明 t t t-分布的方差还是没有定义。这就须要计算 E ( X 2 ) \mathbb{E} (X^2) E(X2)。当 p = 2 p = 2 p=2 时, E ( X 2 ) = ∫ − ∞ ∞ Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π t 2 ( 1 + t 2 / p ) p + 1 2 d t \mathbb{E} (X^2) = \int_{-\infty}^{\infty} \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \frac{t^2}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt E(X2)=∫−∞∞​Γ(2p​)Γ(2p+1​)​pπ ​1​(1+t2/p)2p+1​t2​dt 把常数项 Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π \displaystyle \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} Γ(2p​)Γ(2p+1​)​pπ ​1​ 提出积分号外,我们须要计算

∫ − ∞ ∞ t 2 ( 1 + t 2 / p ) p + 1 2 d t \displaystyle \int_{-\infty}^{\infty} \frac{t^2}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt ∫−∞∞​(1+t2/p)2p+1​t2​dt。类似上面我们计算期望的技巧,首先先做变换 u = t p \displaystyle u = \frac{t}{\sqrt{p}} u=p ​t​,我们有 ∫ − ∞ ∞ t 2 ( 1 + t 2 / p ) p + 1 2 d t = p p ∫ − ∞ ∞ u 2 ( 1 + u 2 ) p + 1 2 d u \displaystyle \int_{-\infty}^{\infty} \frac{t^2}{ (1 + t^2 / p)^{\frac{p + 1}{2}} } dt = \displaystyle p \sqrt{p} \int_{-\infty}^{\infty} \frac{ u^2}{ (1 + u^2)^{\frac{p + 1}{2}} } du ∫−∞∞​(1+t2/p)2p+1​t2​dt=pp ​∫−∞∞​(1+u2)2p+1​u2​du。再做变换 y = ( 1 + u 2 ) − 1 y = (1 + u^2)^{-1} y=(1+u2)−1,我们有

∫ − ∞ ∞ u 2 ( 1 + u 2 ) p + 1 2 d u = 2 ∫ 0 ∞ u 2 ( 1 + u 2 ) p + 1 2 d u = ∫ 0 1 ( 1 − y ) 1 / 2 y p 2 − 2 d y \displaystyle \int_{-\infty}^{\infty} \frac{ u^2}{ (1 + u^2)^{\frac{p + 1}{2}} } du =2 \int_{0}^{\infty} \frac{ u^2}{ (1 + u^2)^{\frac{p + 1}{2}} } du = \int_0^1 (1 - y)^{1 / 2} y^{\frac{p}{2} - 2} dy ∫−∞∞​(1+u2)2p+1​u2​du=2∫0∞​(1+u2)2p+1​u2​du=∫01​(1−y)1/2y2p​−2dy.

于是,当 p = 2 p = 2 p=2 时,积分就变成了 ∫ 0 1 ( 1 − y ) 1 / 2 y − 1 d y \displaystyle \int_0^1 (1 - y)^{1 / 2} y^{-1} dy ∫01​(1−y)1/2y−1dy。这个积分是无穷大的,所以 E ( X 2 ) = ∞ \mathbb{E} (X^2) = \infty E(X2)=∞。于是当 p = 2 p = 2 p=2 时, X X X 的方差为无穷大。

而当 p > 2 p > 2 p>2 时, ∫ 0 1 ( 1 − y ) 1 / 2 y p 2 − 2 d y = Γ ( 3 2 ) Γ ( p 2 − 1 ) Γ ( p + 1 2 ) \displaystyle \int_0^1 (1 - y)^{1 / 2} y^{\frac{p}{2} - 2} dy = \frac{\Gamma(\frac{3}{2}) \Gamma(\frac{p}{2} - 1)}{\Gamma(\frac{p + 1}{2})} ∫01​(1−y)1/2y2p​−2dy=Γ(2p+1​)Γ(23​)Γ(2p​−1)​。把常数项加上,我们有

E ( X 2 ) = Γ ( p + 1 2 ) Γ ( p 2 ) 1 p π × p p × Γ ( 3 2 ) Γ ( p 2 − 1 ) Γ ( p + 1 2 ) = p p − 2 \displaystyle \mathbb{E} (X^2) = \frac{\Gamma(\frac{p + 1}{2})}{\Gamma{(\frac{p}{2}})} \frac{1}{\sqrt{p \pi}} \times p \sqrt{p} \times \frac{\Gamma(\frac{3}{2}) \Gamma(\frac{p}{2} - 1)}{\Gamma(\frac{p + 1}{2})} = \frac{p}{p - 2} E(X2)=Γ(2p​)Γ(2p+1​)​pπ ​1​×pp ​×Γ(2p+1​)Γ(23​)Γ(2p​−1)​=p−2p​ 于是, Var ( X ) = p p − 2 \displaystyle \text{Var} (X) = \frac{p}{p - 2} Var(X)=p−2p​,当 p > 2 p > 2 p>2 时。

t t t-分布的平方

假设 X ∼ t q X \sim t_q X∼tq​,即 X X X 服从自由度为 q q q 的 t t t-分布。那么 X 2 ∼ F 1 ,   q X^2 \sim F_{1, \, q} X2∼F1,q​,即 X 2 X^2 X2 服从自由度为 ( 1 ,   q ) (1, \, q) (1,q) 的 F F F-分布。

我们知道自由度为 p p p 和 q q q 的 F F F-分布的 pdf 为 f F ( x ) = Γ ( p + q 2 ) Γ ( p 2 ) Γ ( q 2 ) ( p q ) p / 2 x p / 2 − 1 [ 1 + ( p / q ) x ] ( p + q ) / 2 , 0 < x < ∞ f_F(x) = \frac{\Gamma(\frac{p + q}{2})}{\Gamma(\frac{p}{2}) \Gamma(\frac{q}{2})} \left( \frac{p}{q} \right)^{p / 2} \frac{x^{p / 2 - 1}}{[1 + (p / q) x]^{(p + q) / 2}}, 0 < x < \infty fF​(x)=Γ(2p​)Γ(2q​)Γ(2p+q​)​(qp​)p/2[1+(p/q)x](p+q)/2xp/2−1​,0



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有