2.2 多维随机变量(随机向量) 您所在的位置:网站首页 正态分布连续型随机变量dx怎么求 2.2 多维随机变量(随机向量)

2.2 多维随机变量(随机向量)

2024-07-06 22:55| 来源: 网络整理| 查看: 265

2.2 多维随机变量(随机向量)⚓︎ 2.2 多维随机变量 (随机向量)⚓︎ 0.1. 1 离散型随机向五的分布⚓︎

随机向量的概念在 2.1 节 2.1.1 段中已提及过了.一般,设 \(X\) \(=\left(X_{1}, X_{2}, \cdots, X_{n}\right)\) 为一 \(n\) 维向量, 其每个分量, 即 \(X_{1}, \cdots, X_{n}\), 都 是一维随机变量,则称 \(X\) 是一个 \(n\) 维随机向量或 \(n\) 维随机变量.

与随机变量一样, 随机向量也有离散型和连续型之分. 本段先 考虑前者, 一个随机向量 \(X=\left(X_{1}, \cdots, X_{n}\right)\), 如果其每一个分量 \(X_{i}\) 都是一维离散型随机变量,则称 \(X\) 为离散型的.

定义 2.1 以 \(\left\{a_{i 1}, a_{i 2}, \cdots\right\}\) 记 \(X_{i}\) 的全部可能值, \(i=1,2, \cdots\), 则事件 \(\left\{X_{1}=a_{1_{j_{1}}}, X_{2}=a_{2_{j_{2}}} \cdots, X_{n}=a_{n_{j_{n}}}\right\}\) 的概率

\[ \begin{gathered} p\left(j_{1}, j_{2}, \cdots, j_{n}\right)=P\left(X_{1}=a_{1 j_{1}}, X_{2}=a_{2 j_{2}}, \cdots, X_{n}=a_{n j_{n}}\right) \\ j_{1}=1,2, \cdots, j_{2}=1,2, \cdots, \cdots, j_{n}=1,2, \cdots \end{gathered} \]

称为随机向量 \(X=\left(X_{1}, \cdots, X_{n}\right)\) 的概率函数或概率分布, 概率函 数应满足条件:

\[ p\left(j_{1}, j_{2}, \cdots, j_{n}\right) \geqslant 0, \sum_{j_{n}} \cdots \sum_{j_{2}} \sum_{j_{1}} p\left(j_{1}, j_{2}, \cdots, j_{n}\right)=1 \]

例 2.1 图 2.5 所示的二维离散型随机向量 \(X=\left(X_{1}, X_{2}\right)\) 的 概率分布为

\[ \begin{aligned} & P\left(X_{1}=2, X_{2}=1\right)=1 / 3 \\ & P\left(X_{1}=2, X_{2}=2.5\right)=1 / 4 \\ & P\left(X_{1}=5, X_{2}=3\right)=5 / 12 \end{aligned} \]

从图上看出, \(X_{1}\) 的可能值为 2 和 \(5, X_{2}\) 的可能值为 \(1,2.5\) 和 3. 故 形式上看, \(X=\left(X_{1}, X_{2}\right)\) 应有 6 组可能值, 即 \((2,1),(2,2.5)\), \((2,3),(5,1),(5,2.5),(5,3) . X\) 的概率分布告诉我们, 实际上只

图 2.5

有第 \(1,2,6\) 组是真正的可能值,但 这并无关系: 对一组不可能的值, 只要把它的概率定为 0 就行了. 这 一做法使我们可以把离散型分布 统一写成 \((2.1)\) 的格式, 在理论上 有其方便之处. 自然, 在具体例子 中,如例 2.1 并无必要硬凑成那个 形式, 只要指出概率大于 0 的那部 分就行了.

例 2.2 多项分布.

多项分布是最重要的离散型多维分布. 设 \(A_{1}, A_{2}, \cdots, A_{n}\) 是 某一试验之下的完备事件群, 即事件 \(A_{1}, \cdots, A_{n}\) 两两互斥, 其和为 必然事件(每次试验时, 事件 \(A_{1}, \cdots, A_{n}\) 必发生一个且只发生一 个). 分别以 \(p_{1}, p_{2}, \cdots, p_{n}\) 记事件 \(A_{1}, A_{2}, \cdots, A_{n}\) 的概率, 则 \(p_{i} \geqslant\) \(0, p_{1}+\cdots+p_{n}=1\).

现在将试验独立地重复 \(N\) 次,而以 \(X_{i}\) 记在这 \(N\) 次试验中事 件 \(A_{i}\) 出现的次数, \(i=1, \cdots, n\), 则 \(X=\left(X_{1}, \cdots, X_{n}\right)\) 为 \(-n\) 维随机 向量. 它取值的范围是: \(X_{1}, \cdots, X_{n}\) 都是非负整数且其和为 \(N . X\) 的概率分布就叫做多项分布, 有时记为 \(M\left(N ; p_{1}, \cdots, p_{n}\right)\). 为定出 这分布,要计算事件

\[ B=\left\{X_{1}=k_{1}, \cdots, X_{i}=k_{i}, \cdots, X_{n}=k_{n}\right\} \]

的概率, 只须考虑 \(k_{i}\) 都是非负整数且 \(k_{1}+\cdots+k_{n}=N\) 的情况, 否 则 \(P(B)=0\). 为计算 \(P(B)\), 从 \(N\) 次试验的原始结果 \(j_{1} j_{2} \cdots j_{N}\) 出 发,它表示第一次实验事件 \(A_{j_{1}}\) 发生,第二次试验 \(A_{j_{2}}\) 发生, 等等. 为使事件 \(B\) 发生, 在 \(j_{1}, j_{2}, \cdots, j_{N}\) 中应有 \(k_{1}\) 个 \(1, k_{2}\) 个 2 , 一等等. 这种序列的数目,等于把 \(N\) 个相异物体分成 \(n\) 堆,各堆依次有 \(k_{1}, k_{2}, \cdots, k_{n}\) 件的不同分法. 据第一章 (2.6) 式,不同分法有 \(N ! /\) \(\left(k_{1} ! \cdots k_{n} !\right)\) 个. 其次, 由于独立性, 利用概率乘法定理知, 每个适 合上述条件的原始结果序列 \(j_{1} j_{2} \cdots j_{n}\) 出现的概率, 应为 \(p_{1^{1}}^{k} p_{2^{2}}^{k} \cdots\) \(p_{n^{n}}^{k}\). 于是得到

\[ P\left(X_{1}=k_{1}, X_{2}=k_{2}, \cdots, X_{n}=k_{n}\right)=\frac{N !}{k_{1} ! k_{2} ! \cdots k_{n} !} p_{1}^{k} p_{2}^{k_{2}} \cdots p_{n^{n}}^{k^{n}} \]

\(\left(k\right.\) 为非负整数, \(k_{1}+\cdots+k_{n}=N\) )

(2.3) 就是多项分布,名称的来由是因多项展开式

\[ \left(x_{1}+\cdots+x_{n}\right)^{N}=\sum^{*} \frac{N !}{k_{1} ! \cdots k_{n} !} x_{1}^{k} \cdots x_{n^{n}}^{k} \]

\(\sum^{*}\) 表示求和的范围为: \(k_{i}\) 为非负整数, \(k_{1}+\cdots+k_{n}=N\), 在 (2.4) 中令 \(x_{i}=p_{i}\) 并利用 \(p_{1}+\cdots+p_{n}=1\), 得

\[ \sum^{*} \frac{N !}{k_{1} ! \cdots k_{n} !} p_{1}^{k} \cdots p_{n^{n}}^{k^{n}}=1 \]

这说明分布 (2.3)适合条件(2.2).

多项分布在实用上颇常见: 当一个体按某种属性分成几类时, 就会涉及这个分布. 例如, 一种产品分成一等品 \(\left(A_{1}\right) 、\) 二等品 \(\left(A_{2}\right)\) 、三等品 \(\left(A_{3}\right)\) 和不合格品 \(\left(A_{4}\right)\) 四类.若生产该产品的某厂, 其一、三、三等品和不合格品的比率分别为 \(0.15,0.70,0.10\) 和 0.05 , 从该厂产品中抽出 \(N\) 个. 若这 \(N\) 个只占其产品的极少一部 分, 则可以把这 \(N\) 个看成一个一个地独立抽出, 且在抽取过程中, 各等品的概率(即比率)不变. 在这种情况下, 若分别以 \(X_{1}, \cdots, X_{4}\) 记这 \(N\) 个产品中一、二、三等和不合格品的个数,则 \(X=\left(X_{1}, \cdots\right.\), \(\left.X_{4}\right)\) 将有多项分布 \(M(N ; 0.15,0.70,0.10,0.05)\). 又如在医学上, 一种疾病的患者可按严重的程度分期等等, 都属于这种情况.

如果 \(n=2\), 即只有 \(A_{1}, A_{2}\) 两种可能, 这时 \(A_{2}\) 就是 \(A_{1}\) 的对 立事件. 由于这时有 \(X_{1}+X_{2}=N, X_{1}\) 唯一地决定了 \(X_{2}\), 我们不必 同时考虑 \(X_{1}\) 和 \(X_{2}\), 而只须考虑 \(X_{1}\) 就够了, 这就回到二项分布的 情形.

0.2. 2 连续型随机向量的分布⚓︎

设 \(X=\left(X_{1}, \cdots, X_{n}\right)\) 是一个 \(n\) 维随机向量. 其取值可视为 \(n\) 维欧氏空间 \(R^{n}\) 中的一个点. 如果 \(X\) 的全部取值能充满 \(R^{n}\) 中某一 区域,则称它是连续型的.

与一维连续型变量一样, 描述多维随机向量的概率分布, 最方 便的是用概率密度函数. 为此我们引进一个记号: \(X \in A\), 读作 “ \(X\) 属于 \(A\) ”或 “ \(X\) 落在 \(A\) 内”, 其中 \(A\) 是 \(R^{n}\) 中的集合. \(\{X \in A\}\) 是一 个随机事件, 因为作了试验以后, \(X\) 之值就知道了, 因而也就能知 道它是否落在 \(A\) 内.

定义 2.2 若 \(f\left(x_{1}, \cdots, x_{n}\right)\) 是定义在 \(R^{n}\) 上的非负函数, 使对 \(R^{n}\) 中的任何集合 \(A\), 有

\[ P(X \in A)=\int_{A} \cdots \int f\left(x_{1}, \cdots, x_{n}\right) \mathrm{d} x_{1} \cdots \mathrm{d} x_{n} \]

则称 \(f\) 是 \(X\) 的 (概率) 密度函数.

如果把 \(A\) 取成全空间 \(R^{n}\), 则 \(\{X \in A\}\) 为必然事件, 其概率为 1. 因此应有

\[ \int_{-\infty}^{\infty} \cdots \int f\left(x_{1}, \cdots, x_{n}\right) \mathrm{d} x_{1} \cdots \mathrm{d} x_{n}=1 \]

这是一个概率密度函数必须满足的条件.

例 2.3 考虑二维随机向量 \(X=\left(X_{1}, X_{2}\right)\), 其概率密度函数 为

\[ \begin{aligned} & f\left(x_{1}, x_{2}\right) \\ & \quad= \begin{cases}1 /[(b-a)(d-c)], & \text { 当 } a \leqslant x_{1} \leqslant b, c \leqslant x_{2} \leqslant d \\ 0, & \text { 其他处 }\end{cases} \end{aligned} \]

则 \(f\) 非负且条件 (2.6) 满足. 从 \(f\) 的形状看出,它在图 2.6 中那个 矩形之外为 0 , 说明 \(\left(X_{1}, X_{2}\right)\) 只能取该矩形内的点为值. 在这矩形 内, 密度各处一样, 因而全部概率均匀地分布在这矩形内. 从公式 (2.5) 看出: 若集 \(A\) 在矩形内, 则 “ \(X\) 落在 \(A\) 内” 的概率 \(P(X \in A)\), 与 \(A\) 的面积成正比而与其位置及形状无关, 这是均匀 性的另一种说法. 以此之故, 人们把本例中 \(X\) 的分布称为上述矩 形上的均匀分布.

例 2.4 向一个无限平面靶射击, 设命中点 \(X=\left(X_{1}, X_{2}\right)\) 有

图 2.6

图 2.7

1. 概率密度⚓︎ \[ f\left(x_{1}, x_{2}\right)=\pi^{-1}\left(1+x_{1}^{2}+x_{2}^{2}\right)^{-2} \]

从这个函数看出: 命中点的密度只与该点与靷心的距离 \(r\) 有关. 这可以解释为: 在图 2.7 中以靷心 \(O\) 为中心的圆周上各点有同等 被命中的机会. 另外, \(x_{1}^{2}+x_{2}^{2}\) 愈小则 \(f\) 愈大, 说明与靶心接近之 点, 较之远离靶心之点, 有更大的命中机会.

为验证 (2.6) 式只须转到极坐标, 得

\[ \begin{aligned} & \iint_{-\infty}^{\infty} f\left(x_{1}, x_{2}\right) \mathrm{d} x_{1} \mathrm{~d} x_{2} \\ & =\int_{0}^{2 \pi} \mathrm{d} \theta \int_{0}^{\infty} \pi^{-1}\left(1+r^{2}\right)^{-2} r \mathrm{~d} r \\ & =2 \pi \cdot \pi^{-1} \int_{0}^{\infty}(1+t)^{-2} \mathrm{~d} t / 2=1 \end{aligned} \]

而“命中点与靶心之距离不超过 \(r_{0}\) ”这个事件 \(A\) 的概率为

\[ \begin{aligned} & \iint_{x_{1}^{2}+x_{2}^{2} \leqslant r_{0}^{2}} f\left(x_{1}, x_{2}\right) \mathrm{d} x_{1} \mathrm{~d} x_{2} \\ & \quad=\int_{0}^{2 \pi} \mathrm{d} \theta \int_{0}^{r_{0}} \pi^{-1}\left(1+r^{2}\right)^{-2} r \mathrm{~d} r=r_{0}^{2} /\left(1+r_{0}^{2}\right) \end{aligned} \]

例 2.5 二维正态分布. 最重要的多维连续型分布是多维正态分布. 对二维的情况, 其 概率密度函数有形式

\[ \begin{aligned} f\left(x_{1}, x_{2}\right)= & \left(2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}\right)^{-1} \exp \left(-\frac{1}{2\left(1-\rho^{2}\right)}\left(\frac{\left(x_{1}-a\right)^{2}}{\sigma_{1}^{2}}\right.\right. \\ & \left.\left.-\frac{2 \rho\left(x_{1}-a\right)\left(x_{2}-b\right)}{\sigma_{1} \sigma_{2}}+\frac{\left(x_{2}-b\right)^{2}}{\sigma_{2}^{2}}\right)\right) \end{aligned} \]

这里为书写方便,引进了一个记号 \(\exp\). 其意义是: \(\exp (c)=\mathrm{e}^{c} \cdot f\) 中包含了五个常数 \(a, b, \sigma_{1}^{2}, \sigma_{2}^{2}\) 和 \(\rho\), 它们是这个分布的参数, 其可 取值的范围为:

\(-\infty



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有