[数学]二维对数正态分布的概率分布,期望,方差和相关系数

您所在的位置:网站首页 二次型分布的结论 [数学]二维对数正态分布的概率分布,期望,方差和相关系数

[数学]二维对数正态分布的概率分布,期望,方差和相关系数

2024-07-11 01:20:43| 来源: 网络整理| 查看: 265

最近遇到了一个联合对数正态分布的相关系数的问题,搜遍全网无果,索性自己动手。本文借鉴了这个知乎回答

首先我们有二维正态分布: X , Y ∼ B V N ( μ x , μ y , σ x 2 , σ y 2 , ρ x y ) X,Y\sim \mathbf{BVN}(\mu_x,\mu_y,\sigma_x^2,\sigma_y^2,\rho_{xy}) X,Y∼BVN(μx​,μy​,σx2​,σy2​,ρxy​)

取对数之后我们会得到二维对数正态分布的概率密度函数。只写了第一象限的函数表达式,其他地方都是0。 f ( x , y ) = 1 2 π 1 − ρ x y 2 σ x σ y x y exp ⁡ [ − 1 2 ( 1 − ρ x y 2 ) ( ( ln ⁡ x − μ x ) 2 σ x 2 − 2 ρ x y ( ln ⁡ x − μ x ) ( ln ⁡ y − μ y ) σ x σ y + ( ln ⁡ y − μ y ) 2 σ y 2 ) ] f(x,y)=\frac{1}{2\pi \sqrt{1-\rho_{xy}^2}\sigma_x\sigma_y xy}\exp \left[\frac{-1}{2(1 - \rho_{xy}^2)}\left(\frac{(\ln x-\mu_x)^2}{\sigma_x^2}-\frac{2\rho_{xy}(\ln x-\mu_x)(\ln y-\mu_y)}{\sigma_x\sigma_y}+\frac{(\ln y-\mu_y)^2}{\sigma_y^2}\right)\right] f(x,y)=2π1−ρxy2​ ​σx​σy​xy1​exp[2(1−ρxy2​)−1​(σx2​(lnx−μx​)2​−σx​σy​2ρxy​(lnx−μx​)(lny−μy​)​+σy2​(lny−μy​)2​)]

引用链接里有边缘分布(一维情况下)的期望和方差的推导过程,这里只写结论: E ( X ) = exp ⁡ ( μ x + σ x 2 2 ) D ( X ) = exp ⁡ ( 2 μ x + σ x 2 ) ( exp ⁡ ( σ x 2 ) − 1 ) E(X)=\exp(\mu_x+\frac{\sigma_x^2}{2}) \\ D(X)=\exp(2\mu_x+\sigma_x^2)(\exp(\sigma_x^2)-1) E(X)=exp(μx​+2σx2​​)D(X)=exp(2μx​+σx2​)(exp(σx2​)−1)

接下来想算相关系数。首先我们有相关系数的公式: ρ = C O V ( X , Y ) D ( X ) D ( Y ) = E ( X Y ) − E ( X ) E ( Y ) D ( X ) D ( Y ) \rho=\frac{COV(X,Y)}{\sqrt{D(X)D(Y)}}=\frac{E(XY)-E(X)E(Y)}{\sqrt{D(X)D(Y)}} ρ=D(X)D(Y) ​COV(X,Y)​=D(X)D(Y) ​E(XY)−E(X)E(Y)​

关键一步是计算 E ( X Y ) E(XY) E(XY) E ( X Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ x y f ( x , y ) d x d y E(XY) = \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}xyf(x,y)\mathbf{d}x\mathbf{d}y E(XY)=∫−∞+∞​∫−∞+∞​xyf(x,y)dxdy

代入 f ( x , y ) f(x,y) f(x,y) E ( X Y ) = ∫ 0 + ∞ ∫ 0 + ∞ 1 2 π 1 − ρ x y 2 σ x σ y exp ⁡ [ − 1 2 ( 1 − ρ x y 2 ) ( ( ln ⁡ x − μ x ) 2 σ x 2 − 2 ρ x y ( ln ⁡ x − μ x ) ( ln ⁡ y − μ y ) σ x σ y + ( ln ⁡ y − μ y ) 2 σ y 2 ) ] d x d y E(XY) = \int_{0}^{+\infty}\int_{0}^{+\infty}\frac{1}{2\pi \sqrt{1-\rho_{xy}^2}\sigma_x\sigma_y}\exp \left[\frac{-1}{2(1 - \rho_{xy}^2)}\left(\frac{(\ln x-\mu_x)^2}{\sigma_x^2}-\frac{2\rho_{xy}(\ln x-\mu_x)(\ln y-\mu_y)}{\sigma_x\sigma_y}+\frac{(\ln y-\mu_y)^2}{\sigma_y^2}\right)\right]\mathbf{d}x\mathbf{d}y E(XY)=∫0+∞​∫0+∞​2π1−ρxy2​ ​σx​σy​1​exp[2(1−ρxy2​)−1​(σx2​(lnx−μx​)2​−σx​σy​2ρxy​(lnx−μx​)(lny−μy​)​+σy2​(lny−μy​)2​)]dxdy

作变换("简单的"二次型标准化) u = ln ⁡ x − μ x σ x − ( ρ x y σ y + σ x ) , v = ln ⁡ y − μ y σ y − ( ρ x y σ x + σ y ) u=\frac{\ln x - \mu_x}{\sigma_x}-(\rho_{xy}\sigma_y+\sigma_x),\quad v=\frac{\ln y - \mu_y}{\sigma_y}-(\rho_{xy}\sigma_x+\sigma_y) u=σx​lnx−μx​​−(ρxy​σy​+σx​),v=σy​lny−μy​​−(ρxy​σx​+σy​)

逆变换及其微分 x = exp ⁡ ( σ x u + ρ x y σ x σ y + σ x 2 + μ x ) , y = exp ⁡ ( σ y u + ρ x y σ x σ y + σ y 2 + μ y ) , d x = σ x exp ⁡ ( σ x u + ρ x y σ x σ y + σ x 2 + μ x ) d u , d y = σ y exp ⁡ ( σ y u + ρ x y σ x σ y + σ y 2 + μ y ) d u . x=\exp(\sigma_x u + \rho_{xy}\sigma_x\sigma_y+\sigma_x^2+\mu_x),\\ y=\exp(\sigma_y u + \rho_{xy}\sigma_x\sigma_y+\sigma_y^2+\mu_y),\\ \mathbf{d} x = \sigma_x \exp(\sigma_x u + \rho_{xy}\sigma_x\sigma_y+\sigma_x^2+\mu_x)\mathbf{d}u,\\ \mathbf{d} y = \sigma_y \exp(\sigma_y u + \rho_{xy}\sigma_x\sigma_y+\sigma_y^2+\mu_y)\mathbf{d}u. x=exp(σx​u+ρxy​σx​σy​+σx2​+μx​),y=exp(σy​u+ρxy​σx​σy​+σy2​+μy​),dx=σx​exp(σx​u+ρxy​σx​σy​+σx2​+μx​)du,dy=σy​exp(σy​u+ρxy​σx​σy​+σy2​+μy​)du.

代入 E ( X Y ) E(XY) E(XY)得(节省空间不写积分上下限了,都是无穷) E ( X Y ) = 1 2 π 1 − ρ x y 2 ∬ exp ⁡ [ − 1 2 ( 1 − ρ x y 2 ) ( u + ρ x y σ y + σ x ) 2 − 2 ρ x y ( u + ρ x y σ y + σ x ) ( v + ρ x y σ x + σ y ) + ( v + ρ x y σ x + σ y ) 2 + σ x u + σ y v + 2 ρ x y σ x σ y + σ x 2 + σ y 2 + μ x + μ y ] d u d v E(XY) = \frac{1}{2\pi\sqrt{1-\rho_{xy}^2}}\iint \exp\left[ \frac{-1}{2(1-\rho_{xy}^2)} (u+\rho_{xy}\sigma_y+\sigma_x)^2-2\rho_{xy}(u+\rho_{xy}\sigma_y+\sigma_x)(v+\rho_{xy}\sigma_x+\sigma_y)\\ +(v+\rho_{xy}\sigma_x+\sigma_y)^2+\sigma_x u+\sigma_y v+2\rho_{xy}\sigma_x\sigma_y+\sigma_x^2+\sigma_y^2+\mu_x+\mu_y \right]\mathbf{d}u\mathbf{d}v E(XY)=2π1−ρxy2​ ​1​∬exp[2(1−ρxy2​)−1​(u+ρxy​σy​+σx​)2−2ρxy​(u+ρxy​σy​+σx​)(v+ρxy​σx​+σy​)+(v+ρxy​σx​+σy​)2+σx​u+σy​v+2ρxy​σx​σy​+σx2​+σy2​+μx​+μy​]dudv

化简得到 E ( X Y ) = exp ⁡ ( μ x + μ y + 1 2 ( σ x 2 + 2 ρ x y σ x σ y + σ y 2 ) ) 1 2 π ( 1 − ρ x y 2 ) ∬ exp ⁡ [ − 1 2 ( 1 − ρ x y 2 ) ( u 2 − 2 ρ x y u v + v 2 ) ] d u d v E(XY) =\exp(\mu_x+\mu_y+\frac{1}{2}(\sigma_x^2+2\rho_{xy}\sigma_x\sigma_y+\sigma_y^2)) \frac{1}{2\pi(1-\rho_{xy}^2)}\iint \exp \left[\frac{-1}{2(1-\rho_{xy}^2)}(u^2-2\rho_{xy}uv+v^2)\right]\mathbf{d}u\mathbf{d}v E(XY)=exp(μx​+μy​+21​(σx2​+2ρxy​σx​σy​+σy2​))2π(1−ρxy2​)1​∬exp[2(1−ρxy2​)−1​(u2−2ρxy​uv+v2)]dudv

指数项右边是一个正态分布概率密度的积分,因此等于1,于是得到了一个很简单的形式 E ( X Y ) = exp ⁡ ( μ x + μ y + 1 2 ( σ x 2 + 2 ρ x y σ x σ y + σ y 2 ) ) E(XY) = \exp(\mu_x+\mu_y+\frac{1}{2}(\sigma_x^2+2\rho_{xy}\sigma_x\sigma_y+\sigma_y^2)) E(XY)=exp(μx​+μy​+21​(σx2​+2ρxy​σx​σy​+σy2​))

然后我们把 E ( X Y ) E(XY) E(XY), E ( X ) E(X) E(X), E ( Y ) E(Y) E(Y), D ( X ) D(X) D(X), D ( Y ) D(Y) D(Y)代入相关系数公式化简得

ρ = exp ⁡ ( ρ x y σ x σ y ) − 1 ( exp ⁡ ( σ x 2 ) − 1 ) ( exp ⁡ ( σ y 2 ) − 1 ) \rho=\frac{\exp \left(\rho_{xy}\sigma_x\sigma_y \right)-1}{\sqrt{(\exp(\sigma_x^2)-1)(\exp(\sigma_y^2)-1)}} ρ=(exp(σx2​)−1)(exp(σy2​)−1) ​exp(ρxy​σx​σy​)−1​

但是这个相关系数的结果有个很奇怪的性质,困扰了我一天,那就是当 σ x ≠ σ y \sigma_x\neq \sigma_y σx​=σy​的时候 ρ \rho ρ取不到 [ − 1 , 1 ] [-1,1] [−1,1],我用数字帝国画了个 σ x = 1 , σ y = 2 \sigma_x=1,\sigma_y=2 σx​=1,σy​=2时的草图,长这样:相关系数图像 然后就怀疑我哪里做错了,后来想着还是拿matlab数值计算一下。代码如下:

rho = 0.99; sigma_x = 2; sigma_y = 1; mu_x = 1; mu_y = 1; %ff = @(x,y)(exp(-((((log(x)-mu_x).^2./sigma_x.^2)-(2.*rho.*(log(x)-mu_x).*(log(y)-mu_y)./(sigma_x.*sigma_y))+((log(y)-mu_y).^2)./sigma_y.^2)./(2.*(1-rho.^2))))./(2*sigma_x*sigma_y.*pi.*sqrt(1-rho.^2).*x.*y));原始函数 fexy = @(x, y)(exp(-((((log(x)-mu_x).^2./sigma_x.^2)-(2.*rho.*(log(x)-mu_x).*(log(y)-mu_y)./(sigma_x.*sigma_y))+((log(y)-mu_y).^2)./sigma_y.^2)./(2.*(1-rho.^2))))./(2*sigma_x*sigma_y.*pi.*sqrt(1-rho.^2))); exy = integral2(fexy,0,inf,0,inf,'Method','iterated','AbsTol',0,'RelTol',1e-10); exey = exp(mu_x+mu_y+sigma_x^2/2+sigma_y^2/2); corr = (exy-exey)/(exey*sqrt((exp(sigma_x^2)-1)*(exp(sigma_y^2)-1)));

结果是0.6505,和图像相符,也就是说二维对数正态分布的相关系数取值范围确实不总是 [ − 1 , 1 ] [-1,1] [−1,1]。 再附一个画二维正态和二维对数正态概率分布的代码:

X1=[0.01:0.01:3]; Y1=[0.01:0.01:3]; [x,y]=meshgrid(X1,Y1); rho = 0.5; sigma_x = 1; sigma_y = 1; mu_x = 1; mu_y = 1; BVLN=(exp(-((((log(x)-mu_x).^2./sigma_x.^2)-(2.*rho.*(log(x)-mu_x).*(log(y)-mu_y)./(sigma_x.*sigma_y))+((log(y)-mu_y).^2)./sigma_y.^2)./(2.*(1-rho.^2))))./(2*sigma_x*sigma_y.*pi.*sqrt(1-rho.^2).*x.*y)); BVN=(exp(-((((x-mu_x).^2./sigma_x.^2)-(2.*rho.*(x-mu_x).*(y-mu_y)./(sigma_x.*sigma_y))+((y-mu_y).^2)./sigma_y.^2)./(2.*(1-rho.^2))))./(2*sigma_x*sigma_y.*pi.*sqrt(1-rho.^2))); subplot(1,2,1);surf(x,y,BVLN); subplot(1,2,2);surf(x,y,BVN);

画出来是这种感觉: 分布图 断断续续算了四天(主要是开始时不知道如何做变换),算的心态爆炸,给个免费的赞再走吧。



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭