二维函数Z=g(X,Y)型,用卷积公式求概率密度,积分区域如何确定(上)
因为关于二维随机变量主题内容重要,难度大,例题多,最主要是积分区间的确定是难点,同时关联卷积概念,求二维函数Z=g(X,Y)型,用卷积公式求概率密度,卷积公式容易,积分区间难以确定,所以分成上中下三篇博客写。
一。问题的引入
有一大群人,令X和Y分别表示一个人的年龄和体重,Z表示该人的血压,并且已知Z与X,Y的关系为 Z=g(X,Y), 如何通过X,Y的分布确定Z的分布?
二。公式
Fz(z)=P(Z⩽z)=∫∫g(x,y)⩽zf(x,y)dxdy F z ( z ) = P ( Z ⩽ z ) = ∫ ∫ g ( x , y ) ⩽ z f ( x , y ) d x d y
特殊类型:Z=X+Y,怎样确定Z的分布?如何求Z的概率密度?
fz(z)=∫∞−∞f(x,z−x)dx=∫∞−∞f(z−y,y)dy f z ( z ) = ∫ − ∞ ∞ f ( x , z − x ) d x = ∫ − ∞ ∞ f ( z − y , y ) d y
当X与Y相互独立时,
就得到所谓的卷积公式 卷 积 公 式
fz(z)=fx∗fy=∫∞−∞fX(x)fY(z−x)dx=∫∞−∞fX(z−y)fY(y)dy f z ( z ) = f x ∗ f y = ∫ − ∞ ∞ f X ( x ) f Y ( z − x ) d x = ∫ − ∞ ∞ f X ( z − y ) f Y ( y ) d y
这就是所谓的卷积积分
三。已知f(x,y),如何计算Z=X+Y型的概率密度fz(z) f z ( z )及概率分布 Fz(z) F z ( z )?
根据理解或者根据上面的公式,我们知道 fz(z) f z ( z )是将f(x,y)求一次积分,Fz(z) F z ( z )是求二次积分,难点问题在于如何确定积分区间?需要分成几个区间? 如 何 确 定 积 分 区 间 ? 需 要 分 成 几 个 区 间 ?
对于Z=X+Y型的关系,假设对x求一次积分,得到fz(z) f z ( z )
表示成
fz(z)=∫∞−∞f(x,z−x)dx f z ( z ) = ∫ − ∞ ∞ f ( x , z − x ) d x
,那么我们要画出一个 x–z的坐标,确定积分区间
1)积分区间的左右两边,由x的上下区间决定
假设 x的区间在[a,b]之间, a⩽x⩽b a ⩽ x ⩽ b
那么积分的左右边界就是a到b
2)根据关系式
z=x+y, 由于坐标系是x–z的关系,那么y就是变常量
z的最小值:zmin=x+ymin z m i n = x + y m i n
z的最大值:zmax=x+ymax z m a x = x + y m a x
积分的上下边界就是 zmin z m i n到 zmax z m a x
因为我们讨论的f_{z}(z)是按照x积分:
fz(z)=∫∞−∞f(x,z−x)dx f z ( z ) = ∫ − ∞ ∞ f ( x , z − x ) d x
所以按照x积分,积分区间就要分成三段:红色区间,蓝色区间,绿色区间
1)红色区间 红 色 区 间,
Xmin+Ymin⩽z<Xmin+Ymax X m i n + Y m i n ⩽ z < X m i n + Y m a x
x积分区间= a 到 Z-Ymin
∫z−yminadx ∫ a z − y m i n d x
2)蓝色区间 蓝 色 区 间,
Xmin+Ymax⩽z<Xmax+Ymin X m i n + Y m a x ⩽ z < X m a x + Y m i n
x积分区间= Z-Ymax 到 Z-Ymin
∫z−yminz−ymaxdx ∫ z − y m a x z − y m i n d x
3)绿色区间 绿 色 区 间,
Xmax+Ymin⩽z<Xmax+Ymax X m a x + Y m i n ⩽ z < X m a x + Y m a x
x积分区间= Z-Ymax 到 1
∫bz−ymaxdx ∫ z − y m a x b d x
当x的a,b左右对称时,中间蓝色区间没有,只有两个积分区间:
红色区间 红 色 区 间和 绿色区间 绿 色 区 间
=========================
【例一】设(X,Y)的联合密度函数为
(1)问X,Y是否独立?
(2)求Z=2X+Y的密度函数 fz(z) f z ( z )和分布函数 Fz(z) F z ( z )
(3)求P{Z>3}
【解】
(1) 问X,Y是否独立?
X,Y独立的条件 f(x,y)=fx(x)∗fy(y) f ( x , y ) = f x ( x ) ∗ f y ( y )
fX(x)=∫∞−∞f(x,y)dy f X ( x ) = ∫ − ∞ ∞ f ( x , y ) d y
fX(x)=∫∞0e−ydy=−e−y|∞0=e−y|0∞=1 f X ( x ) = ∫ 0 ∞ e − y d y = − e − y | 0 ∞ = e − y | ∞ 0 = 1
fY(y)=∫∞−∞f(x,y)dx f Y ( y ) = ∫ − ∞ ∞ f ( x , y ) d x
fY(y)=∫∞0e−ydx=∫10e−ydx=e−y∗(x)|10=e−y f Y ( y ) = ∫ 0 ∞ e − y d x = ∫ 0 1 e − y d x = e − y ∗ ( x ) | 0 1 = e − y
所以 f(x,y)=fX(x)∗fY(y) f ( x , y ) = f X ( x ) ∗ f Y ( y )
(2)求Z=2X+Y的密度函数fz(z) f z ( z )和分布函数Fz(z) F z ( z )
(2.1)先求密度函数fz(z) f z ( z )
Z=g(X,Y)=2X+Y
求fz(z) f z ( z )可以利用卷积公式
fZ(z)=∫∞−∞f(x,z−x)dx f Z ( z ) = ∫ − ∞ ∞ f ( x , z − x ) d x
画一个 x-z 的坐标系
Z方向下限:
Zmin=g(X,Ymin)=2X+Ymin Z m i n = g ( X , Y m i n ) = 2 X + Y m i n= 2X+0
Z方向上限:
Zmin=g(X,Ymin)=2X+Ymax=2X+∞=∞ Z m i n = g ( X , Y m i n ) = 2 X + Y m a x = 2 X + ∞ = ∞
所以,对公式 fZ(z)=∫∞−∞f(x,z−x)dx f Z ( z ) = ∫ − ∞ ∞ f ( x , z − x ) d x
当 0⩽z<2:0⩽x<z2 0 ⩽ z < 2 : 0 ⩽ x < z 2
fZ(z)=∫z20f(x,z−x)dx=∫z20e−(z−2x)dx f Z ( z ) = ∫ 0 z 2 f ( x , z − x ) d x = ∫ 0 z 2 e − ( z − 2 x ) d x
∫z20e2x−zdx(设t=2x−z,dt=2dx) ∫ 0 z 2 e 2 x − z d x ( 设 t = 2 x − z , d t = 2 d x )
=12e2x−z|z20 1 2 e 2 x − z | 0 z 2
=12(1−e−z) 1 2 ( 1 − e − z )
当 2⩽z<∞:0⩽x⩽1 2 ⩽ z < ∞ : 0 ⩽ x ⩽ 1
fZ(z)=∫10f(x,z−x)dx=∫10e−(z−2x)dx f Z ( z ) = ∫ 0 1 f ( x , z − x ) d x = ∫ 0 1 e − ( z − 2 x ) d x
∫10e2x−zdx(设t=2x−z,dt=2dx) ∫ 0 1 e 2 x − z d x ( 设 t = 2 x − z , d t = 2 d x )
=12e2x−z|10 1 2 e 2 x − z | 0 1
=12(e2−1)e−z 1 2 ( e 2 − 1 ) e − z
所以
(2.2) 求分布函数Fz(z) F z ( z )
由分布函数Fz(z) F z ( z )的定义可以知道,就是对z再积分
Fz(z) F z ( z )与相应的概率密度函数fZ(z) f Z ( z )的积分区间的关系是怎样呢?
概率密度函数fZ(z) f Z ( z )是对横坐标x积分,分布函数Fz(z) F z ( z )是对纵坐标z进行积分。通过z进行分区段,Fz(z) F z ( z )与fz(z) f z ( z )是一样的,但是Fz(z) F z ( z )是把fz(z) f z ( z )再次对z求积分,z的上下限的取值与z的分段不完全一样。
对z积分上下限取值原则:z的取值一直是从小到大方向,下限固定,上限活动,上限就是z 对 z 积 分 上 下 限 取 值 原 则 : z 的 取 值 一 直 是 从 小 到 大 方 向 , 下 限 固 定 , 上 限 活 动 , 上 限 就 是 z
FZ(z)=∫∞−∞fZ(z)dz F Z ( z ) = ∫ − ∞ ∞ f Z ( z ) d z
根据fZ(z) f Z ( z )的分段,分段再积分
所以,
z<0 时,F_{Z}(z)=0
当 0⩽z<2 0 ⩽ z < 2: z的积分区间:下限固定,下限是0,上限活动,上限是z 下 限 固 定 , 下 限 是 0 , 上 限 活 动 , 上 限 是 z,所以就是 在0⩽z<z 0 ⩽ z < z
FZ(z)=∫z0fZ(z)dz=∫z012(1−e−z)dz F Z ( z ) = ∫ 0 z f Z ( z ) d z = ∫ 0 z 1 2 ( 1 − e − z ) d z
=12(z+e−z)|z0=12(z−1+e−z) 1 2 ( z + e − z ) | 0 z = 1 2 ( z − 1 + e − z )
当 2⩽z<∞ 2 ⩽ z < ∞: 注意分布函数与密度函数的区别,分布函数是对z的累加,要把前面的所有区间全部累加起来 要 把 前 面 的 所 有 区 间 全 部 累 加 起 来
当 2⩽z<∞ 2 ⩽ z < ∞:z的积分区间为前面一段区间: 0到2,再加上当前区间,下限固定,下限就是2,上限活动,上限就是z 下 限 固 定 , 下 限 就 是 2 , 上 限 活 动 , 上 限 就 是 z
FZ(z)=∫20fZ(z)dz+∫z2fZ(z)dz= F Z ( z ) = ∫ 0 2 f Z ( z ) d z + ∫ 2 z f Z ( z ) d z =
=∫2012(1−e−z)dz+∫z212(e2−1)e−zdz = ∫ 0 2 1 2 ( 1 − e − z ) d z + ∫ 2 z 1 2 ( e 2 − 1 ) e − z d z
=1+12(1−e2)e−z = 1 + 1 2 ( 1 − e 2 ) e − z
所以
(3)求P{Z>3}
求P(f(Z))总是跟分布函数FZ(z) F Z ( z )联系在一起的。根据概率分布函数的定义 FZ(z) F Z ( z )指的是从−∞ − ∞到当前z的累加,运算值和查表值都只是 −∞ − ∞到某个当前z值得积分,即,积分的结果表示的是 P(Z⩽z) P ( Z ⩽ z )的值
所以
P(Z>3)=1−P(Z⩽3)=1−FZ(z)(z=3) P ( Z > 3 ) = 1 − P ( Z ⩽ 3 ) = 1 − F Z ( z ) ( z = 3 )
根据上面的积分结果
FZ(3)=(1+12(1−e2)e−z)|z=3 F Z ( 3 ) = ( 1 + 1 2 ( 1 − e 2 ) e − z ) | z = 3
P(Z>3)=1−(1+12(1−e2))e−3 P ( Z > 3 ) = 1 − ( 1 + 1 2 ( 1 − e 2 ) ) e − 3
=12(e2−1)e−3≈0.1591 = 1 2 ( e 2 − 1 ) e − 3 ≈ 0.1591
参考书目:
张天德,叶宏 《星火燎原·概率论与数理统计辅导及习题精解》(浙大·第4版)第三章