《第二章随机变量及其分布.docx》由会员分享,可在线阅读,更多相关《第二章随机变量及其分布.docx(28页珍藏版)》请在第壹文秘上搜索。
1、第二章随机变量及其分布第一节随机变量与离散型随机变量分布第二节常见离散型随机变量分布第三节连续型随机变量分布第四节常见连续型随机变量分布第五节随机向量(随机向量的联合分布函数;条件分布;随机变量独立性)第六节随机向量函数的分布第一节随机变量与离散型随机变量的分布一、随机变量许多随机试验的结果,可用数量直接表示.例如,一口袋中装有3个白球,7个黄球。现任摸2个球,问摸到白球的个数,样本空间C=0,1,2)但是,有些随机试验的结果并不是数量性的,而是表现为某种属性,然而这种属性是可以数量化的。例如,在投掷硬币的试验中,基本事件有两个,出现正面和反面(定性)为了便于研究,我们将每一个基本事件用一个实
2、数来表示,若用“本代表出现正面,用“0”代表出现反面。本章通封事件的颉里独对东讨论值机费组1.当正面,J()三-0.当产反面悟机交里然后应用数学分析前方去棒本三目。知空间/来解决同姮,这样强可以共射全献聘示嵬机瓜蛉的别SHft存在的线计姐律性。任何一个随机试验,其结果都可以用一个随机变量来刻画,试验结果不同,则该变量的取值也不同。定义2.1设E是一个随机试验,它的样本空间为Q=e,如果对于Q内的每一个样本点。都有一个实数X(e)和它对应,则称X(e)为随机变量,简记为X。如果随机试验的结果本身是数量,这时我们就定义随机变量X(e)=e0B2.1机交量定义的示WiB随机变量是定义在样本空间。上的
3、单值实函数,随机变量的取值是随机的,试验的每一个结果的出现都有一定的概率,因而随机变量取各个值都有一定的概率。这就是随机变量与普通变量的本质区别J进一步说明L随机变量不同于高等数学中的函数。它的自变量是样本点,定义域是样本空间,由于自变量的随机性,在试验完成之前,不能预先知道哪个样本点会出现,也就没办法预知对应的函数值,所以这个函数的取值也是具有随机性的。因此,对随机变量的分析,会重点放在其取值的可能性上。而对函数的分析更侧重函数的取值、性质和应用方面的研究。显然,随机变jx的函数Y=f(X)也是一个随机变量:。二、离散型随机变量的概率分布定义22茎值机关堂只能取却艮,个或无限可歹HMftf8
4、,BAWtt脑机m-连猿性例如,投掷硬币的随机变量X(e)只有两个可能值:Offb在显微镜下观察一张片子上某种细胞个数的随机变量X(e),全部可能取值为无限可列个0,L2,;它们都是离散型随机变量。人的寿命也是一个随机变量,但它的取值充满某一区间,无法按一定次序一一列举出来,故不是离散型随机变量,而是本章第三节中要讲的连续型随机变量。随机变量的特点在于客观存在的取值有一定的概座j义。它并不是肯定地取某一个值,而是以相应的概率取某个值,所以必须用取值及其相应的概率才能完而施描述随机变量。对于离散型随机变量来说,可以用列出它的每一个取值及其相应的概率来表示。例如,根据资料显示,某地新生婴儿的男女概
5、率分别为0.517和0.483,则婴儿的性别可用性别变量X来表示:若出生女性婴儿则X取0,相应的概率为0.483;若出生男性婴儿则X取1,相应的概率为0.517即随机变量X取值规律为:表离散型随机变量的分布列(X与P的对应关系)X01P0.4830.517或写成表达式P(X=O)=0.483,P(X=I)=0.517。定义2.3设离散型随机变量X所有可能取值为xi(i=l,2,)相应的概率P(X=Xi)=p,i=l,2,称为离散型随机变量X的概率函数或分布律。显然,概率函数有如下性质:(1)p10,(i=l,2,.)mPi=3例2.1给青蛙按每单位体重注射一定剂量的洋地黄,由以往实验获知,致死
6、的概率为0.6,存活的概率为0.4,今给两只青蛙注射,求死亡只数的概率函数。解设A1,A2分别表示第1只和第2只青蛙死亡的事件,则样本空间Q=a,tA,AiAa死亡只数X=O,1,2由题意,得P(Ai)=PU)=O6,P(I)=P(L)=0.4&,&彼此独立P(X=O月)区E)=咽网工K4X0.4P(X=l=P(Aj+AUU=P(2k)P()P(I)P(A3)=O.60.40.40.6=0.48P(X=IP(Al)=R(i)P(x)=O0.6=06所以,X的概率函数X012P0.160.480.36容易看出,概率函数满足PiNO(i=0,1,2)且ELPl=1。三、分布函数概率函数全面地描述了
7、离散型随机变量的统计规律性。为了给出随机变量X在基仝黄圉内取值的概率,我们还可以用另一种方式研究随机变量的分布规律,即研究随机变量X不大于实数值X的累积概率。这种方式不仅对于研究离散型随机变量是有意义的,对于连续型随机变量也是适用的,累积概率更具有代表性。定义2.4设X是一个随机变量,X是任意实数,则函数F(x)=P(Xx)称为随机变量X的分布函数。对于任意实数X,X2(X1X2)有P(xlXx2)=P(Xx2)-P(XX1)=F(x2)-F(xl)因此,若巳知X的分布函数,我们就可以知道X在任一区间(x,X2内取值的概率。从这个意义上来说,分布函数完整地描述了随机变量的统计规律性。对离散型随
8、机变量,只要将其概率函数累加起来,就得到分布函数F(x)=P(Xx)=ZP(X=Xk)=2pk其中,Xk为随机变量X的取值。分布函数有如下性质:(1) F(X)是一个单调不减函数(若xV2,则有F(x1)F(x2);(2) F(x)的值域介于O与1之间,即OWF(x)1,且F(-)=O,F(+)=1;-HmF(X)=F(X0)(3) F(x)在任何点X处至少右连续,即F(x+0)=F(X)(XF)。凡满足性质(1)-(3)的实函数F(X)一定是某个随机变量X的分布函数。随机变量映射,从样本空间到实数空间第二节常见离散型随机变量的分布一、两点分布()两点分布定义2.5如果随机变量X的分布律为01
9、Pl-pP则称X服从两点分布(Opl),或称OT分布。(二)伯努利试验在许多实际问题中,我们所观察的某个事件A在一次试验中可能发生,也可能不发生。这种只有两个可能结果的试验称为伯努利试验。二、二项分布(一)n重伯努利试验将伯努利试验独立地重复进行n次就称为n重伯努利试验。n重伯努利试验的特点:(1)只有两个结果,要么A发生,要么A不发生;(2)每次试验事件A发生的概率都等于p。(3) n次试验之间是相互独立的定理2.1设在一次试验中,事件A发生的概率为P(Opl),则在n次重复独立的试验中,事件A恰好发生k次的概率为Pk)=Cm(1-p)A(k=0,1,.,n)这就是n重伯努利试验的计算公式。
10、例已知某药有效率为0.7,今用该药治疗病人3例,求有效人数为0,1,2,3人的概率。解设X表示治疗有效的人数,A表示事件“第i例治疗有效”(i=0,1,2,3),则治疗3例的可能结果如下X事件O1444A44442-A44443444(二)二项分布定义2.6若随机变量X的概率函数为r二号=Uq-p)Z,0p)4S479UX012345678910211P0.0120.0580.1370.2050.2180.1750.1090.0550.0220.0070.0020.00111二N分充ko=np-q+1=200.2-0.8+l=4n=29290.2-0.8=5ko=5和6处,达到最大值二项分布的
11、图形是一偏左、单峰曲线,当k增大时,概率P(X=k)先增大,达到最大值后,再减小,且在ko=np-q+l时达到最大值,当np-q为正整数时,则在ko=np-q和k0=np-q+1处同时达到最大值,L称为二项分布的最可能值。n=2929X0.2-0.8=5k0=5和6处,达到最大值三、泊松分布泊松分布也是一种典型的离散型分布,由法国数学家泊松(S.D.Poisson,1837)提出。许多稀疏现象,如(1)生三胞胎,(2)某种少见病(如食管癌、胃癌)的发病例数,(3)用显微镜观察片子上每一格子内的细菌或血细胞数,(4)用X-线照射一种细胞或细菌,细胞发生某种变化或细菌死亡的数目等等,都服从或近似服
12、从泊松分布,所以泊松分布律又称为稀疏现象律。定理2.2(泊松定理)设随机变量JU(n=0,l,2,)服从二项分布,其概率函数为HX.=无)=CjdQ-PJZ比=QLZ.这里概率Pn与实验总次数n有关。如果当nnP- (入0为常数)则有Hm?(Z=)=geT,左=0,L2w.J当n很大,且P很小时,令入=npn,则(一般要求n210,p0.1)二项分布的泊松逼近泊松分布的图形是一偏左、单峰曲线。且当人增大时,图形趋于对称。泊松分布图的上升、下降情况与二项分布相类似。随着k增大,概率P(X=k)先增大,达到最大值后,再减小。且在k=时达到最大值,当人为正整数时,则在kF入和k=-l处同时达到最大值
13、。ko称为泊松分布的最可能值。已知某地区的人群中患某种病的概率为0.001,试求在检查5000人中至少有2人患此病的概率。解由于n=5000较大,而p=0.001较小,所以患此病的人数可用入=np=50000.001=5的泊松分布来近似,因此检查5000人中至少有2人患此病的概率为P(X2)=I-P(X=O)-P(X=D=l-e5-5e5=l-6e5=0.如果按X服从二项分布B(5000,0,001)精确计算得0.四、超几何分布超几何分布是一种离散型的概率分布,常用于药品、疫苗等的质量检查与流行病学的研究等。例设在总数为N的人群中做了某种检查,结果有M例阳性,N-M例阴性现从该人群中不放回地抽取n例,求n例中恰有k例阳性的概率。q既X=野=冷,i三l.-若随机变量X的概率函数为G其中0MWN,0nN,kl=max(0,n+M-N),k2=min(n,M),则称随机变量X服从参数为N,M,n的超几何分布,记作XH(N,M,n)okl=max(0,n+M-N)kjn+MNFisher确切概率法疗法有效无效合并中西药结合12(八)214()西药6713合计18(Jf)9