ch2 随机变量及其分布 课件(共85张PPT)- 《概率论与数理统计》同步教学(电工版·2023)

资源下载
  1. 二一教育资源

ch2 随机变量及其分布 课件(共85张PPT)- 《概率论与数理统计》同步教学(电工版·2023)

资源简介

(共85张PPT)
第二章 随机变量及其分布
随机变量
离散型随机变量
随机变量的分布函数
连续型随机变量
随机变量函数的分布
在随机现象中,大部分问题与数值密切相关。例如,在产品检验问题中出现的废品数、在电话问题中某段时间的呼叫次数、灯泡的寿命等都与数值有关,这类随机试验中的样本空间是一个数集;有些初看与数值无关的随机现象也常用数值描述。
量化描述随机现象的结果有利于采用函数、微积分等数学工具对随机现象的观察结果进行处理,在此引入随机变量刻画随机现象发生的结果,研究其取值的统计规律。
2.1 随机变量的概念
案例2.1.1 某市行政服务中心对工作人员建立了评价机制,以调查市民对某工作人员的服务态度、服务水平及服务效率等的综合评价,评价机制中,将工作人员的评价分为“非常差” “差”“一般”“好”“非常好”5个等级,显然与数值没有关系,不足以由此得到量化评价,那么该如何为此设计一种量化的评价标准呢?
解:对任何工作人员来说,获得这 5 个评价等级都是有可能的,不妨假设对应这 5 个等级的得分分别为-2 、 -1 、 0 、 1 、 2 ,这相当于引入了一个定义在样本空间={非常差, 差, 一般, 好, 非常好}上的变量 ,其中
引例
由于试验结果的出现是随机的,所以变量X的取值也是随机的(取值范围确定),故称为随机变量,每个样本点对应取到唯一的实数,这个对应关系显然可以作为对工作人员的量化评价标准。这里需要说明的是,我们完全可以定义另一种对应关系。
定义2.1.1. 设Ω={ω}是试验E的样本空间,如果对每个ω∈Ω,总有唯一一个实数X(ω)与之对应,这样就得到一个定义在Ω上的实数单值函数X(ω),称X(ω)为E的一个随机变量。随机变量常用X、Y、Z 或 、 、 等表示。
顾名思义,随机变量就是“其值随机会而定”的变量,正如随机事件是“其发生与否随机会而定”的事件。一个随机试验有许多可能的结果,到底出现哪一个要看机会,即有一定的概率。最简单的例子如掷骰子,掷出的点数X是一个随机变量,它可以取1,…,6等6个值。到底是哪一个,要等掷了骰子以后才知道。因此又可以说,随机变量就是试验结果的函数。
2.1 随机变量的概念
随机变量是样本空间Ω到 R 的一个单值函数,它与高等数学的函数有一定差异:
(1)随机变量的定义域是样本空间Ω。
(2)随机性:随机变量在试验前只知道它可能的取值范围,而不能预先肯定它将取哪个
值,随机变量的取值一般不止一个。
(3)概率性:因试验结果的出现具有一定概率,故随机变量取每个值或每个范围内的值也有一定概率。
2.1 随机变量的概念
随机变量概念的产生是概率论发展史上重大的事件。引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩充到对随机变量及其取值规律的研究。
2.1 随机变量的概念
例题
例 2.1.1 将一枚硬币抛掷三次,观察正面 H、反面 T 的出现情况。试验的样本空间Ω={HHH, HHT, HTH, THH, HTT, THT, TTH, TTT},设每次试验出现正面 H 的总次数为随机变量 X,则 X 为定义在样本空间Ω上的函数,其取值与样本点之间的对应关系如下。
可知,取值为 2 的样本点构成的子集为A={HHT,HTH,THH}, 则有
类似地,有
例题
例 2.1.2 设袋中有 5 个球,有 3 个黑球(编号为 1、2、3),两个白球(编号为 4、5)。从中任取 3 个球,则“抽到的白球数”是一个随机变量,记为 X。显然ΩX={0,1,2},X的取值与样本点之间的对应关系如下。
可知,若事件, ,显然 A 不一定是基本事件,以下是一些随机事件的举例。
(1){ X<2} ={抽到的白球数小于2};
(2){X≥1}={抽到的白球数不小于1} ;
(3){X=0}∪{X=2}={抽到的白球数为偶数}。
同时,还可得到P{抽到的白球数小于2} = P{X < 2} =0.7,P{抽到的白球数为2}=P{X=2}=0.3。
从例题中可以看出:引入随机变量后,随机事件可用关于随机变量的等式或不等式表示。
随机变量
所有取值可
以逐个列举
全部可能取值不仅有无
穷多,而且不能一一
列举,充满某些区间。
2.1 随机变量的概念
随机变量的分类
例如:“取到次品的个数”,“收到的呼叫数”等
例如:“电视机的使用寿命”,实际中常遇到的“测量误差”等。
对于在 2.1 节中提到的某些随机变量,如案例 2.1.1 中的行政服务中心综合评价得分、抛掷硬币出现的正面数、抽到的白球数、某市 120 急救电话每小时收到的呼叫次数等,它们的所有可能取值只有有限个或可列无穷多个。一般地,若随机变量 X 的可能取值是有限个或可列无穷多个,则称 X 为离散型随机变量。
离散型随机变量是一类比较容易理解的随机变量,鉴于其取值只有有限个或可列无穷多个,因此只要能确定每个可能值的概率,就可以计算任何随机事件的概率,为此引入下述定义。
2.2 离散型随机变量
定义2.2.1 若随机变量X取值x1, x2, …, xn, … 且取这些值的概率依次为p1, p2, …, pn, …, 则称X为离散型随机变量,而称
P(X=xk)=pk, (k=1, 2, … )
X x1 x2 … xK …
pk p1 p2 … pk …
2.2.1 离散型随机变量的分布
也可用表格形式给出:
为X的分布律或概率分布。可表示为
X~ P{X=xk}=pk, (k=1, 2, … ),
(1) pk 0, k=1, 2, … ;
(2)
分布律的性质
用这两条性质判断
一个数列是否是概
率分布。
设Ω为一样本空间,X为定义在样本空间上的一个离散型随机变量, 其取值为x1,x2,…,令A为{x1,x2,…}的任意一个子集。事件A的概率可根据概率的可加性来计算:
案例 2.2.1 假设某高校毕业生应聘其心仪的一个职位需要经过技术笔试、技能复试、综合面试三轮考试。
(1)如果三轮考试的通过率都为 p,问毕业生完成该职位应聘时,已经通过的考试次数的概率分布。
(2)如果每轮考试的通过率都是 0.5,问毕业生完成该职位应聘时,已经通过的考试次数的概率分布(假设在各轮考试中是否被淘汰是相互独立的)。
解:设首次被淘汰时,毕业生已经通过的考试次数为X。
(2)当 p=0.5 时,X 的概率分布如下所示。
案例
(1)根据条件,不难得到X的概率分布为
例 2.2.1 某篮球运动员投中篮框的概率是0.9,求他两次独立投篮投中次数 X 的概率分布。
解:X的可能取值为0,1,2,记Ai={第i次投中篮框},i=1,2,则
显然,P(X=0)+P(X=1)+P(X=2)=1,于是X的概率分布如表所示。
例题
2.2.2 常用的离散型分布
下面介绍常用的离散型随机变量分布。在描述离散型随机变量的概率模型时,伯努利试验是最早被研究且应用极其广泛的概率模型。
案例 2.2.2 某文具店推销一种新上市的笔,采取的推销策略为按20支一盒销售,并且承诺若一盒中有3支或超过3支是次品,则网店将双倍赔偿损失;若次品没有超过2支,则网店不予以赔偿,但是可能会遭到顾客的差评。据统计,这种笔的次品率为p,求一盒笔中次品数不超过2支、次品数是3支及3支以上的概率。
分析:我们关注每盒中有几支笔是次品,可以把每支笔是否是次品看作一次试验,那么每次试验只有两种结果:是次品、不是次品(是正品),共做20次试验。由于这些笔来自相同厂家,所以每支笔是次品或不是次品的概率相同,并且每盒笔是完全随机包装的,可以认为各支笔是次品、不是次品是相互独立的.
导入案例
案例 2.2.3 某高校共有 20000 名学生,为了方便学生的出行,计划在校内投放一批共享电动车。根据在学生中的调查数据,在某时段大约有 5%的学生选择共享电动车出行,那么学校管理部门至少应该投放多少辆共享电动车,才能保证 90%的学生在出行时有共享电动车可用?
分析:该案例显然关注的是某时段这20000名学生中有多少学生选择共享电动车出行,可以将每名学生是否选择共享电动车出行看作一次试验,试验结果只有两种:选择或不选择,共做20000次试验。一般而言,假设学生的选择是互不影响的,因此各次试验间相互独立。
与上述案例具有同样特点的试验一般称为贝努利(Bernoulli)试验。
贝努利试验定义
定义2.2.2 设一个随机试验只有两个可能结果 A和,则称此试验为伯努利试验。
定义2.2.3 将一个可能结果为 A 和 的伯努利试验独立地重复 n 次,并且事件 A 每次发生的概率相同,则称此试验为 n 重伯努利试验。
比如工厂抽检产品合格不合格,学校考察学生体质达标不达标,检查购买保险客户理赔不理赔等等,都可视作为一个n 重伯努利试验。
2.2.2 常用的离散型分布
1. (0-1)分布,两点分布(定义2.2.4)
设 E 是一个只有两种可能结果的随机试验, 用Ω= { 1, 2} 表示其样本空间。
P({ 1}) = p , P({ 2}) = 1-p .
则称X服从参数p的(0-1)分布(或两点分布), 记成 X~B(1, p)。
2.2.2 常用的离散型分布
1. (0-1)分布,两点分布
设在一次随机试验中事件 A 发生的概率P(A)=p,则
显然 X 服从 0-1 分布。
可见,任何只有两种可能结果的随机试验都可以定义一个服从 0-1 分布的随机变量。
若以X表示n重贝努里试验事件A发生的次数,则称X服从参数为n,p的二项分布。
记作X~B(n,p),其分布律为:
2.二项分布
定义2.2.5 设试验E只有两个结果 ,记p=P(A),将试验E独立重复进行n次,则称这n次试验为n重伯努利试验.
2.2.2 常用的离散型分布
案例2.2.2 解:
令X表示每盒20支笔中的次品数,根据前面的分析,一盒笔中的次品数X~B(20,p),即
于是可得一盒中不超过2支次品的概率为
恰好有3支次品的概率为
超过3支次品的概率为
案例求解
案例求解
案例2.2.3 解:
令X表示某段时间使用共享电动车的学生人数,假设需要投放n辆,根据前面的分析可知, 只需计算满足以下不等式的n:
当n取不同值时,根据上式在Excel中计算对应的概率,部分结果如下:
据此,至少应该设置 n=1040。
伯努利概型对试验结果有下述要求:
(1). 每次试验条件相同;
二项分布描述的是:n 重伯努利试验中,事件A发生的次数 X 的概率分布。
(3).各次试验相互独立。
(2). 每次试验只考虑两个互逆结果 A 或,
例2.2.2 某人进行射击,设每次射击的命中率为0.02,独立射击400次,试求至少击中两次的概率。
因此,所求概率为
解 将一次射击看作一次独立试验。设击中的次数为X,则
X~B(400,0.02), X的概率分布为
例题
例题
例2.2.3 某车间有9部同型号机床,每部机床间歇性地使用电力,平均每小时约有12min使用电力。若假定每部机床是否开动彼此独立,试问在同一时刻至少有7台机床使用电力的概率是多少?
于是在9部机床中同时开动的机床数
因此,所求概率为
这一结果说明,如果供给该车间的电力只允许6部机床同时开动,那么电力使用超负荷的概率为0.0003。
解 设同时开动的机床数为X,由于每部机床只有开动和不开动两种结果,因此每部机床是否开动可看作一次贝努利试验。“使用电力”记为事件A,则事件A发生的概率为
二项分布 b(n, p) 和两点分布b(1, p)之间的关系
设试验 E 只有两个结果: A 和 。
将试验 E 在相同条件下独立地进行 n 次,记 X 为 n 次独立试验中A出现的次数。描述第
i 次试验的随机变量记作 Xi , 则 Xi ~ b(1, p),且 X1, X2 , …, Xn相互独立 ( 随机变量相互独立的严格定义将在第三章讲述)。则有
X= X1+X2+ … +Xn .
这表明:一个服从二项分布的随机变量可以表示成n个相互独立的服从 两点分布的随机变量之和。
2.2.2 常用的离散型分布
案例2.2.4 某地有2500人参加了一项汽车事故保险,每人在年初向保险公司交付保险费12元。若在这一年内投保人的汽车出现该项事故,则保险公司向投保人支付2000元。根据以往经验,该项事故发生的概率为p=0.002,求保险公司获利不少于10000元的概率。
解 设X表示“投保汽车发生事故的车辆数”,则X服从二项分布,即X ~ B(2500, 0.002),则保险公司获利为2500×12-2000X≥10000,因此所求概率为
显然,手动计算该概率非常困难,因此引入泊松定理。
2.2.2 常用的离散型分布
定理 2.2.1 在 n 重伯努利试验中,事件 A 在每次试验中的发生概率为 pn , pn 与试验总数 n 有关,假设 n, npn (常数),则对任意给定的 k,有
由泊松定理可知,在二项分布中概率的计算,当 n 充分大(≥100),p 充分小(≤0.1),np 大小适中时(≤10),可利用泊松定理进行近似简化计算,即
设随机变量 X 所有可能取的值为: 0, 1, 2,…, 概率分布为:
3. 泊松分布
其中λ>0为常数,则称随机变量X服从参数为λ的泊松分布,记为X~P(λ)。
2.2.2 常用的离散型分布
泊松定理表明,泊松分布是二项分布的极限分布,
当n很大,p很小时,二项分布就可近似地
看成是参数 =np的泊松分布
泊松分布与二项分布的关系
例 2.2.4 设随机变量 X 服从参数为 λ 的泊松分布,且已知P(X=1)=P(X=2),试求P(X=4)。
解:
例题
随机变量 X 的概率分布为
由 P(X=1)=P(X=2),可得
由此得方程 ,
解得 λ =2(另一个解 λ =0 不合题意,舍去)。
所以 (查附表 2)。
例 2.2.5 现在需要 100 个符合规格的元件。从市场上购买该元件的废品率为 0.01。考虑到有废品存在,我们准备购买(100+a)个元件,希望从中可以挑出 100 个符合规格的元件。我们要求在这100+a个元件中至少有 100 个符合规格的元件的概率不小于 0.95。问 a 至少要多大?
解:
例题
令 A = {在(100 + a)个元件中至少有 100 个符合规格的元件}。假定各元件是否合格相互独立。设 X 为(100 + a)个元件中的废品数。则 X 服从 B(100+a,0.01),且
上式中的概率很难计算。由于(100 + a)较大而 0.01 较小,且(100 + a)×0.01= 1+ 0.01a≈1,所以可以以 λ = 1 的泊松分布来近似计算上述概率。因而
当 a = 0, 1, 2, 3 时,查看泊松分布表可得 P(A)为 0.368、0.736、0.920、0.981。故取 a=3。
小结
首先介绍了随机变量的基本概念与分类,接着介绍离散型随机变量及其概率分布;然后介绍三种常见的离散型概率分布:两点分布、二项分布、泊松分布及其关系。
对于离散型随机变量,如果知道了其概率分布,也就知道了它取各个可能值的概率。
对于离散型随机变量,可用概率分布来刻画随机变量的特征,但对于非离散型随机变量,由于其可能取值不能逐一列举,因而不可以用概率分布描述。在许多实际问题中,我们关心的并不是随机变量取某值的概率,而是关心它落在某个区间内的概率。
2.3 随机变量的分布函数
例如,某灯泡的寿命为 X,若灯泡的寿命小于 1000h 为不合格品,那么工厂更关心 X 落在(0,1000)内的概率。
因此,有必要研究随机变量的取值落在某个区间的概率:
对任意实数 ,有
研究 X 落在某个区间上的概率问题可以转为研究对任意实数 x 求概率P(X≤x)的问题。随机变量的概率P(X≤x)的取值与 x 大小有关,可以看作关于 x 的函数,我们称为分布函数。
定义 2.3.1 设 X 是一个随机变量,x 是任意实数,函数
2.3 随机变量的分布函数
定义中的P(X≤x)有时也记作P{X≤x} ,定义事件{x1为 X 的分布函数,记作 X ~ F(x) 或FX(x)。
说明分布函数完整地描述了随机变量的统计规律性。
由分布函数的定义及概率的性质可以证明分布函数具有以下性质:
分布函数的性质
(1)F(x)是单调不减函数;
(4)F(x+0)=F(x),即F(x)是右连续函数。
若已知一个随机变量的分布函数,则可以由分布函数计算由该随机变量确定的任何随机事件的概率。
例2.3.1(续案例 2.2.1) 当 p=0.5 时,毕业生完成该职位应聘通过的考试轮数 X 的概率分布如下表所示。
例题
计算随机变量 X 的分布函数。
解:根据分布函数的定义及随机变量 X 的分布律,可知
因此,X 的分布函数为
从这个例子可以看出,离散型随机变量的分布函数是一个分段阶梯函数,它在随机变量的可能取值点发生跳跃,显得过于复杂,使用概率分布更加直观且简单。
分布函数如图所示
例2.3.2 向区间[0,2]内任意掷一质点,设此试验是几何概型,即质点等可能地落在区间[0,2]内的任一位置,求质点的坐标 X 的分布函数。
例题
解:由题意可知,
于是 X 的分布函数为
当 x <0时,{X≤x}是不可能事件,于是F(x)=P(X≤x)=0;
对于任何一个随机变量,都可以用概率分布函数刻画它在随机试验中的可能取值与对应的概率分布,但是并不直观。从 2.3 节可知离散型随机变量最直观的刻画方式是概率分布或概率分布表。类似地,连续型随机变量的直观刻画方式是概率密度。
2.4 连续型随机变量
案例 2.4.1 某半导体制造商为了分析其生产的某种型号电子元件的质量,对该型号电子元件的使用寿命进行抽查,下表是 12000 只电子元件使用寿命 X(单位:kh)的调查数据。
引例
下面根据这些调查数据刻画随机变量 X 的概率分布情况。
首先引入频率直方图,它能够反映数据分布特征,该图形的画法:在直角坐标系中,以随机变量的取值为横坐标,横轴上的每个小区间对应一个组距,以此为底,以频率与组距的比值为高,在各个小区间上画出小矩形,该图形称为频率直方图。
引例
频率直方图中每个小矩形的面积为对应区间的频数,全部小矩形的面积之和是 1。根据上图我们可以粗略估计一下电子元件寿命落在某子区间的概率。例如,估计1引例
在频率直方图中增加函数(x>1)的图形,如图
可见该函数很好地拟合了频率直方图的外廓曲线,可以用该函数f(x)近似描述这批电子元件的使用寿命的概率分布。
由此, P(a函数f(x)称为随机变量X的概率密度函数。
2.4. 1 概率密度函数
定义2.4.1 F(x)是随机变量 X 的分布函数,若存在一个非负的函数 f (x),对任何给定的x,有
则称 X 为连续型随机变量,其中函数 f (x)称为 X 的概率密度函数,简称概率密度。
2.4. 1 概率密度函数
由定义 2.4.1 可知连续型随机变量的分布函数 F(x)是连续函数,且 F(x)是(-∞,x]范围内曲线f(x)下的面积 A,如图所示。
图中以(x0,x0+△x]范围内曲线f(x)下的面积 B 表示概率P(x0≤X≤x0+△x)的值。若 f(x)在 x0处连续,则
这说明概率密度的数值反映了X取 x0 邻近值的概率。
这两条性质是判定函数
f(x) 是否为某随机变量
X 的概率密度函数的充
要条件。
密度函数的性质
f(x)与 x 轴所围
面积等于1。
(非负性)
(归一性)
(3). 连续型随机变量取任意指定值的概率为 0.
即:
a为任意给定值。
这是因为:
密度函数的性质
可见:
由P(A)=0, 不能推出 A= ;
◎ 对连续型 随机变量 X, 有
密度函数的性质
性质(1)及性质(2)是检验一个函数能否作为连续型随机变量的概率密度的标准。性质(3)说明概率值为零的事件不一定是不可能事件,而概率值为 1 的事件不一定是必然事件。
解:
例题
例 2.4.1 设连续型随机变量 X 的概率密度为
(1)由概率密度的性质,可得
例题
(3)由分布函数的定义,可得
所以
2.4.2 常用的连续型分布
1. 均匀分布
若X~f(x)=
则称X在[a, b]内服从均匀分布。记作 X~U[a, b]
对任意实数c, d (aX落在子区间[c,d]上的概率仅和区间长度(d-c)有关,与位置无关。
例2.4.2 某公共汽车站从上午7:00起,每隔15min来一班车,即7:00,7:15,7:30,7:45等时刻有汽车到达此站。如果乘客到达此站的时间 X 是 7:00~7:30 的均匀随机变量,试求候车时间少于 5min 的概率。
解:以 7:00 为起点 0,以分钟为单位,依题意,X~U(0,30),则有
为使候车时间少于 5min,乘客必须在 7:10~7:15 或 7:25~7:30 时间段到达车站,因此所求概率为
例题
2. 指数分布
若 X~
则称X服从参数为 >0的指数分布。
显然,指数分布的分布函数为
2.4.2 常用的连续型分布
从图中可以看出,参数 λ 越大,概率密度函数下降得越快。指数分布常用于可靠性统计研究中,如元件的寿命服从指数分布等。
2.4.2 常用的连续型分布
指数分布的概率密度函数图
例2.4.3 某灯泡的寿命 X 服从指数分布,已知其参数λ=1/1000,求三个这样的灯泡使用1000h后,至少有一个损坏的概率。
解: X~ E(λ),其分布函数为
由此得到灯泡寿命大于 1000h 的概率为
例题
而各灯泡的寿命是否超过 1000h 是独立的,用 Y 表示使用 1000h 后损坏的灯泡数,则
所求概率为
例2.4.2 电子元件的寿命X(年)服从参数为3的指数分布: (1)求该电子元件寿命超过2年的概率。
(2)已知该电子元件已使用了1.5年,求它还能使用两年的概率为多少?

例题
例题说明了指数分布的最重要特点为“无记忆性”。
正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,故它在概率统计中占有特别重要的地位。
3. 正态分布
正态分布是十九世纪初,由高斯(Gauss)给出并推广的一种分布。故,也称高斯分布。
2.4.2 常用的连续型分布
案例 2.4.2 公共汽车车门高度的主要参照指标之一为成年男性的身高。为合理设计公共汽车的车门高度,汽车制造商寻求某特大城市健康卫生中心的帮助,从其数据库随机调取了10000 个成年男性的身高数据,能否根据这些数据估计成年男性身高的概率分布?这个分布呈现了什么特点?
分析:下图是 10000 个成年男性身高的频率直方图,图中有一条比较对称的曲线逼近于直方图的外廓曲线,该曲线可以近似作为成年男性身高的概率密度曲线。
引例
案例 2.4.3 假定步枪射手瞄准靶子在固定的位置进行一系列的射击。令 X 是命中点与过靶心垂线的水平偏离值(单位:cm),设 X 取值[-5, 5],则 X 是一个连续型随机变量。为了计算 X 落在某区间的概率,将[-5, 5]分为长为 1cm 的小区间。对于每个小区间,落在该区间内的弹孔数除以弹孔总数可以得到落在该区间内的弹孔的相对频数。设总弹孔数为 100,测量结果如下表所示:
引例
画出偏离值的频率直方图。
引例
由上述两个案例的频率直方图可以看出,其共同特点是数据在某点附近比较集中,超过一定范围时迅速减少,频率直方图的外廓曲线近似于一条对称的曲线。这种具有类似钟形分布结构的随机变量在日常生活中十分常见,如某人群的血压指标、某地区每年的降雨量、产品尺寸或重量的测量误差、某门课程学生的考试成绩等,它们均可视为近似服从于正态分布。
正态分布的定义
定义2.4.3:若随机变量 X 的概率密度函数为
记作
f (x)所确定的曲线叫作正态曲线。
(Normal)
其中μ和σ2都是常数,μ任意,σ>0,则称X服从参数为μ和σ2的正态分布。
(1) 单峰对称 密度曲线关于直线x= 对称;
正态分布有两个特性:
另外,当 x→ ∞时,f(x) → 0,这说明:曲线 f(x) 向左右伸展时,越来越贴近 x 轴。即 f (x) 以 x 轴为渐近线。
f( )=maxf(x)=
(2)μ决定了图形的中心位置, σ决定了图形峰的陡峭程度。
正态分布有两个特性:
标准正态分布
参数 =0, 2=1的正态分布称为标准正态分布,记作X~N(0, 1)。
分布函数表示为
密度函数表示为
标准正态分布
它的依据是:
标准正态分布的重要性在于,任何一个
一般的正态分布都可以通过线性变换转化为
标准正态分布。
因此只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题。
P46页式2.4.9
标准正态分布
书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算问题。
标准正态分布
表中给出的是 x >0时,Φ(x)的取值;
标准正态分布
例2.4.5 设X~N(1,4),求1.2 3 P(1.2
例题
=0.8413-0.5398=0.3015 (查附表 3)
例2.4.6

例题
令 X~F(x)为正态分布 N( , σ2)的分布函数,则有
所以Φ(k)=0.975,查附表 3,得 k=1.96。
例2.4.7 设X~N( ,σ2),求概率

例题
查附表 3
同理可得
从上例的结果看P(|X- |>3σ)=1-0.9973=0.0027数值很小,因此在实际问题中认为事件{|X- |>3σ}不太可能发生,认为 X 几乎落在以 为中心、3σ为半径的范围内,这在统计学上称为3σ原则。
正态分布
正态分布是概率论中的重要分布,一方面,正态分布在实际问题中最常见,经验表明,当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般都服从或近似服从正态分布,如测量误差、同龄人的身高、某地区年降雨量、电子管中的噪声电流或电压、飞机材料的疲劳应力、海洋波浪的高度、农作物的单位面积产量等都服从正态分布;另一方面,在后续中心极限定理的学习中,正态分布也有着十分重要的理论意义。
本讲首先介绍连续型随机变量、直方图、概率密度函数及性质;然后介绍了三种常用的连续型随机变量:均匀分布;指数分布和正态分布;最后介绍随机变量的分布函数。分别讨论了离散型随机变量的概率分布和分布函数的关系,连续型随机变量的概率密度和分布函数的关系等。
小结
2.5 随机变量函数的分布
问题的提出
随机变量在本质上是对随机现象的量化。例如,X 为抛掷骰子的点数,则 X 可能为{1,2,3,4,5,6}中的某个值。若将 X 看作自变量,则与 X 有关的函数(如 2X+5, X2)也会随着X 的取值而变化,即这些函数也是随机变量。假设已知 X 的概率分布,那么如何得到 X 函数Y=g(X)的概率分布呢?
2.5.1 离散型随机变量函数的分布律
案例 2.5.1 有 2500 名从事某种职业的职工参加了一项人寿保险,每人在年初向保险公司交付保险费120 元。根据以往的数据统计,这类人在这一年内死亡的概率为 p=2%,若在这一年内投保人亡故,则保险公司向投保人家属支付 20000 元。是否可以据此确定保险公司每年利润的概率分布,以及每年赔本的概率?
分析:不难理解保险公司的利润依赖于 2500 个投保人中意外死亡的人数 X,显然X~B(2500,0.002)。设保险公司的利润为 Y(单位:元),显然Y是X的函数,令Y=g(X)=300000-20000X。
案例中的问题就是确定 Y=g(X)的概率分布,并求概率 P(Y<0)。
2.5.1 离散型随机变量函数的分布律
一般地,假设随机变量 X 为离散型随机变量,其概率分布为
又设函数 Y=g(x),求 Y=g(X)的概率分布的一般步骤如下:
(2)计算 Y 的概率分布。
(1)确定随机变量 Y=g(X)的所有可能取值;
2.5.1 离散型随机变量函数的分布律
解:
根据前面的分析过程,因为 X 为离散型随机变量,Y 也是离散型随机变量,保险公司每年利润 Y 的所有可能取值为
Y=300000-20000k,k=0,1,2,…,2500
并且
P(Y=300000-20000k)=P(300000-20000X=300000-20000k)
=P(X=k),k=0,1,2,…,2500
由此得到保险公司利润 Y 的概率分布为
保险公司每年赔本的概率为
2.5.1 离散型随机变量函数的分布律
例 2.5.1 已知随机变量 X 的概率分布如下表所示。
解:根据X的概率分布表,列出下表
求 Y=X2+2 的概率分布。
将 Y 取值相同的项的概率相加,可得 Y 的概率分布为
2.5.2 连续型随机变量函数的密度函数
连续型随机变量的函数不一定是连续型随机变量,我们在这里主要讨论连续型随机变量的函数 Y=g(X)是连续型随机变量的情形。
例2.5.2 设随机变量 X 的分布函数为 F(x),概率密度函数为 f(x) , Y=X2,求 Y 的概率密度函数。
解:设FY(y) 、fY(y)分别为随机变量 Y 的分布函数和概率密度函数,根据分布函数的定义,当y≤0时,
当 y>0 时,
由 得
2.5.2 连续型随机变量函数的密度函数
例2.5.3 设随机变量X~N(0,1), Y=eX ,求Y的概率密度函数。
解:设FY(y) 、fY(y)分别为随机变量 Y 的分布函数和概率密度函数,根据分布函数的定义,当y≤0时,
y >0 时,因为g(x)=ex是 x 的严格单调增函数,所以有,
因而
2.5.2 连续型随机变量函数的密度函数
例2.5.4 已知随机变量 X 的分布函数 F(X)是严格单调的连续函数,证明 Y=F(X)服从[0,1]上的均匀分布。
证明:设FY(y) 、fY(y)分别为随机变量 Y 的分布函数和概率密度函数,由于 F(x)是严格单调增的连续函数,其反函数F-1(x)存在且严格单调递增,依题意Y 的取值范围为[0,1],当 y≤0时,FY(y)=P(Y≤y)=0;
=y
Y 的分布函数是
Y的概率密度函数为
可见,Y 服从[0,1]上的均匀分布。
2.5.2 连续型随机变量函数的密度函数
从上述的例题可以看出,已知连续型随机变量 X 的分布,可根据分布函数的定义求解Y=g(X)的分布函数,关键在于根据g(X)≤y求解X的分布,这种求解方法一般称为分布函数法。例 2.5.3、例 2.5.4 中的g(X)为单调递增函数,显然在这种情况下求解更简单。对于g(X)为严格单调递增函数的情形,下面提供一种更简单的求解方法。
定理 2.5.1 设随机变量X的概率密度函数为 ,又设y=g(x)是严格单调可导函数,则Y=g(X)是一个连续型随机变量,其概率密度函数为
证明:详见P50。
2.5.2 连续型随机变量函数的密度函数
例2.5.5 已设随机变量X~N(μ,σ2), 试证明 X 的线性函数
Y=aX+b
也服从正态分布。
证明:X的概率密度函数为
由于y=ax+b是严格单调函数,反函数为x=h(y)=, h’(y)=,依据定理 2.5.1 ,可得
则有
2.5.2 连续型随机变量函数的密度函数
例2.5.6 已知某学校到火车站有两种交通工具(出租车、公交车)可选:坐出租车平均用时短但不确定性大,根据以往经验,用时X(单位:min)服从正态分布X~N(27,42) ;坐公交车平均用时长些但是不确定性小,根据以往经验,用时 Y(单位:min)服从正态分布Y~N(29,12) 。现有一名学生要在 30min 内去火车站赶火车,请问应该选择出租车还是公交车?
查表可知 ,所以选择坐公交车。
解:坐出租车 30min 内到达的概率为
坐公交车 30min 内到达的概率为
本章小结.

展开更多......

收起↑

资源预览