资源简介 (共54张PPT)第二章 随机变量及其分布2.4 连续型随机变量及其概率密度函数内容简介:对于连续型随机变量X, 同离散型随机变量X并行研究, 先后讨论概率密度、分布函数及其二者关系问题, 其中重点研究三种常用的连续型随机变量的分布——均匀分布、指数分布和正态分布. 重点学习正态分布的理论.第二章 随机变量及其分布2.4 连续型随机变量及其概率密度函数2.4.1 提出问题若随机变量X的所有的可能取值充满一个区间, 那么就不能像离散型随机 变量那样, 以指定它取每个值的概率的方式给出其概率分布, 怎样来研究这种情形呢?2.4.2 预备知识1. 反常积分,原函数,定积分的几何 意义,定积分与反常积分计算;2.奇偶函数,单调增函数,分布函数连续性.2.4.3 提出概念连续型随机变量X的所有可能取值充满一个区间, 对这种类型的随机变量, 不能像离散型随机变量那样, 以指定它取每个值概率的方式去给出其概率分布, 而是通过给出所谓“概率密度函数”的方式.下面我们就来介绍对连续型随机变量的描述方法.1.连续型随机变量的概率密度函数定义 对于随机变量X , 如果存在一个非负可积函数 f(x), 使得对于任意的实数x, 有F(x)=P{-∞则称X为连续型随机变量, 其中函数f(x)称为X的概率密度函数, 简称为概率密度.由定义可以看出: 连续型分布函数F(x)是处处连续的, 而一般定义(2.3.1)得到的分布函数F(x)仅是右连续的. 几何意义见下图.概率密度f (x)的性质:(1) f (x)≥0, x∈(-∞, +∞).(4) 若f (x)在点x处连续, 则有(5) 连续型随机变量取任一指定值的概率为0,即P{X=a}=0, a为任一指定值.(3) 对于任意实数x1, x2(x1≤x2),P{ x1讲评 如果任意一个非负实函数f(x)满足以上两条性质(1)、(2), 则f(x)就是一个随机变量的概率密度. 这两条性质是判定一个函数f(x)是否为某个随机变量X的概率密度函数的充要条件.由性质(2)知道, 介于曲线y = f (x) 与Ox轴之间的面积等于1.见(图2-7).由性质(3)知道, X落在区间(x1, x2]上的概率P{ x1y = f (x)之下的曲边梯形的面积值(图2-8).这是因为性质(4) 说,若f (x)在点x处连续, 有故X的概率密度f(x)在x这一点的值, 恰好是X落在区间(x, x+△x]上的概率与区间长度△x之比的极限. 这里, 如果把概率理解为质量, 则 f(x)相当于线密度.若不计高阶无穷小, 有P{x它表示随机变量X取值落入区间(x, x+△x]的概率近似等于f(x)△x.由导数的定义,我们得到:讲评 由P(A)=0, 不能推出A= , 但P( )=0; 由P(B)=1, 也不能推出B=Ω, 即B并非必然事件, 但P(Ω)=1.性质(5)是因为因此, 对连续型随机变量X, (4.2)式成为P{x1≤X2.4.4 理论应用P{X=a}例2.4.1 设连续型随机变量X的概率密度f (x)如右式,试求:解(1) 因为故由(1) 常数k ;(2) P{|X|≤0.5};(3) X的分布函数.(2) 所求概率(3) 因为得到当x<-1时,当-1≤x<1时,当x≥1时,得X的分布函数(4) 计算连续型随机变量X落入区间(a,b]或[a,b)或[a,b]内的概率都用公式P{a= P{a≤X≤b}=或(∵ P{X=a}=0)(1) 确定f(x)中的待定参数用公式讲评(2) 已知概率密度f(x), 求分布函数用定义(3) 已知分布函数F(x), 求概率密度f(x)用关系注意F(x)和f(x)为分段函数时的定义区间写法.常用的连续型随机变量的分布有均匀分布、指数分布和正态分布.2.4.5 常见常用的连续型随机变量的分布1.均匀分布均匀分布的分布函数为若连续型随机变量X的概率密度为则称X在区间(a, b)上服从均匀分布, 其中a,b为分布参数, 且a均匀分布的概率密度f(x)及分布函数F(x)的图形分别如下图所示.若X~U (a, b),则对于满足a ≤c< d≤b的c, d,总有可见, 若随机变量X在区间(a,b)上服从均匀分布, 则X落入该区间中任一相等长度的子区间内的概率相同, 即X落入任何子区间的概率仅与该区间的长度成正比, 而与其位置无关. 此性质进一步说明了几何概率定义的合理性.均匀分布常见于下列情形: 某一事件等可能地在某一时间段发生; 在数值计算中, 由于进行四舍五入, 小数点后某一位小数舍入的误差, 例如对小数点后第一位是按四舍五入原则得到时, 那么一般认为误差在(-0.05, 0.05)上服从均匀分布.由题意, 可以认为测量误差 X (单位:cm) 在区间(-0.05,0.05)上服从均匀分布,故知X的概率密度为例2.4.2 测量一个工件的长度, 要求准确到毫米, 即若以厘米为单位计 , 小数点后第一位数字是按“四舍五入”的原则得到. 求由此产生的测量误差X的概率密度, 并求某次测量中, 其误差的绝对值小于0.03的概率.解因此所求概率为2.指数分布若连续型随机变量X的概率密度为则称 X 服从参数为λ的指数分布, 其中λ>0, 是一常数,记为 X~E(λ).用分段积分的方法, 易知指数分布的分布函数为例2.4.3 多年统计表明, 某厂生产的电视机的寿命X~E(0.2) (单位:万小时).(1) 某人购买了一台该厂生产的电视机, 问其寿命超过4万小时的概率是多少 (2) 某单位一次购买了10台这种电视机, 问至少有2台寿命大于4万小时的概率又是多少 (3) 若已知一台电视机的寿命大于4万小时,问这台电视机的寿命大于5万小时的概率是多少?解 由题设知, 随机变量X的概率密度为(1) 电视机寿命超过4万小时的概率为(2) 设Y={10台电视视中寿命大于4万小时的台数}, 则Y服从二项分布, 即有Y~B(10, ). 于是P{Y≥2}=1-P{Y=0}-P{Y=1}=0.9765.(3) 这是求条件概率P{X > 5|X > 4}.讲评(1) 这里X~E(0, 2), Y服从二项分布 Y~B(10, ). 用到结论P{X>4}=e-0.8.(2) 此题比较综合, 应引起重视.指数分布常用于可靠性统计研究中,如元件的寿命, 动植物的寿命, 服务系统的服务时间等等.连续型随机变量X的指数分布概率密度还有形式:3. 正态分布正态分布是应用最广泛的一种连续型分布. 正态分布在19世纪前叶由高斯(Gauss)加以推广, 所以通常又称为高斯分布.正态分布是概率论与数理统计中最常用也是最重要的一种概率分布, 它在解决实际问题中有着广泛的应用. 经验表明, 当一个变量受到大量微小的、互相独立的随机因素影响时, 这个变量往往服从或近似地服从正态分布.在正常条件下, 各种产品的质量指标,零件的尺寸, 纤维的强度和张力,农作物的产量, 小麦的穗长和株高,测量误差, 射击目标的水平或垂直偏差, 信号噪声,等等, 都服从或近似地服从正态分布.(1) 正态分布的定义若随机变量X 的概率密度为则称X服从参数为μ和σ2的正态分布, 其中μ和σ(σ >0)都是常数. 常记为X~N(μ, σ2). f (x)所确定的曲线叫作正态曲线.(2) 正态分布的图形特点正态分布的概率密度图象见图2-11.图2-11 正态分布的概率密度及参数μ,σ含义正态分布的密度曲线是一条关于x=μ对称的钟形曲线, 其特点是“两头小,中间大, 左右对称”. μ决定了图形的中心位置, 当μ取不同值时, 图像将会发生平移; σ决定了图形的峰的陡峭程度: 当σ较大时, 曲线较平坦; 当σ较小时, 曲线则较陡峭.令x1=μ+c, x2=μ-c (c>0), 分别代入f(x), 可得f(μ+c) =f(μ-c), 且f(μ+c)≤f (μ),f (μ-c)≤f (μ), 并在x=μ处达到最大值:当x→±∞时, f(x)→0. 这说明曲线 f(x)向左右伸展时,越来越接近x轴, 即f(x) 以x轴为渐近线; 用求导的方法可以证明, x = μ±σ为f (x)的两个拐点的横坐标.设X~N(μ,σ2), 则随机变量X的分布函数是(3) 正态分布的分布函数当μ=0, σ=1时, 得到的正态分布N(0, 1)称为标准正态分布. 其密度函数和分布函数常用φ(x)和Φ(x)表示. 这里(4) 标准正态分布关于φ(x)和Φ(x)的图形见图2-12.图2-12标准正态分布概率密度φ(x)和分布函数Φ(x)关系关于分布函数Φ(x)和概率密度φ(x)有以下性质:(i) Φ(0)=0.5,φ(0)=(ii) Φ(-x) = 1-Φ(x),φ(-x) =φ(x).标准正态分布的重要性在于,任何一个一般的正态分布N(μ,σ2)都可以通过“标准化”线性变换转化为标准正态分布.定理 若X ~N(μ,σ2), 则Z=~N(0, 1).证的分布函数为=P{X≤μ+σ x}根据这个定理, 只要将标准正态分布的分布函数制成表, 就可以解决一般正态分布的概率计算问题.得到令由此得到(5) 正态分布表及正态分布计算问题书末附有标准正态分布表, 借助于该表, 可以解决一般正态分布的概率计算问题. 表中给的是当x≥0时Φ(x)的值. 对于x<0时, 用关系等式Φ(x)=1-Φ(-x)计算.特别地, P{│X│≤a}=2Φ(a)-1. (4.13)(i) 若X~N(0, 1), 则P{a(ii) 若X~N(μ,σ2), 则Y=~N(0,1), 且有(4.14)求导, 得概率密度关系(4.15)P{a(4.16)区间概率关系:讲评(1) 若X服从标准正态分布, 即 X~N(0, 1)则X落于区间(a, b]上的概率为P{a= P{a≤X≤b}=Φ(b) -Φ(a).(2) 若X服从一般正态分布, 即X~N(μ,σ2) 则X落于区间(a, b]上的概率为P{a= P{a≤X≤b}=F(b) - F(a)(iii ) 3σ准则: 由标准正态分布的查表计算可以求得,当X ~N(0, 1)时,P{│X│≤1}=2Φ(1)-1=0.6826,P{│X│≤2}=2Φ(2) -1=0.9544,P{│X│≤3}=2Φ(3) -1=0.9974.(3) 标准正态分布函数Φ(x)与正态分布函数F(x)的关系:F(x)=ΦΦ(x)=F(μ+σx).这说明,X的取值几乎全部集中在 [-3,3]区间内, 超出这个范围的可能 性仅占不到0.3%.这表明, Y 的取值几乎全部集中在区间[μ-3σ,μ+3σ]内. 这在统计学上称作3σ准则 (三倍标准差原则).上述结论推广到一般的正态分布Y ~N(μ,σ2)时,P{│X-μ│≤σ}=0.6826,P{│X-μ│≤2σ}=0.9544,P{│X-μ│≤3σ}=0.9974.(6) 上α分位点为了便于今后在数理统计中的应用, 对于标准正态随机变量, 我们给出α分位点的定义.设X~N(0,1), 若zα满足条件P{X>zα}=α(0<α<1), (4.17)则称数zα为标准正态分布的上α分位点.图2-13上α分位点zα下面列出了几个常用的zα的值.α 0.001 0.005 0.01 0.025 0.05 0.10zα 3.090 2.576 2.327 1.960 1.645 1.282特别地, 由φ(x)图形的对称性知道z1-α= -zα. (4.18)显然, 由P{X>zα}=α得到P{X≤zα}=1-α. (4.19)例2.2.4 设随机变量.X~N(3,22)(1) 计算P{22};(2) 确定c使得(3) 设d满足,问d至多为多少?解 (1) 利用(2.4.16)式,查标准正态分布表,得到(2) 由 ,得,即由于所以 反查正态分布表知因为正态分布函数Φ(x)是单调递增函数,因此得到 于是c=4.35.(3) 也就是利用正态分布函数Φ(x)是单调递增性, 当且仅当 时成立解得即满足P{X>d}≥0.9关系式的d至多为0.436.2.4.6 内容小结本次课我们介绍了连续型随机变量、概率密度及其性质、分布函数的求法, 这里的例2.4.1和例2.4.4在学习方法上应熟练掌握. 三种重要的常用的连续型随机变量分布必须掌握概率密度及参数意义. 特别是,正态分布、标准正态分布的性质要熟练掌握,它们是今后学习本课程的理论与应用的重要基础,千万不可掉以轻心. 展开更多...... 收起↑ 资源预览