资源简介
第七节 二项分布与正态分布
(1)通过具体实例,了解伯努利实验,掌握二项分布及其数字特征,并能解决实际问题;(2)了解正态密度曲线的特点及曲线所表示的意义,并进行简单应用.
重点一 伯努利试验与二项分布
1.伯努利试验:只包含两个可能结果的试验叫做伯努利试验;将一个伯努利试验独立地重复进行n次所组成的随机试验称为n重伯努利试验.
2.二项分布:一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0
P(X=k)=Cpk(1-p)n-k,k=0,1,2,…,n.
如果随机变量X的分布列具有上式的形式,则称随机变量X服从二项分布,记作X~B(n,p).
对于服从二项分布的随机变量X,E(X)=np,D(X)=np(1-p).
[逐点清]
1.(选择性必修第三册76页练习1题改编)已知X是一个随机变量,若X~B,则P(X=2)=( )
A. B.
C. D.
解析:D 由题意知n=6,p=,故P(X=2)=C×2×6-2=C×2×4=.
2.(选择性必修第三册71页习题4题改编)在一次招聘中,主考官要求应聘者从6道备选题中一次性随机抽取3道题,并独立完成所抽取的3道题.乙能正确完成每道题的概率为,且每道题完成与否互不影响.记乙能答对的题数为Y,则Y的数学期望为________.
解析:由题意知Y的可能取值为0,1,2,3,且Y~B,则E(Y)=3×=2.
答案:2
重点二 正态分布
若随机变量X服从正态分布,记为X~N(μ,σ2),其中E(X)=μ,D(X)=σ2.
当μ=0,σ=1时,随机变量X服从标准正态分布.
(1)正态曲线的特点
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,它关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
(2)正态分布的三个常用数据
①P(μ-σ≤X≤μ+σ)≈0.682 7;
②P(μ-2σ≤X≤μ+2σ)≈0.954 5;
③P(μ-3σ≤X≤μ+3σ)≈0.997 3.
[逐点清]
3.(易错题)在如图所示的正方形中随机投掷10 000个点,则落入阴影部分(曲线C为正态分布N(0,1)的密度曲线)的点的个数的估计值为(附:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)=0.682 6,P(μ-2σ≤X≤μ+2σ)=0.954 4)( )
A.2 386 B.2 718
C.3 413 D.4 772
解析:C 因为μ=0,σ2=1,则σ=1,由正态分布的性质,得阴影部分的面积为P(0≤X≤1)=P(-1≤X≤1)=×0.682 6=0.341 3,故点落入阴影部分的概率为=0.341 3,所以落入阴影部分的点的个数约为10 000×0.341 3=3 413,故选C.
4.(选择性必修第三册87页练习2题改编)已知随机变量X服从正态分布N(3,1),且P(X>2c-1)=P(X解析:∵X~N(3,1),∴正态曲线关于x=3对称,且P(X>2c-1)=P(X答案:
n重伯努利试验与二项分布
考向1 概率问题
某气象站天气预报的准确率为80%,计算:(结果保留到小数点后2位)
(1)5次预报中恰有2次准确的概率;
(2)5次预报中至少有2次准确的概率;
(3)5次预报中恰有2次准确,且其中第3次预报准确的概率.
[解] 令X表示5次预报中预报准确的次数,则X~B,故其中分布列为P(X=k)=Ck·5-k(k=0,1,2,3,4,5).
(1)“5次预报中恰有2次准确”的概率为P(X=2)=C23=10××≈0.05.
(2)“5次预报中至少有2次准确”的概率为P(X≥2)=1-P(X=0)-P(X=1)=1-C×05-C××4=1-0.000 32-0.006 4≈0.99.
(3)“5次预报中恰有2次准确,且其中第3次预报准确”的概率为C××3×≈0.02.
n重伯努利试验与符合二项分布的概率问题的解题策略
(1)在求n重伯努利试验中事件恰好发生k次的概率时,首先要确定好n和k的值,再准确利用公式求概率;
(2)在根据伯努利试验求二项分布的有关问题时,关键是厘清事件与事件之间的关系,确定二项分布的试验次数n和变量的概率,然后再求所给事件的概率及相关问题.
已知某种植物种子每粒成功发芽的概率都为,某植物研究所分三个小组分别独立进行该种子的发芽试验,每次试验种一粒种子,每次试验结果相互独立.假定某次试验种子发芽则称该次试验是成功的,如果种子没有发芽,则称该次试验是失败的.
(1)第一小组做了四次试验,求该小组恰有两次失败的概率;
(2)第二小组做了四次试验,设试验成功与失败的次数的差的绝对值为X,求X的分布列及数学期望;
(3)第三小组进行试验,到成功了四次为止,在第四次成功之前共有三次失败的前提下,求恰有两次连续失败的概率.
解:(1)第一组恰有两次失败的概率P=C2·4-2==.
(2)由题意可知X的所有取值为0,2,4,
则P(X=0)=C24-2==,
P(X=2)=C14-1+C34-3==,
P(X=4)=C4+C4==.
故X的分布列为
X 0 2 4
P
E(X)=0×+2×+4×=,即所求数学期望为.
(3)由题意可知,在第四次成功之前共有三次失败的前提下,共有C=20(个)样本点,而满足恰有两次连续失败的样本点共有A=12(个),从而由古典概型可得所求概率P==.
考向2 期望与方差
一个盒子中装有大量形状、大小一样但重量不尽相同的小球,从中随机抽取50个作为样本,称出它们的重量(单位:克),重量分组区间为[5,15],(15,25],(25,35],(35,45],由此得到样本的重量频率分布直方图(如图).
(1)求a的值,并根据样本数据,试估计盒子中小球重量的众数与平均值;
(2)从盒子中随机抽取3个小球,其中重量在[5,15]内的小球个数为X,求X的分布列和数学期望(以直方图中的频率作为概率).
[解] (1)由题意,得(0.02+0.032+a+0.018)×10=1,解得a=0.03.
由频率分布直方图可估计盒子中小球重量的众数为20克,
而50个样本中小球重量的平均值=0.2×10+0.32×20+0.3×30+0.18×40=24.6(克).
故由样本估计总体,可估计盒子中小球重量的平均值为24.6克.
(2)该盒子中小球重量在[5,15]内的概率为,则X~B.
X的可能取值为0,1,2,3,
则P(X=0)=C0×3=,
P(X=1)=C1×2=,
P(X=2)=C2×1=,
P(X=3)=C3×0=.
∴X的分布列为
X 0 1 2 3
P
∴E(X)=0×+1×+2×+3×=.
二项分布的期望与方差的求解策略
(1)如果ξ ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p)求解,可大大减少计算量;
(2)有些随机变量虽不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aξ+b)=aE(ξ)+b以及E(ξ)=np求出E(aξ+b),同样还可求出D(aξ+b).
电子商务在我国发展迅猛,网上购物已经成为很多人的选择.某购物网站组织了一次促销活动,在网页的界面上打出广告:高级口香糖10元钱三瓶,有8种口味供您选择(其中有1种为草莓口味).小王点击进入网页一看,只见有很多包装完全相同的瓶装口香糖排在一起,看不见具体口味,由购买者随机点击进行选择(各种口味的高级口香糖均超过三瓶,且各种口味的瓶数相同,每点击选择一瓶后,网页自动补充相应的口香糖).
(1)小王花10元钱买三瓶,请问小王收到货的组合方式共有多少种?
(2)小王花10元钱买三瓶,由小王随机点击三瓶,请列出有小王喜欢的草莓味口香糖的瓶数ξ的分布列,并计算其数学期望和方差.
解:(1)若三瓶口味均不一样,有C=56(种);
若其中两瓶口味一样,有CC=56(种);
若三瓶口味一样,有8种.
故小王收到货的组合方式共有56+56+8=120(种).
(2)ξ所有可能的取值为0,1,2,3.
因为各种口味的高级口香糖均超过3瓶,且各种口味的瓶数相同,有8种不同口味,所以小王随机点击一次是草莓味口香糖的概率为.
即随机变量ξ服从二项分布,即ξ~B.
P(ξ=0)=C×0×3=,
P(ξ=1)=C×1×2=,
P(ξ=2)=C×2×1=,
P(ξ=3)=C×3×0=.
所以ξ的分布列为
ξ 0 1 2 3
P
数学期望E(ξ)=np=3×=.
方差D(ξ)=np(1-p)=3××=.
正态分布
(1)(2021·新高考Ⅱ卷)某物理量的测量结果服从正态分布N(10,σ2),下列结论中不正确的是( )
A.σ越小,该物理量在一次测量中在(9.9,10.1)的概率越大
B.σ越小,该物理量在一次测量中大于10的概率为0.5
C.σ越小,该物理量在一次测量中小于9.99与大于10.01的概率相等
D.σ越小,该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等
(2)(2022·山东九校联考)若随机变量X服从正态分布N(μ,σ2),P(μ-σ≤X≤μ+σ)=0.682 7,P(μ-2σ≤X≤μ+2σ)=0.954 5,设X~N(1,σ2),且P(X≥3)=0.158 65,在平面直角坐标系xOy中,若圆x2+y2=σ2上有四个点到直线12x-5y+c=0的距离为1,则实数c的取值范围是________.
[解析] (1)对于A,σ越小,正态分布的图象越瘦长,总体分布越集中在对称轴附近,故A正确;对于B、C,由于正态分布图象的对称轴为μ=10,显然B、C正确.D显然错误.故选D.
(2)因为X~N(1,σ2),所以μ=1,所以P(X>3)=P(X<-1)=[1-P(-1≤X≤3)],因为P(X>3)=0.158 65,所以P(-1≤X≤3)=0.682 7,所以1-σ=-1,1+σ=3,所以σ=2,由题意知,只需圆心(0,0)到直线12x-5y+c=0的距离d满足0≤d<1即可.因为d==,所以0≤<1,所以0≤|c|<13,所以-13[答案] (1)D (2)(-13,13)
解决正态分布问题有三个关键点:(1)对称轴x=μ;(2)标准差σ;(3)分布区间.利用对称性可求指定范围内的概率值;由μ,σ分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率.注意只有在标准正态分布下对称轴才为x=0.
2019年7月8日,中共中央、国务院印发《关于深化教育教学改革全面提高义务教育质量的意见》,提出坚持“五育(德、智、体、美、劳)”并举,全面发展素质教育.某学校共有学生4 000人,为加强劳动教育,开展了以下活动:全体同学参加劳动常识竞赛,满分100分.其中,成绩高于80分的同学,有资格到指定农场参加劳动技能过关考核,劳动技能过关考核共设三关,通过第一关得20分,未通过不得分,后两关通过一关得40分,未通过不得分,每位同学三关考核都要参加,记考核结束后学生的得分之和为X.
(1)分析发现,学生劳动常识竞赛成绩ξ~N(71,81),试估计参加劳动技能过关考核的人数(精确到个位);
(2)某参加技能过关考核的同学通过第一关的概率为,通过后两关的的概率均为,且每关是否通过相互独立,求X的分布列及数学期望.
附:若随机变量X~N(μ,σ2),则P(μ-σ≤ξ≤μ+σ)≈0.682 7,P(μ-2σ≤ξ≤μ+2σ)≈0.954 5,P(μ-3σ≤ξ≤μ+3σ)≈0.997 3.
解:(1)依题意,μ=71,σ=9,所以μ+σ=80,
所以P(ξ>80)==0.158 65,
所以估计参加劳动技能过关考核的人数为4 000×0.158 65=634.6≈635.
(2)依题意,X的可能取值分别为0,20,40,60,80,100.
因为P(X=0)=×2=,
P(X=20)=×2=,
P(X=40)=×C×=,
P(X=60)=×C×=,
P(X=80)=×2=,
P(X=100)=×2=,
所以X的分布列为
X 0 20 40 60 80 100
P
E(X)=0×+20×+(80+40)×+(60+100)×=.
数据分析、数学建模——二项分布与超几何分布模型识别问题
教科书和考题中常涉及二项分布与超几何分布,学生对这两种模型的定义不能很好地理解,一遇到“取”或“摸”的题型,就认为是超几何分布,不加分析,滥用公式,运算对象不明晰,事实上,超几何分布和二项分布确实有着密切的联系,但也有明显的区别,下面我们通过两个例题加以说明.
写出下列离散型随机变量的分布列,并指出其中服从二项分布的是哪些?服从超几何分布的是哪些?
(1)X1表示n次重复抛掷1枚骰子出现点数是3的倍数的次数;
(2)X2表示连续抛掷2枚骰子,所得的2个骰子的点数之和;
(3)有一批产品共有N件,其中次品有M件(N>M>0),采用有放回抽取方法抽取n次(n>N),抽出的次品件数为X3;
(4)有一批产品共有N件,其中M件为次品,采用不放回抽取方法抽n件,出现次品的件数为X4(N-M≥n>0,m=min{M,n}).
[解] (1)X1的分布列为
X1 0 1 2 … n
P C0·n C1·n-1 C2·n-2 … C·n
X1服从二项分布,即X1~B.
(2)X2的分布列为
X2 2 3 4 5 6 7 8 9 10 11 12
P
X2既不服从二项分布,也不服从超几何分布.
(3)X3的分布列为
X3 0 1 2 … n
P n C·n-1 C2·n-2 … n
X3服从二项分布,即X3~B.
(4)X4的分布列为
X4 0 1 … m
P …
X4服从超几何分布.
某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上的40件产品作为样本称出它们的质量(单位:克),质量的分组区间为(490,495],(495,500],…,(510,515],由此得到样本的频率分布直方图(如图).
(1)根据频率分布直方图,求质量超过505克的产品数量;
(2)在上述抽取的40件产品中任取2件,设X为质量超过505克的产品数量,求X的分布列;
(3)从该流水线上任取2件产品,设Y为质量超过505克的产品数量,求Y的分布列.
[解] (1)质量超过505克的产品的频率为5×0.05+5×0.01=0.3,所以质量超过505克的产品数量为40×0.3=12(件).
(2)质量超过505的产品数量为12件,则质量未超过505克的产品数量为28件,X的取值为0,1,2,X服从超几何分布.
P(X=0)==,P(X=1)==,
P(X=2)==,
所以X的分布列为
X 0 1 2
P
(3)根据样本估计总体的思想,取一件产品,该产品的质量超过505克的概率为=.
从流水线上任取2件产品互不影响,该问题可看成2次独立重复试验,质量超过505克的件数Y的可能取值为0,1,2,且Y~B,P(Y=k)=Ck2-k,
所以P(Y=0)=C·2=,P(Y=1)=C··=,P(Y=2)=C·2=.
所以Y的分布列为
Y 0 1 2
P
[点评] 超几何分布的抽取是不放回抽取,各次抽取不独立,二项分布的抽取是独立的,各次抽取相互独立.当超几何分布所对应的总体数量很大时可以近似地看作二项分布.
[课时过关检测]
A级——基础达标
1.已知随机变量X服从二项分布B(n,p).若E(X)=2,D(X)=,则p=( )
A. B.
C. D.
解析:C 由随机变量X服从二项分布B(n,p).又E(X)=2, D(X)=,所以np=2,np(1-p)=,解得p=,故选C.
2.某高三学生进行心理素质测试,场景相同的条件下每次通过测试的概率为,则连续测试4次,至少有3次通过的概率为( )
A. B.
C. D.
解析:A 4次独立重复实验,故概率为C3·+C4=.
3.为加强体育锻炼,让运动成为习惯,某校进行了一次体能测试,这次体能测试满分为100分,从高三年级抽取1 000名学生的测试结果,已知测试结果ξ服从正态分布N(70,σ2).若ξ在(50,70)内取值的概率为0.4,则ξ在90分以上取值的概率为( )
A.0.05 B.0.1
C.0.2 D.0.4
解析:B ∵ξ服从正态分布N(70,σ2),∴正态曲线的对称轴是直线x=70,∴ξ在(70,100)内取值的概率为0.5.∵ξ在(50,70)内取值的概率为0.4,∴ξ在(70,90)内取值的概率为0.4,则ξ在90分以上取值的概率为0.5-0.4=0.1.故选B.
4.已知随机变量ξ,η满足ξ~B(2,p),η+2ξ=1,且P(ξ≤1)=,则D(η)的值为( )
A.0 B.1
C.2 D.3
解析:C 因为随机变量ξ满足ξ~B(2,p),P(ξ≤1)=,所以有P(ξ≤1)=C(1-p)2+Cp(1-p)=1-p2=,即p=.则D(ξ)=2××=,η=1-2ξ,D(η)=4D(ξ)=2.故选C.
5.(多选)袋子中有2个黑球,1个白球,现从袋子中有放回地随机取球4次,取到白球记0分,黑球记1分,记4次取球的总分数为X,则( )
A.X~B B.P(X=2)=
C.E(X)= D.D(X)=
解析:ACD 从袋子中有放回地随机取球4次,则每次取球互不影响,并且每次取到的黑球概率相等,又取到黑球记1分,取4次球的总分数,即为取到黑球的个数,所以随机变量X服从二项分布X~B,故A正确;X=2,则其概率为P(X=2)=C22=,故B错误;因为X~B,所以X的期望E(X)=4×=,故C正确;因为X~B,所以X的方差D(X)=4××=,故D正确.故选A、C、D.
6.(多选)甲、乙两类水果的质量(单位:kg)分别服从正态分布N(μ1,σ),N(μ2,σ),其正态分布密度曲线如图所示,则下列说法正确的是( )
A.甲类水果的平均质量为0.4 kg
B.甲类水果的质量分布比乙类水果的质量分布更集中于平均值左右
C.平均质量分布在[0.4,0.8]时甲类水果比乙类水果占比大
D.σ2=1.99
解析:ABC 由题图可知,甲类水果的平均质量为μ1=0.4 kg,故A正确;由图可知,甲类水果的质量分布比乙类水果的质量更集中于平均值左右,故B正确;由图可看出平均质量分布在[0.4,0.8]时甲类水果比乙类水果占比大,故C正确;乙类水果的质量服从的正态分布的参数满足=1.99,则σ2≠1.99,故D错误,故选A、B、C.
7.已知随机变量ξ~B(6,p),且E(ξ)=2,则D(3ξ+2)=________.
解析:因为ξ~B(6,p),所以E(ξ)=n·p=6·p=2,解得p=,又因为D(ξ)=n·p·(1-p)=2·=,所以D(3ξ+2)=9D(ξ)=12.
答案:12
8.一台仪器每启动一次都随机地出现一个5位的二进制数A=,其中A的各位数字中,a1=1,ak(k=2,3,4,5)出现0的概率为,出现1的概率为,则启动一次出现的数字A中恰有两个0的概率为________.
解析:根据题意,A中恰有两个0的概率,即在a2,a3,a4,a5四个数中恰好有2个0,2个1,则A中恰有两个0的概率P=C2×2=.
答案:
9.在某市2021年6月的高中质量检测考试中,高二年级学生的数学成绩服从正态分布N(98,100).已知参加本次考试的全市高二年级学生约100 000人.某学生在这次考试中的数学成绩是108分,那么他的数学成绩大约排在全市第________名.
(参考数值:P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3)
解析:因为考试的成绩X服从正态分布N(98,100),所以μ=98,σ=10,
所以,108=μ+σ,则P(X≥108)=P(X≥μ+σ)==0.158 65,数学成绩为108分的学生大约排在全市第100 000×0.158 65=15 865名.
答案:15 865
10.羽毛球是一项隔着球网,使用长柄网状球拍击打用羽毛和软木刷制作而成的一种小型球类的室内运动项目.羽毛球比赛的计分规则:采用21分制,即双方分数先达21分者胜,3局2胜.每回合中,取胜的一方加1分.每局中一方先得21分且领先至少2分即算该局获胜,否则继续比赛;若双方打成29平后,一方领先1分,即算该局取胜.某次羽毛球比赛中,甲选手在每回合中得分的概率为,乙选手在每回合中得分的概率为.
(1)在一局比赛中,若甲、乙两名选手的得分均为18,求再经过4回合比赛甲获胜的概率;
(2)在一局比赛中,记前4回合比赛甲选手得分为X,求X的分布列及数学期望E(X).
解:(1)记再经过4回合比赛,甲获胜为事件A,
可知甲在第4回合胜,前3回合胜2场,所以P(A)=×C2×=.
(2)易知X的取值为0,1,2,3,4,且X~B,
P(X=0)=C4=,P(X=1)=C3×=,P(X=2)=C2×2=,P(X=3)=C×3=,P(X=4)=C4=,
所以X的分布列为
X 0 1 2 3 4
P
数学期望E(X)=np=4×=3.
B级——综合应用
11.假设某射手每次射击命中率相同,且每次射击之间相互没有影响.若在两次射击中至多命中一次的概率是,则该射手每次射击的命中率为( )
A. B.
C. D.
解析:C 设该射手射击命中的概率为p,两次射击命中的次数为X,则X~B(2,p),由题可知:P(X=0)+P(X=1)=,即Cp0(1-p)2+Cp(1-p)=,解得p=.故选C.
12.如图,在网格状小地图中,一机器人从A(0,0)点出发,每秒向上或向右行走1格到相应顶点,已知向上的概率是,向右的概率是,则6秒后到达B(4,2)点的概率为( )
A. B.
C. D.
解析:D 根据题意可知,机器人每秒运动一次,则6秒共运动6次,若其从A(0,0)点出发,6秒后到达B(4,2),则需要向右走4步,向上走2步,故其6秒后到达B的概率为C×2×4==.
13.(2018·全国Ⅰ卷)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0;
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);
②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
解:(1)因为20件产品中恰有2件不合格品的概率为
f(p)=Cp2·(1-p)18,
所以f′(p)=C[2p(1-p)18-18p2(1-p)17]
=2Cp(1-p)17(1-10p).
令f′(p)=0,得p=0.1.
当p∈(0,0.1)时,f′(p)>0;
当p∈(0.1,1)时,f′(p)<0.
所以f(p)的最大值点为p0=0.1.
(2)由(1)知,p=0.1.
①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.所以E(X)=E(40+25Y)=40+25E(Y)=490.
②若对余下的产品作检验,则这一箱产品所需要的检验费用为400元.由于E(X)>400,故应该对余下的产品作检验.
展开更多......
收起↑