第十章 §10.9 概率与统计的综合问题 学案(Word版含解析)

资源下载
  1. 二一教育资源

第十章 §10.9 概率与统计的综合问题 学案(Word版含解析)

资源简介

§10.9 概率与统计的综合问题
题型一 频率分布直方图与分布列的综合问题
例1 (2022·湖北九师联盟模拟)某校高三年级举行了高校强基计划模拟考试(满分100分),将不低于50分的考生的成绩分为5组,即[50,60),[60,70),[70,80),[80,90),[90,100],并绘制频率分布直方图如图所示,其中在[90,100]内的人数为3.
(1)求a的值,并估计不低于50分考生的平均成绩(同一组中的数据用该组区间的中点值代替);
(2)现把[50,60)和[90,100]内的所有学生的考号贴在质地、形状和大小均相同的小球上,并放在盒子内,现从盒中随机抽取2个小球,若取出的两人成绩差不小于30,则称这两人为“黄金搭档组”.现随机抽取4次,每次取出2个小球,记下考号后再放回盒内,记取出“黄金搭档组”的次数为X,求X的分布列和均值E(X).
解 (1)由题意,得(0.005+0.01+0.015+a+0.045)×10=1,解得a=0.025,
不低于50分考生的平均成绩估计为55×0.1+65×0.25+75×0.45+85×0.15+95×0.05=73(分).
(2)在[90,100]上的频率为0.005×10=0.05,由条件得总人数为=60,
所以在[50,60]内的人数为60×0.1=6,每次抽取出‘黄金搭档组”的概率P==,
因此X~B,
P(X=0)=C×0×4=,
P(X=1)=C×1×3=,
P(X=2)=C×2×2=,
P(X=3)=C×3×1=,
P(X=4)=C×4×0=,
X的分布列为
X 0 1 2 3 4
P
E(X)=np=4×=2.
教师备选
(2022·湛江模拟)某高三学生小明准备利用暑假的7月和8月勤工俭学,现有“送外卖员”和“销售员”两份工作可供其选择.已知“销售员”工作每日底薪为50元,每日销售的前5件每件奖励20元,超过5件的部分每件奖励30元.小明通过调查,统计了100名销售员1天的销售记录,其柱状图如图1;“送外卖员”没有底薪,收入与送的单数相关,在一日内:1至20单(含20单)每送一单3元,超过20单且不超过40单的部分每送一单4元,超过40单的部分,每送一单4.5元.小明通过随机调查,统计了100名送外卖员的日送单数,并绘制成如下频率分布直方图(如图2).
图1
图2
(1)分别求出“销售员”的日薪y1(单位:元)与销售件数x1的函数关系式、“送外卖员”的日薪y2(单位:元)与所送单数x2的函数关系式;
(2)若将频率视为概率,根据统计图,试分别估计“销售员”的日薪X1和“送外卖员”的日薪X2(同一组中的数据用该组区间的中点值代表)的均值,分析选择哪种工作比较合适,并说明你的理由.
解 (1)“销售员”的日薪y1(单位:元)与销售件数x1的函数关系式为
y1=
“送外卖员”的日薪y2(单位:元)与所送单数x2的函数关系式为
y2=
(2)由柱状图知,日平均销售量满足如下表格:
销售量/件 3 4 5 6 7
频率 0.05 0.2 0.25 0.4 0.1
所以X1的分布列为
X1 110 130 150 180 210
P 0.05 0.2 0.25 0.4 0.1
所以E(X1)=110×0.05+130×0.2+150×0.25+180×0.4+210×0.1=162(元).
由频率分布直方图可知,日送单数满足如下表格:
单数/单 10 30 50 70 90
频率 0.05 0.25 0.45 0.2 0.05
所以X2的分布列为
X2 30 100 185 275 365
P 0.05 0.25 0.45 0.2 0.05
所以E(X2)=30×0.05+100×0.25+185×0.45+275×0.2+365×0.05=183(元).
由以上计算得E(X2)>E(X1),做“送外卖员”挣的更多,
故小明选择做“送外卖员”的工作比较合适.
思维升华 高考常将频率分布直方图与分布列等交汇在一起进行考查,因此在解答此类题时,准确的把题中所涉及的事件进行分解,明确所求问题所属的事件类型是关键.
跟踪训练1 (2022·太原模拟)国家发改委、住建部发布了《生活垃圾分类制度实施方案》规定46个城市实施生活垃圾强制分类,垃圾回收利用率要达35%以上.某市在实施垃圾分类之前,对该市大型社区(即人口数量在1万左右)一天产生的垃圾量(单位:吨)进行了调查.已知该市这样的大型社区有200个,如图是某天从中随机抽取50个社区所产生的垃圾量绘制的频率分布直方图.现将垃圾量超过14吨/天的社区称为“超标”社区.
(1)根据上述资料,估计当天这50个社区垃圾量的平均值(四舍五入精确到整数);
(2)若当天该市这类大型社区的垃圾量X~N(μ,9),其中μ近似为(1)中的样本平均值,请根据X的分布估计这200个社区中“超标”社区的个数(四舍五入精确到整数);
(3)市环保部门决定对样本中“超标”社区的垃圾来源进行调查,现从这些社区中随机抽取3个进行重点监控,设Y为其中当天垃圾量至少为16吨的社区个数,求Y的分布列与均值.
附:P(μ-σ≤X≤μ+σ)≈0.682 7;P(μ-2σ≤X≤μ+2σ)≈0.954 5;P(μ-3σ≤X≤μ+3σ)≈0.997 3.
解 (1)由频率分布直方图得该样本中垃圾量为[4,6),[6,8),[8,10),[10,12),[12,14),[14,16),[16,18]的频率分别为0.08,0.10,0.20,0.24,0.18,0.12,0.08,
=5×0.08+7×0.10+9×0.20+11×0.24+13×0.18+15×0.12+17×0.08
=11.04≈11,
∴当天这50个社区垃圾量的平均值为11吨.
(2)由(1)知μ=11,
∵σ2=9,∴σ=3,
∴P(X>14)=P(X>μ+σ)
==0.158 65,
∴这200个社区中“超标”社区的个数为200×0.158 65≈32.
(3)由(1)得样本中当天垃圾量为[14,16)的社区有50×0.12=6(个),垃圾量为[16,18)的社区有50×0.08=4(个),
∴Y的所有可能取值为0,1,2,3,
P(Y=0)==,
P(Y=1)==,
P(Y=2)==,
P(Y=3)==,
∴Y的分布列为
Y 0 1 2 3
P
∴E(Y)=0×+1×+2×+3×=.
题型二 回归模型与分布列的综合问题
例2 学习于才干信仰,犹如运动于健康体魄,持之以恒、行之愈远愈受益.为了顺利实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某市教育局为了解全市教职工在“学习强国”中每天学习得分情况,从全市教职工中随机抽取1 000名教职工,得到他们平均每天的学习得分,得分都在[15,50]内,将他们的得分分为七组:[15,20),[20,25),[25,30),[30,35),[35,40),[40,45),[45,50]后得到频率分布直方图如图所示.
(1)从样本中得分不低于40的教职工中用分层随机抽样的方法抽取12人,然后从这12人中随机抽取3人进行学习体会交流,用X表示参加学习体会交流且得分不低于45分的人数,求X的分布列和均值;
(2)某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数 1 2 3 4 5 6 7
一次最多答对题数 12 15 16 18 21 24 27
由表中数据可知该老师每天一次最多答对题数y与第x天之间可用线性模型拟合,请用样本相关系数加以说明,并求出y关于x的经验回归方程.
参考数据:≈2.45,iyi=600,
(xi-)2=28,(yi-)2=168.
参考公式:r=,经验回归方程=+x中斜率和截距的最小二乘估计公式=,=-.
解 (1)在抽取的1 000名教职工中得分在[40,45)的有0.016×5×1 000=80(人),
得分在[45,50]的有0.008×5×1 000=40(人),
所以在得分为[40,45)的人中应抽取
×12=8(人),
在得分为[45,50]的人中应抽取12-8=4(人).
由题可得X的所有可能取值为0,1,2,3,
P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==,
所以X的分布列为
X 0 1 2 3
P
E(X)=0×+1×+2×+3×=1.
(2)由条件可知=4,=19,
则y关于x的样本相关系数
r==
≈≈0.99.
因为0.99与1非常接近,所以y关于x有较强的线性相关关系,
因为==,
=-=19-×4=’
所以y关于x的经验回归方程是=+x.
教师备选
设某幼苗从观察之日起,第x天的高度为y(cm),测得的一些数据如下表所示:
第x天 1 4 9 16 25 36 49
高度y(cm) 0 4 7 9 11 12 13
作出这组数据的散点图发现:y(cm)与x(天)之间近似满足关系式y=b+a,其中a,b均为大于0的常数.
(1)试借助一元线性回归模型,根据所给数据,用最小二乘法对a,b作出估计,并求出y关于x的经验回归方程;
(2)在作出的这组数据的散点图中,甲同学随机圈取了其中的3个点,记这3个点中幼苗的高度大于的点的个数为ξ,其中为表格中所给的幼苗高度的平均数,试求随机变量ξ的分布列和均值.
附:对于一组数据(v1,μ1),(v2,μ2),…,(vn,μn),其经验回归方程=+v的斜率和截距的最小二乘估计分别为=,
=-.
解 (1)令μ=,则y=bμ+a,根据已知数据表得到下表:
x 1 4 9 16 25 36 49
μ= 1 2 3 4 5 6 7
y 0 4 7 9 11 12 13
==4,
==8,
通过上表计算可得
= ==,
因为回归直线=μ+过点(,),
所以=-=-,
故y关于x的经验回归方程为=-.
(2)7天中幼苗高度大于=8的有4天,小于等于8的有3天,从散点图中任取3个点,即从这7天中任取3天,所以这3个点中幼苗的高度大于的点的个数ξ的所有可能取值为0,1,2,3,
P(ξ=0)==;
P(ξ=1)==;
P(ξ=2)==;
P(ξ=3)==.
所以随机变量ξ的分布列为
ξ 0 1 2 3
P
随机变量ξ的均值
E(ξ)=0×+1×+2×+3×=.
思维升华 高考常将回归模型与分布列等交汇在一起进行考查,求解时注意概率模型的应用,明确所求问题所属的事件类型是关键.
跟踪训练2 数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.
(1)赛前小明在某数独APP上进行了一段时间的训练,每天解题的平均速度y(秒/题)与训练天数x(天)有关,经统计得到如下数据:
x(天) 1 2 3 4 5 6 7
y(秒/题) 910 800 600 440 300 240 210
现用=+作为回归方程模型,请利用表中数据,求出该回归方程;(a,b用分数表示)
(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,不存在平局,两人约定先胜3局者赢得比赛.若小明每局获胜的概率为,且各局之间相互独立,设比赛X局后结束,求随机变量X的分布列及均值.
参考数据:
iyi -72
1 750 0.37 0.55
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程=+u的斜率和截距的最小二乘估计分别为=,=-.
解 (1)因为=+,ti=,
所以=+t.
因为==500,
所以==
==,
所以=-=500-×0.37=,
所以=+t,
所以所求回归方程为=+.
(2)随机变量X的所有可能取值为3,4,5,
P(X=3)=3+3=,
P(X=4)=C2××+C2××=,
P(X=5)=C2×2×+C2×2×=.
所以随机变量X的分布列为
X 3 4 5
P
E(X)=3×+4×+5×=.
题型三 独立性检验与分布列的综合问题
例3 (2022·苏州模拟)为落实十三五规划节能减排的国家政策,某职能部门对市场上两种设备的使用寿命进行调查统计,随机抽取A型和B型设备各100台,得到如下频率分布直方图:
A型
B型
(1)将使用寿命超过2 500小时和不超过2 500小时的台数填入下面的列联表:
超过2 500小时 不超过2 500小时 合计
A型
B型
合计
根据上面的列联表,依据小概率值α=0.01的独立性检验,能否认为使用寿命是否超过2 500小时与型号有关?
(2)用分层随机抽样的方法从不超过2 500小时的A型和B型设备中抽取8台,再从这8台设备中随机抽取3台,其中A型设备为X台,求X的分布列和均值;
(3)已知用频率估计概率,现有一项工作需要10台同型号设备同时工作2 500小时才能完成,工作期间设备损坏立即更换同型号设备(更换设备时间忽略不计),A型和B型设备每台的价格分别为1万元和0.6万元,A型和B型设备每台每小时耗电分别为2度和6度,电价为0.75元/度.只考虑设备的成本和电费,你认为应选择哪种型号的设备,请说明理由.
参考公式:χ2=,n=a+b+c+d.
参考数据:
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
解 (1)由频率分布直方图可知,A型超过2 500小时的有100×(0.000 6+0.000 5+0.000 3)× 500=70(台),则A型不超过2 500小时的有30台,同理,B型超过2 500小时的有100×(0.000 6+0.000 3+0.000 1)×500=50(台),则B型不超过2 500小时的有50台.
列联表如下:
超过2 500小时 不超过2 500小时 合计
A型 70 30 100
B型 50 50 100
合计 120 80 200
零假设为H0:使用寿命是否超过2 500小时与型号无关,
根据列联表中的数据,经计算得到
χ2=
≈8.333>6.635=,
所以依据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为使用寿命是否超过 2 500小时与型号有关.
(2)由(1)和分层随机抽样的定义可知A型设备有3台,B型设备有5台,
所以X的所有可能取值为0,1,2,3,
P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==,
所以X的分布列为
X 0 1 2 3
P
所以E(X)=0×+1×+2×+3×=.
(3)由频率分布直方图中的频率估计概率知:
A型设备每台更换的概率为0.3,
所以10台A型设备估计要更换3台;
B型设备每台更换的概率为0.5,
所以10台B型设备估计要更换5台,
选择A型设备的总费用y1=(10+3)×1+10×2×0.75×2 500×10-4=16.75 (万元),
选择B型设备的总费用y2=(10+5)×0.6+10×6×0.75×2 500×10-4=20.25 (万元),y1所以选择A型设备.
教师备选
(2022·大连模拟)某医疗用品生产企业对原有的生产线进行技术升级,为了更好地对比技术升级前和升级后的效果,其中甲生产线继续使用旧的生产模式,乙生产线采用新的生产模式.质检部门随机抽检了甲、乙两条生产线的各200件该医疗用品,在抽取的400件产品中,根据检测结果将它们分为“A”“B”“C”三个等级,A,B等级都是合格品,C等级是次品,统计结果如表所示:
(表一)
等级 A B C
频数 200 150 50
(表二)
合格品 次品 合计
甲 160
乙 10
合计
在相关政策扶持下,确保每件该医疗用品的合格品都有对口销售渠道,但按照国家对该医疗用品产品质量的要求,所有的次品必须由厂家自行销毁.
(1)请根据所提供的数据,完成上面的2×2列联表(表二),依据小概率值α=0.001的独立性检验,能否认为产品的合格率与技术升级有关?
(2)在抽检的所有次品中,按甲、乙生产线生产的次品比例进行分层随机抽样抽取10件该医疗用品,然后从这10件中随机抽取5件,记其中属于甲生产线生产的有X件,求X的分布列和均值;
(3)每件该医疗用品的生产成本为20元,A,B等级产品的出厂单价分别为m元、40元.若甲生产线抽检的该医疗用品中有70件为A等级,用样本的频率估计概率,若进行技术升级后,平均生产一件该医疗用品比技术升级前多盈利不超过9元,则A等级产品的出厂单价最高为多少元?
附:χ2=,其中n=a+b+c+d.
α 0.05 0.025 0.010 0.005 0.001
xα 3.841 5.024 6.635 7.879 10.828
解 (1)根据所提供的数据,可得2×2列联表:
合格品 次品 合计
甲 160 40 200
乙 190 10 200
合计 350 50 400
零假设为H0:产品的合格率与技术升级无关,根据列联表中的数据,经计算得到
χ2==
≈20.571>10.828=x0.001,
所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为产品的合格率与技术升级有关.
(2)由于所有次品中,甲、乙生产线生产的次品比例为4∶1,
故抽取的10件中有8件甲生产线的,2件乙生产线的,
从中随机抽取5件中属于甲生产线的数量X的所有可能取值为3,4,5,
则P(X=3)==,
P(X=4)==,
P(X=5)==,
所以X的分布列为
X 3 4 5
P
所以E(X)=3×+4×+5×=4.
(3)甲生产线抽检的产品中有70件A等级,90件B等级,40件C等级;
乙生产线抽检的产品中有130件A等级,60件B等级,10件C等级,
因为用样本的频率估计概率,
所以对于甲生产线,单件产品的利润
甲==m-2,
对于乙生产线,单件产品的利润
乙==m-8.
乙-甲=m-8-≤9,
所以m≤50.
即A等级产品的出厂单价最高为50元.
思维升华 高考常将独立性检验与分布列等交汇在一起进行考查,由频率分布直方图解决相关问题,解题的关键是正确理解频率分布直方图,能利用频率分布直方图正确计算出各组数据.
跟踪训练3 (2022·邯郸模拟)暑假期间,学生居家生活和学习,教育部门特别强调,身体健康与学习成绩同样重要.某校对300名学生的锻炼时间进行调查,数据如表:
平均每天锻炼的时间(分钟) [0,10) [10,20) [20,30) [30,40) [40,50) [50,60]
总人数 30 50 60 70 55 35
将学生日均锻炼的时间在[40,60]的学生评价为“体育合格”.
(1)请根据上述表格中的统计数据填写下面2×2列联表,依据小概率值α=0.001的独立性检验,能否认为“体育合格”与性别无关?
体育不合格 体育合格 合计
男 60 160

合计
(2)从上述体育合格的学生中,按性别用分层随机抽样的方法抽取9名学生,再从这9名学生中随机抽取3人了解他们锻炼时间较多的原因,记所抽取的3人中男生的人数为随机变量X,求X的分布列和均值.
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
解 (1)列联表如下:
体育不合格 体育合格 合计
男 100 60 160
女 110 30 140
合计 210 90 300
零假设为H0:“体育合格”与性别无关,
根据列联表中的数据,经计算得到
χ2=
≈9.184<10.828=x0.001,
所以依据小概率值α=0.001的独立性检验,没有充分的证据推断H0不成立,即认为“体育合格”与性别无关.
(2)易知,所抽取的9名学生中,
男生为9×=6(名),女生为3名.
X的所有可能取值为0,1,2,3,
且P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==.
所以X的分布列为
X 0 1 2 3
P
所以E(X)=0×+1×+2×+3×=2.
课时精练
1.(2022·日照模拟)近年来,随着猪肉价格的上涨,作为饲料原材料之一的玉米,价格也出现了波动.为保证玉米销售市场稳定,相关部门某年9月份开始采取宏观调控措施.该部门调查研究发现,这一年某地各月份玉米的销售均价(元/斤)走势如图所示:
(1)该部门发现,3月到7月,各月玉米销售均价y(元/斤)与月份x之间具有较强的线性相关关系,试建立y关于x的经验回归方程(系数精确到0.01),若不调控,依据相关关系预测12月份玉米的销售均价;
(2)该部门在这一年的12个月份中,随机抽取3个月份的数据作样本分析,若关注所抽三个月份的所属季度,记不同季度的个数为X,求X的分布列和均值.
参考数据:i=25,i=5.36,(xi-)(yi-)=0.64.
经验回归方程=x+中斜率和截距的最小二乘估计公式分别为:==,=-.
解 (1)由题意知,
月份x 3 4 5 6 7
均价y 0.95 0.98 1.11 1.12 1.20
计算可得=5,=1.072,(xi-)2=10,
∴==0.064,
=-=0.752,
∴从3月到7月,y关于x的经验回归方程为
=0.06x+0.75,
当x=12时,代入经验回归方程得y=1.47,即可预测12月份玉米销售均价为1.47元/斤.
(2)X的所有可能取值为1,2,3,
则P(X=1)==,
P(X=3)==,
P(X=2)=1-P(X=1)-P(X=3)=,
∴X的分布列为
X 1 2 3
P
E(X)=1×+2×+3×=.
2.(2022·沈阳模拟)第24届冬奥会于2022年在北京市和张家口市联合举行,冬奥会志愿者的服务工作是成功举办的重要保障.在冬奥会的志愿者选拔工作中,某高校承办了冬奥会志愿者选拔的面试工作,面试成绩满分100分,现随机抽取了80名候选者的面试成绩分五组,第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95],绘制成如图所示的频率分布直方图.已知图中从左到右前三个组的频率成等差数列,第一组和第五组的频率相同.
(1)求a,b的值,并估计这80名候选者面试成绩的平均值(同一组中的数据用该组区间的中点值作代表)和中位数(中位数精确到0.1);
(2)已知抽取的80名候选人中,男生和女生各40人,男生希望参加张家口赛区志愿服务的有10人,女生希望参加张家口赛区志愿服务的有20人,补全下面2×2列联表,依据小概率值α=0.05的独立性检验,能否认为参加张家口赛区志愿者服务的候选人与性别有关?
男生 女生 合计
希望去张家口赛区 10 20
不希望去张家口赛区
合计 40 40
(3)冰球项目的场地服务需要5名志愿者,有4名男生和3名女生通过该项志愿服务的选拔,需要通过抽签的方式决定最终的人选,现将5张写有“中签”和2张写有“未中签”字样的字条随机分配给每一位候选人,记男生中签的人数为X,求X的分布列及均值E(X).
参考数据及公式:χ2=,n=a+b+c+d.
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
解 (1)由题意可知
20b=10a+0.45,(2a+b+0.065)×10=1,
解得a=0.005,b=0.025,
所以平均值为50×0.05+60×0.25+70×0.45+80×0.2+90×0.05=69.5,
中位数为65+×10=≈69.4.
(2)补全2×2列联表:
男生 女生 合计
希望去张家口赛区 10 20 30
不希望去张家口赛区 30 20 50
合计 40 40 80
零假设为H0:参加张家口赛区志愿者服务的候选人与性别无关,根据列联表中的数据,经计算得到χ2=
≈5.333>3.841=x0.05,
所以依据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为参加张家口赛区志愿者服务的候选人与性别有关.
(3)X的所有可能取值为2,3,4,
P(X=2)==,P(X=3)==,
P(X=4)==,
所以X的分布列为
X 2 3 4
P
所以E(X)=2×+3×+4×=.
3.(2022·南京模拟)某乒乓球教练为了解某同学近期的训练效果,随机记录了该同学40局接球训练成绩,每局训练时教练连续发100个球,该同学每接球成功得1分,否则不得分,且每局训练结果相互独立,得到如图所示的频率分布直方图.
(1)同一组数据用该组区间的中点值作代表,
①求该同学40局接球训练成绩的样本平均数;
②若该同学的接球训练成绩X近似地服从正态分布N(μ,100),其中μ近似为样本平均数,求P(54≤X≤64)的值;
(2)为了提高该同学的训练兴趣,教练与他进行比赛.一局比赛中教练连续发100个球,该同学得分达到80分为获胜,否则教练获胜.若有人获胜达3局,则比赛结束,记比赛的局数为Y.以频率分布直方图中该同学获胜的频率作为概率,求均值E(Y).
参考数据:若随机变量ξ~N(μ,σ2),则P(μ-σ≤ξ≤μ+σ)≈0.682 7,P(μ-2σ≤ξ≤μ+2σ)≈ 0.954 5,P(μ-3σ≤ξ≤μ+3σ)≈0.997 3.
解 (1)①由频率分布直方图可得
=55×0.1+65×0.2+75×0.45+85×0.2+95×0.05=74.
②由题意可知μ=74,σ=10,
则54=μ-2σ,64=μ-σ,
所以P(54≤X≤64)=P(μ-2σ≤X≤μ-σ)=≈0.135 9.
(2)由频率分布直方图可知,在一局中,该同学得分达到80分的概率为(0.02+0.005)×10=,
由题意可知,随机变量Y的所有可能取值为3,4,5,
P(Y=3)=3+3=,
P(Y=4)=C·2×+C×2×
=,
P(Y=5)=C×2×2+C×2×2=,
所以随机变量Y的分布列为
Y 3 4 5
P
因此,E(Y)=3×+4×+5×=.
4.(2022·福州模拟)某种病菌在某地区人群中的带菌率为10%,目前临床医学研究中已有费用昂贵但能准确检测出个体是否带菌的方法.现引进操作易、成本低的新型检测方法:每次只需检测x,y两项指标,若指标x的值大于4且指标y的值大于100,则检验结果呈阳性,否则呈阴性.为考查该检测方法的准确度,随机抽取50位带菌者(用“*”表示)和50位不带菌者(用“+”表示)各做1次检测,他们检测后的数据,制成如下统计图:
(1)从这100名被检测者中,随机抽取一名不带菌者,求检测结果呈阳性的概率;
(2)依据小概率值α=0.001的独立性检验,能否认为“带菌”与“检测结果呈阳性”有关?
(3)现用新型检测方法,对该地区人群进行全员检测,用频率估计概率,求每个被检者“带菌”且“检测结果呈阳性”的概率.
附:χ2=,n=a+b+c+d.
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
解 (1)方法一 设A=“从这100名被检测者中,随机抽取一名不带菌者,检测结果呈阳性”,根据统计图可知在不带菌者中,检测结果呈阳性的有5人,所以P(A)==.
方法二 设A=“从这100名被检测者中,随机抽取一名为不带菌者”,D=“从这100名被检测者中,随机抽取一名检测结果呈阳性”,
则“从这100名被检测者中,随机抽取一名不带菌者,检测结果呈阳性”的概率就是“在事件A发生的条件下,事件D发生”的概率,记为P(D|A).
根据题意,P(A)=,P(AD)=,
利用条件概率公式,
得P(D|A)===.
(2)零假设为H0:“带菌”与“检测结果呈阳性”无关,可作出2×2列联表如下:
阳性 阴性 合计
带菌 35 15 50
不带菌 5 45 50
合计 40 60 100
根据列联表中的数据,经计算得到
χ2==37.5>10.828
=x0.001,
所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为“带菌”与“检测结果呈阳性”有关.
(3)设B=“被检测者带菌”,C=“被检测者检测结果呈阳性”,
则BC=“被检者‘带菌’且‘检测结果呈阳性’”,
用频率估计概率,根据题意可知
P(B)=0.1,P(C|B)==0.7,
所以由条件概率公式可知P(BC)=P(B)·P(C|B)=0.1×0.7=0.07.

展开更多......

收起↑

资源预览