培优课 概率与统计的综合问题(课件 学案 练习,共3份) 北师大版(2019)选择性必修 第一册 第七章

资源下载
  1. 二一教育资源

培优课 概率与统计的综合问题(课件 学案 练习,共3份) 北师大版(2019)选择性必修 第一册 第七章

资源简介

第七章 课时精练70 概率与统计的综合问题
(分值:90分)
1.(15分)网购是当前民众购物的新方式,某公司为改进营销方式,随机调查了100名市民,统计其周平均网购的次数,并整理得到如图所示的频数分布直方图.这100名市民中,年龄不超过40岁的有65人,将所抽样本中周平均网购次数不小于4的市民称为网购迷,且已知其中有5名市民的年龄超过40岁.
(1)根据已知条件完成下面的2×2列联表,是否有90%的把握认为网购迷与年龄不超过40岁有关
年龄 网购迷 总计
网购迷 非网购迷
不超过40岁
超过40岁
总计
(2)从网购迷中任意选取2名,求其中年龄超过40岁的市民人数ξ的分布列.
2.(15分)为了解企业职工对工会工作满意度情况之间的关系,某企业工会按性别采用分层随机抽样的方法,从全体企业职工中抽取容量为200的样本进行调查.被抽中的职工分别对工会工作进行评分,满分为100分.调查结果显示:最低分为40分,最高分为90分.随后,企业工会将男、女职工的评分结果按照相同的分组方式分别整理成了频数分布表和频率分布直方图如下:
女职工评分结果的频率分布直方图
男职工评分结果的频数分布表
分数区间 频数
[40,50) 3
[50,60) 3
[60,70) 16
[70,80) 38
[80,90] 20
为了便于研究,工会将职工对工会工作的评分转换成了“满意度情况”,二者的对应关系如下:
分数 [40,50) [50,60) [60,70) [70,80) [80,90]
满意度情况 不满意 一般 比较满意 满意 非常满意
(1)求m的值;
(2)为进一步改善工会工作,让职工满意,从评分[40,60)的男职工中随机抽取2人进行座谈,记这2人中对工会工作满意度“一般”的人数为X,求X的分布列与数学期望;
(3)以调查结果的频率估计概率,从该企业所有职工中随机抽取一名职工,求其对工会工作“比较满意”的概率.
3.(15分)某省举办线上万人健步活动,希望带动更多的人参与到全民健身中来.为了解群众参与健步走活动的情况,随机从参与活动的某支队伍中抽取了60人,将他们的年龄分成7段:[10,20),[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.
(1)以各组的区间中点值代表各组取值的平均水平,求这60人年龄的平均数;
(2)若从样本中年龄在[50,70)内的居民中任取3人,这3人中年龄不低于60岁的人数为X,求X的分布列及数学期望;
(3)一支200人的队伍,男性占其中的,40岁以下的男性和女性人数分别为30和70,请补充完整2×2列联表,并通过计算判断是否有95%的把握认为40岁以下的群众是否参与健步走活动与性别有关.
性别 年龄 总计
40岁以下 40岁以上
男性 30
女性 70
总计 200
4.(15分)中国北斗卫星导航系统是中国自行研制的全球卫星导航系统,作为国家战略性空间基础设施,我国北斗卫星导航系统不仅对国防安全意义重大,而且在民用领域的精准化应用也越来越广泛.从全球应用北斗卫星的城市中选取了40个城市进行调研,下图是这40个城市北斗卫星导航系统与位置服务产业的产值(单位:万元)的频率分布直方图.
(1)根据频率分布直方图,求产值小于600万元的调研城市个数;
(2)在上述抽取的40个城市中任取2个,设Y为产值不超过600万元的城市个数,求Y的分布列及期望和方差.
(3)把频率视为概率,从全球应用北斗卫星的城市中任取5个城市,求恰有3个城市的产值超过605万元的概率.
5.(15分)近年来,大学生就业压力日益严峻,伴随着政府政策的引导与社会观念的转变,大学生的创业意识及就业方向也悄然发生转变.在国家提供税收、担保贷款等多方面的政策扶持下,某大学生选择加盟某专营店自主创业,该专营店统计了近五年来的创收利润Y(单位:万元)与时间T(单位:年)的相关数据,列表如下:
T 1 2 3 4 5
Y 2.4 2.7 4.1 6.4 7.9
(1)依据表中给出的数据,是否可用线性回归模型拟合Y与T的关系 请计算相关系数r并加以说明(计算结果精确到0.01,若|r|>0.8,则认为Y与T高度相关,可用线性回归模型拟合Y与T的关系).
附:相关系数
r=

参考数据:≈7.547,tiyi=85.2,
=,=.
(2)专营店为吸引顾客,特推出两种促销方案:
方案一:每消费满500元可减50元;
方案二:每消费满500元可抽奖一次,每次中奖的概率都为,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.
某位顾客购买了2 000元的产品.作为专营店老板,是希望该顾客选择直接返还现金,还是选择参加四次抽奖 请说明理由.
6.(15分)近年来,手机行业的竞争已经进入白热化阶段,各大品牌手机除了靠不断提高手机的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀升,用“烧钱”来形容毫不为过.小明对某品牌手机近5年的广告费投入(单位:亿美元)进行了统计,具体数据见下表.
年份代号X 1 2 3 4 5
广告费投入Y 5.8 6.6 7.2 8.8 9.6
并随机调查了300名市民对该品牌手机的喜爱情况,得到的部分数据见下表
年龄 喜爱情况 总计
喜欢 不喜欢
50岁以下市民 50
50岁以上市民 60 40
总计
(1)求广告费投入Y关于年份代号X的线性回归方程;
(2)是否有99%的把握认为市民的年龄与对该品牌手机的喜爱度具有相关性
(3)若以这300名市民的年龄与对该品牌手机的喜爱度的情况估计整体情况,则从这300名市民中随机选取3人,记选到喜欢该品牌手机且50岁以上的市民人数为Z.求Z的分布列及数学期望EZ.
附:①回归直线中Y=,
=,=-;
②χ2=,其中n=a+b+c+d.
课时精练70 概率与统计的综合问题
1.解 (1)由题意可得列联表如下:
年龄 网购迷 总计
网购迷 非网购迷
不超过40岁 20 45 65
超过40岁 5 30 35
总计 25 75 100
根据列联表中的数据,可得
χ2=≈3.297>2.706,
所以有90%的把握认为网购迷与年龄不超过40岁有关.
(2)由频数分布直方图,可知网购迷共有25名.
由题意得,从网购迷中任选2名,年龄超过40岁的市民人数ξ的所有取值为0,1,2,
则P(ξ=0)=,
P(ξ=1)=,
P(ξ=2)=,
所以ξ的分布列为
ξ 0 1 2
P
2.解 (1)因为(0.005+m+0.020+0.040+0.020)×10=1,所以m=0.015.
(2)依题意,随机变量X的所有可能取值为0,1,2.
则P(X=0)=,
P(X=1)=,
P(X=2)=.
所以随机变量X的分布列为:
X 0 1 2
P
EX=0×=1.
(3)设事件M表示随机抽取一名职工,对工会工作服务“比较满意”.
因为样本人数200人,其中男职工共有80人,
所以样本中女职工共有120人.
由频率分布直方图可知,女职工对工会工作服务“比较满意”的人数共有120×0.020×10=24(人).
由频数分布表,可知男职工对工会工作“比较满意”的共有16人,
所以随机抽取一名职工,对工会工作“比较满意”的概率为P(M)=.
3.解 (1)这60人年龄的平均数为15×0.15+25×0.2+35×0.3+45×0.15+55×0.1+65×0.05+75×0.05=37.
(2)由题意可知,年龄在[50,60)内的人数为6,在[60,70)内的人数为3,X的可能取值为0,1,2,3.
P(X=0)=,
P(X=1)=,
P(X=2)=,
P(X=3)=,
∴X的分布列为
X 0 1 2 3
P
所以X的数学期望EX=0×=1.
(3)由题意知队伍中男性有75人,女性有125人,则2×2列联表如下:
性别 年龄 总计
40岁以下 40岁以上
男性 30 45 75
女性 70 55 125
总计 100 100 200
因此χ2==4.8.
∵4.8>3.841,
∴有95%的把握认为40岁以下的群众是否参与健步走活动与性别有关.
4.解 (1)由频率分布直方图可知产值小于600万元的频率为(0.03+0.04)×5=0.35,
所以产值小于600万元的调研城市个数为40×0.35=14(个).
(2)由(1)得产值不超过600万元的调研城市有14个,超过600万元的调研城市有40-14=26(个),
所以随机变量Y的取值可能为0,1,2,
所以P(Y=0)=,
P(Y=1)=,
P(Y=2)=,
所以可得分布列
Y 0 1 2
P
EY=0×,
DY=.
(3)由频率分布直方图可知城市的产值超过605万元的概率为(0.05+0.01)×5=0.3,
设任取5个城市中城市的产值超过605万元的城市个数为X,
可知随机变量X满足X~B(5,0.3),
所以P(X=3)=×0.33×(1-0.3)2=0.132 3.
5.解 (1)由题知,×(1+2+3+4+5)=3,
×(2.4+2.7+4.1+6.4+7.9)=4.7,
tiyi=85.2,=,
=,
则r=
=
≈≈0.97,
∵0.97>0.8,
∴Y与T高度相关,可用线性回归模型拟合.
(2)专营店老板希望该顾客选择参加四次抽奖.
理由如下:用X表示顾客在四次抽奖中中奖的次数,
∵顾客每次抽奖的结果相互独立,
∴X~B,
∴E(X)=4×=1.6.
由于顾客每中一次奖就可获得100元现金奖励,
因此顾客在四次抽奖中可获得的现金奖励的期望为1.6×100=160(元).
∵160<4×50=200,
∴专营店老板希望该顾客选择参加四次抽奖.
6.解 (1)依题意知
×(1+2+3+4+5)=3,
(5.8+6.6+7.2+8.8+9.6)=7.6,
所以2=4+1+0+1+4=10,
=9.8,
于是===0.98,
所以=7.6-0.98×3=4.66,
故广告费投入Y关于年份代号X的线性回归方程为Y=0.98X+4.66.
(2)补充完整的2×2列联表如下
年龄 喜爱情况 总计
喜欢 不喜欢
50岁以下市民 150 50 200
50岁以上市民 60 40 100
总计 210 90 300
所以χ2=
=≈7.143>6.635,
故有99%的把握认为市民的年龄与对该品牌手机的喜爱度具有相关性.
(3)依题意知随机变量Z的可能取值为0,1,2,3.
从这300名市民中随机抽取1人,是喜欢该品牌手机且50岁以上的市民的概率为,
所以P(Z=0)=,
P(Z=1)=··=,
P(Z=2)=··=,
P(Z=3)=·=,
故Z的分布列如下:
Z 0 1 2 3
P
因为Z~B,所以EZ=3×=.培优课 概率与统计的综合问题
课标要求 1.理解频率分布直方图、回归分析以及独立性检验的相关知识; 2.掌握二项分布、超几何分布以及正态分布的相关结论; 3.会应用概率统计的相关知识解决概率统计的交汇问题.
一、统计图表与概率的交汇问题
例1 为了解游客对“十一”小长假的旅游情况是否满意,某旅行社从年龄(单位:岁)在[22,52]内的游客中随机抽取了1 000人,并且作出了各个年龄段的频率分布直方图如图所示,同时对这1 000人的旅游结果满意情况进行统计得到下表:
分组 满意的人数 占本组的频率
[22,27) 30 0.6
[27,32) n 0.95
[32,37) 120 0.8
[37,42) 432 m
[42,47) 144 0.96
[47,52] 96 0.96
(1)求统计表中m和n的值;




(2)从年龄在[42,52]内且对旅游结果满意的游客中,采用分层随机抽样的方法抽取10人,再从抽取的10人中随机抽取4人做进一步调查,记4人中年龄在[47,52]内的人数为X,求X的分布列和均值.




思维升华 此类型考题重点考查了超几何分布、二项分布以及正态分布的概率运算及分布列的求解,同时也渗透了频率分布直方图的相关知识,难度中等.
训练1 “过大年,吃水饺”是我国不少地方过春节的一大习俗,2024年春节前夕,A市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,检测结果的频率分布直方图如图所示.
(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数(同一组中的数据用该组区间的中点值作代表);
(2)①由频率分布直方图可以认为,速冻水饺的该项质量指标值Z服从正态分布N(μ,σ2),利用该正态分布,求Z落在(38.45,50.4]内的概率;
②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中该项质量指标值位于(10,30]内的包数为X,求X的分布列、数学期望及方差.
附:①计算得所抽查的这100包速冻水饺的该项质量指标值的标准差为σ=≈11.95;
②若Z~N(μ,σ2),则P(μ-σ



二、回归分析与概率的交汇问题
例2 数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2019~2023年中国在线直播用户规模(单位:亿人),其中2019年~2023年对应的代码依次为1~5.
年份代码X 1 2 3 4 5
市场规模Y 3.98 4.56 5.04 5.86 6.36
参考数据:=5.16,=1.68,viyi=45.10,其中vi=.
参考公式:对于一组数据(v1,y1),(v2,y2),…,(vn,yn),其回归直线Y=V+的斜率和截距的最小二乘估计公式分别为==-.
(1)由上表数据可知,可用函数模型Y=+拟合Y与X的关系,请建立Y关于X的回归方程(的值精确到0.01);
(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p,现从中国在线直播购物用户中随机抽取4人,记这4人中选择在品牌官方直播间购物的人数为Z,若P(Z=3)=P(Z=4),求Z的分布列与期望.




思维升华 此类题型重点考查回归方程以及相关系数的求解,常与概率统计知识结合考查,核心素养方面重点考查数学运算、数据分析和直观想象等.
训练2 “支付宝捐步”已经成为当下最热门的健身方式之一.55岁的老王在了解了捐步功能以后开启了自己的捐步计划,可知其在捐步的前5天,捐步的步数与天数呈线性相关.
第X天 第1天 第2天 第3天 第4天 第5天
步数Y 4 000 4 200 4 300 5 000 5 500
(1)根据上表数据,建立Y关于X的线性回归方程Y=X+;
(2)记由(1)中线性回归方程得到的预测步数为Y',若从5天中任取3天,记Y'附:=,=-.




三、独立性检验与概率的交汇问题
例3 为了研究家用轿车在高速公路上的车速情况,交通部门对100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况:在55名男性驾驶员中,平均车速超过100 km/h的有40人,不超过100 km/h的有15人;在45名女性驾驶员中,平均车速超过100 km/h的有20人,不超过100 km/h的有25人.
(1)完成下面的列联表,并判断是否有99%的把握认为车速与性别有关;
性别 车速 总计
平均车速超过 100 km/h 平均车速不超过 100 km/h
男性
女性
总计
(2)用上述数据样本来估计总体,现从高速公路上行驶的大量家用轿车中随机抽取3辆,记这3辆车中驾驶员为男性且车速超过100 km/h的车辆数为X,若每次抽取的结果是相互独立的,求X的分布列和数学期望.




思维升华 此类题型以2×2列联表为载体,考查独立性检验与概率中的二项分布、超几何分布以及正态分布的交汇知识,是高考的常考知识点,核心素养方面考查数学运算、数据分析以及直观想象等.
训练3 从石墨中分离石墨烯的一种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶.现在有A材料、B材料可供选择,研究人员对附着在A材料、B材料上的石墨各做了50次再结晶试验,得到如下等高堆积条形图.
(1)根据等高堆积条形图填写如下列联表,试问:试验结果与材料是否有关
试验结果 材料 总计
A B
成功
不成功
总计




(2)研究人员得到石墨烯后,再制作石墨烯发热膜有三个环节:①透明基底及UV胶层;②石墨烯层;③表面封装层.第一、二环节生产合格的概率均为,第三环节生产合格的概率为,且各生产环节相互独立.已知生产1吨石墨烯发热膜的固定成本为1万元,若生产不合格还需进行修复,第三环节的修复费用为3 000元,其余环节的修复费用均为1 000元.试问:如何定价,才能实现每生产1吨石墨烯发热膜获利可达1万元以上的目标




培优课 概率与统计的综合问题
例1 解 (1)根据题意可得,年龄在[37,42)内的频率为1-(0.01+0.02×2+0.03×2)×5=0.45,
故年龄在[37,42)内的人数为450,
则m==0.96,
年龄在[27,32)内的人数为1 000×0.02×5=100,
故n=100×0.95=95.
(2)因为年龄在[42,47)内且满意的人数为144,年龄在[47,52)内且满意的人数为96,因此采用分层随机抽样的方法抽取的10人中,年龄在[42,47)内且满意的人数与年龄在[47,52]内且满意的人数分别为6,4.
依题意可得X=0,1,2,3,4.
P(X=0)=;
P(X=1)=;
P(X=2)=;
P(X=3)=;
P(X=4)=;
X的分布列为
X 0 1 2 3 4
P
法一 EX=0×.
法二 因X服从参数N=10,M=4,n=4的超几何分布,故EX=.
训练1 解 根据频率分布直方图可得:
(0,10]的频率为0.010×10=0.1,
(10,20]的频率为0.020×10=0.2,
(20,30]的频率为0.030×10=0.3,
(30,40]的频率为0.025×10=0.25,
(40,50]的频率为0.015×10=0.15,
∴所抽取的100包速冻水饺该项质量指标值的样本平均数=5×0.1+15×0.2+25×0.3+35×0.25+45×0.15=26.5.
(2)①∵Z服从正态分布N(μ,σ2),且μ=26.5,
σ≈11.95,∴P(38.45=P(26.5-2×11.95≈×0.682 6=0.135 9.
∴Z落在(38.45,50.4]内的概率是0.135 9.
②根据题意得每包速冻水饺的该项质量指标值位于(10,30]内的概率为0.2+0.3=0.5,
∴X~B,X的可能取值为0,1,2,3,4.
P(X=0)=,
P(X=1)=,
P(X=2)=,
P(X=3)=,
P(X=4)=,
∴X的分布列为
X 0 1 2 3 4
P
EX=4×=2,DX=4×=1.
例2 解 (1)设V=,则Y=,
因为=5.16,=1.68,v=xi=15,
所以===≈1.98.
把(1.68,5.16)代入Y=,得
=5.16-1.98×1.68≈1.83.
即Y关于X的回归方程为Y=1.98+1.83.
(2)由题意知Z~B(4,p),
P(Z=3)=p3(1-p)=4p3(1-p),
P(Z=4)=p4=p4,
由4p3(1-p)=p4得p=,
所以Z的取值依次为0,1,2,3,4,
P(Z=0)=,
P(Z=1)=,
P(Z=2)=,
P(Z=3)=,
P(Z=4)=,
所以Z的分布列为
Z 0 1 2 3 4
P
EZ=4×.
训练2 解 (1)=3,
=4 600,
xiyi=1×4 000+2×4 200+3×4 300+4×5 000+5×5 500=72 800,
=12+22+32+42+52=55,
故==
==380,
=3 460.
所以Y关于X的线性回归方程为Y=380X+3 460.
(2)把X=1,2,3,4,5分别代入线性回归方程中,求出每天的预测步数,如下表:
第X天 第1天 第2天 第3天 第4天 第5天
步数Y 4 000 4 200 4 300 5 000 5 500
预测步数Y' 3 840 4 220 4 600 4 980 5 360
所以Y'P(Z=1)=,
P(Z=2)=,
P(Z=3)=,
所以Z的分布为
Z 1 2 3
P
EZ=1×.
例3 解 (1)完成列联表如下:
性别 车速 总计
平均车速超过 100 km/h 平均车速不超过 100 km/h
男性 40 15 55
女性 20 25 45
总计 60 40 100
因为χ2=≈8.249>6.635,
所以有99%的把握认为车速与性别有关.
(2)根据样本估计总体的思想,从高速公路上行驶的大量家用轿车中随机抽取1辆,驾驶员为男性且车速超过100 km/h的车辆的概率为.
X的可能取值为0,1,2,3,且X~B,
P(X=0)=,
P(X=1)=,
P(X=2)=,
P(X=3)=,
所以X的分布列为
X 0 1 2 3
P
EX=3×.
训练3 解 (1)根据题中所给等高堆积条形图得列联表如下:
试验结果 材料 总计
A B
成功 45 30 75
不成功 5 20 25
总计 50 50 100
计算可得χ2==12.
因为12>6.635,所以有99%的把握认为试验结果与材料有关.
(2)设生产1吨石墨烯发热膜所需的修复费用为X万元.易知X的可能取值为0,0.1,0.2,0.3,0.4,0.5.
P(X=0)=,
P(X=0.1)=,
P(X=0.2)=,
P(X=0.3)=,
P(X=0.4)=,
P(X=0.5)=,
即X的分布列为
X 0 0.1 0.2 0.3 0.4 0.5
P
修复费用X的期望EX=0×=0.2.
所以石墨烯发热膜的定价至少为0.2+1+1=2.2(万元/吨),才能实现预期的利润目标.(共72张PPT)
第七章
培优课 概率与统计的综合问题
课标要求
1.理解频率分布直方图、回归分析以及独立性检验的相关知识;
2.掌握二项分布、超几何分布以及正态分布的相关结论;
3.会应用概率统计的相关知识解决概率统计的交汇问题.
课时精练
一、统计图表与概率的交汇问题
二、回归分析与概率的交汇问题
三、独立性检验与概率的交汇问题
课堂达标
内容索引
统计图表与概率的交汇问题

例1
为了解游客对“十一”小长假的旅游情况是否满意,某旅行社从年龄(单位:岁)在[22,52]内的游客中随机抽取了1 000人,并且作出了各个年龄段的频率分布直方图如图所示,同时对这1 000人的旅游结果满意情况进行统计得到下表:
分组 满意的人数 占本组的频率
[22,27) 30 0.6
[27,32) n 0.95
[32,37) 120 0.8
[37,42) 432 m
[42,47) 144 0.96
[47,52] 96 0.96
(1)求统计表中m和n的值;
根据题意可得,年龄在[37,42)内的频率为1-(0.01+0.02×2+0.03×2)×5=0.45,
故年龄在[37,42)内的人数为450,
年龄在[27,32)内的人数为1 000×0.02×5=100,
故n=100×0.95=95.
(2)从年龄在[42,52]内且对旅游结果满意的游客中,采用分层随机抽样的方法抽取10人,再从抽取的10人中随机抽取4人做进一步调查,记4人中年龄在[47,52]内的人数为X,求X的分布列和均值.
因为年龄在[42,47)内且满意的人数为144,年龄在[47,52)内且满意的人数为96,因此采用分层随机抽样的方法抽取的10人中,年龄在[42,47)内且满意的人数与年龄在[47,52]内且满意的人数分别为6,4.
此类型考题重点考查了超几何分布、二项分布以及正态分布的概率运算及分布列的求解,同时也渗透了频率分布直方图的相关知识,难度中等.
思维升华
“过大年,吃水饺”是我国不少地方过春节的一大习俗,2024年春节前夕,A市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,检测结果的频率分布直方图如图所示.
训练1
(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数 (同一组中的数据用该组区间的中点值作代表);
根据频率分布直方图可得:
(0,10]的频率为0.010×10=0.1,
(10,20]的频率为0.020×10=0.2,
(20,30]的频率为0.030×10=0.3,
(30,40]的频率为0.025×10=0.25,
(40,50]的频率为0.015×10=0.15,
(2)①由频率分布直方图可以认为,速冻水饺的该项质量指标值Z服从正态分布N(μ,σ2),利用该正态分布,求Z落在(38.45,50.4]内的概率;
②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中该项质量指标值位于(10,30]内的包数为X,求X的分布列、数学期望及方差.
②若Z~N(μ,σ2),则P(μ-σ<Z≤μ+σ)≈0.682 6,P(μ-2σ<Z≤μ+2σ)≈0.954 4.
∵Z服从正态分布N(μ,σ2),且μ=26.5,
σ≈11.95,∴P(38.45<Z≤50.4)
根据题意得每包速冻水饺的该项质量指标值位于(10,30]内的概率为
0.2+0.3=0.5,
回归分析与概率的交汇问题

例2
数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2019~2023年中国在线直播用户规模(单位:亿人),其中2019年~2023年对应的代码依次为1~5.
年份代码X 1 2 3 4 5
市场规模Y 3.98 4.56 5.04 5.86 6.36
(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p,现从中国在线直播购物用户中随机抽取4人,记这4人中选择在品牌官方直播间购物的人数为Z,若P(Z=3)=P(Z=4),求Z的分布列与期望.
由题意知Z~B(4,p),
思维升华
此类题型重点考查回归方程以及相关系数的求解,常与概率统计知识结合考查,核心素养方面重点考查数学运算、数据分析和直观想象等.
“支付宝捐步”已经成为当下最热门的健身方式之一.55岁的老王在了解了捐步功能以后开启了自己的捐步计划,可知其在捐步的前5天,捐步的步数与天数呈线性相关.
训练2
第X天 第1天 第2天 第3天 第4天 第5天
步数Y 4 000 4 200 4 300 5 000 5 500
(2)记由(1)中线性回归方程得到的预测步数为Y′,若从5天中任取3天,记Y′<Y的天数为Z,求Z的分布列及数学期望.
把X=1,2,3,4,5分别代入线性回归方程中,求出每天的预测步数,如下表:
第X天 第1天 第2天 第3天 第4天 第5天
步数Y 4 000 4 200 4 300 5 000 5 500
预测步数Y′ 3 840 4 220 4 600 4 980 5 360
独立性检验与概率的交汇问题

例3
为了研究家用轿车在高速公路上的车速情况,交通部门对100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况:在55名男性驾驶员中,平均车速超过100 km/h的有40人,不超过100 km/h的有15人;在45名女性驾驶员中,平均车速超过100 km/h的有20人,不超过100 km/h的有25人.
(1)完成下面的列联表,并判断是否有99%的把握认为车速与性别有关;
性别 车速 总计
平均车速超过100 km/h 平均车速不超过100 km/h
男性
女性
总计
完成列联表如下:
性别 车速 总计
平均车速超过100 km/h 平均车速不超过100 km/h
男性 40 15 55
女性 20 25 45
总计 60 40 100
(2)用上述数据样本来估计总体,现从高速公路上行驶的大量家用轿车中随机抽取3辆,记这3辆车中驾驶员为男性且车速超过100 km/h的车辆数为X,若每次抽取的结果是相互独立的,求X的分布列和数学期望.
思维升华
此类题型以2×2列联表为载体,考查独立性检验与概率中的二项分布、超几何分布以及正态分布的交汇知识,是高考的常考知识点,核心素养方面考查数学运算、数据分析以及直观想象等.
训练3
从石墨中分离石墨烯的一种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶.现在有A材料、B材料可供选择,研究人员对附着在A材料、B材料上的石墨各做了50次再结晶试验,得到如下等高堆积条形图.
(1)根据等高堆积条形图填写如下列联表,试问:试验结果与材料是否有关?
试验结果 材料 总计
A B
成功
不成功
总计
根据题中所给等高堆积条形图得列联表如下:
试验结果 材料 总计
A B
成功 45 30 75
不成功 5 20 25
总计 50 50 100
设生产1吨石墨烯发热膜所需的修复费用为X万元.易知X的可能取值为0,0.1,0.2,0.3,0.4,0.5.
所以石墨烯发热膜的定价至少为0.2+1+1=2.2(万元/吨),才能实现预期的利润目标.
【课时精练】
1.网购是当前民众购物的新方式,某公司为改进营销方式,随机调查了100名市民,统计其周平均网购的次数,并整理得到如图所示的频数分布直方图.这100名市民中,年龄不超过40岁的有65人,将所抽样本中周平均网购次数不小于4的市民称为网购迷,且已知其中有5名市民的年龄超过40岁.
(1)根据已知条件完成下面的2×2列联表,是否有90%的把握认为网购迷与年龄不超过40岁有关?
年龄 网购迷 总计
网购迷 非网购迷
不超过40岁
超过40岁
总计
由题意可得列联表如下:
年龄 网购迷 总计
网购迷 非网购迷
不超过40岁 20 45 65
超过40岁 5 30 35
总计 25 75 100
所以有90%的把握认为网购迷与年龄不超过40岁有关.
(2)从网购迷中任意选取2名,求其中年龄超过40岁的市民人数ξ的分布列.
由频数分布直方图,可知网购迷共有25名.
由题意得,从网购迷中任选2名,年龄超过40岁的市民人数ξ的所有取值为0,1,2,
2.为了解企业职工对工会工作满意度情况之间的关系,某企业工会按性别采用分层随机抽样的方法,从全体企业职工中抽取容量为200的样本进行调查.被抽中的职工分别对工会工作进行评分,满分为100分.调查结果显示:最低分为40分,最高分为90分.随后,企业工会将男、女职工的评分结果按照相同的分组方式分别整理成了频数分布表和频率分布直方图如下:
女职工评分结果的频率分布直方图
男职工评分结果的频数分布表
分数区间 频数
[40,50) 3
[50,60) 3
[60,70) 16
[70,80) 38
[80,90] 20
为了便于研究,工会将职工对工会工作的评分转换成了“满意度情况”,二者的对应关系如下:
分数 [40,50) [50,60) [60,70) [70,80) [80,90]
满意度情况 不满意 一般 比较满意 满意 非常满意
(1)求m的值;
因为(0.005+m+0.020+0.040+0.020)×10=1,所以m=0.015.
(2)为进一步改善工会工作,让职工满意,从评分[40,60)的男职工中随机抽取2人进行座谈,记这2人中对工会工作满意度“一般”的人数为X,求X的分布列与数学期望;
依题意,随机变量X的所有可能取值为0,1,2.
(3)以调查结果的频率估计概率,从该企业所有职工中随机抽取一名职工,求其对工会工作“比较满意”的概率.
设事件M表示随机抽取一名职工,对工会工作服务“比较满意”.
因为样本人数200人,其中男职工共有80人,
所以样本中女职工共有120人.
由频率分布直方图可知,女职工对工会工作服务“比较满意”的人数共有120×0.020×10=24(人).
由频数分布表,可知男职工对工会工作“比较满意”的共有16人,
3.某省举办线上万人健步活动,希望带动更多的人参与到全民健身中来.为了解群众参与健步走活动的情况,随机从参与活动的某支队伍中抽取了60人,将他们的年龄分成7段:[10,20),[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.
(1)以各组的区间中点值代表各组取值的平均水平,求这60人年龄的平均数;
这60人年龄的平均数为15×0.15+25×0.2+35×0.3+45×0.15+55×0.1+65×0.05+75×0.05=37.
(2)若从样本中年龄在[50,70)内的居民中任取3人,这3人中年龄不低于60岁的人数为X,求X的分布列及数学期望;
由题意可知,年龄在[50,60)内的人数为6,在[60,70)内的人数为3,X的可能取值为0,1,2,3.
性别 年龄 总计
40岁以下 40岁以上
男性 30
女性 70
总计 200
由题意知队伍中男性有75人,女性有125人,则2×2列联表如下:
性别 年龄 总计
40岁以下 40岁以上
男性 30 45 75
女性 70 55 125
总计 100 100 200
∵4.8>3.841,
∴有95%的把握认为40岁以下的群众是否参与健步走活动与性别有关.
4.中国北斗卫星导航系统是中国自行研制的全球卫星导航系统,作为国家战略性空间基础设施,我国北斗卫星导航系统不仅对国防安全意义重大,而且在民用领域的精准化应用也越来越广泛.从全球应用北斗卫星的城市中选取了40个城市进行调研,下图是这40个城市北斗卫星导航系统与位置服务产业的产值(单位:万元)的频率分布直方图.
(1)根据频率分布直方图,求产值小于600万元的调研城市个数;
由频率分布直方图可知产值小于600万元的频率为(0.03+0.04)×5=0.35,
所以产值小于600万元的调研城市个数为40×0.35=14(个).
(2)在上述抽取的40个城市中任取2个,设Y为产值不超过600万元的城市个数,求Y的分布列及期望和方差.
由(1)得产值不超过600万元的调研城市有14个,超过600万元的调研城市有40-14=26(个),
所以随机变量Y的取值可能为0,1,2,
(3)把频率视为概率,从全球应用北斗卫星的城市中任取5个城市,求恰有3个城市的产值超过605万元的概率.
由频率分布直方图可知城市的产值超过605万元的概率为(0.05+0.01)×5=0.3,
设任取5个城市中城市的产值超过605万元的城市个数为X,
可知随机变量X满足X~B(5,0.3),
5.近年来,大学生就业压力日益严峻,伴随着政府政策的引导与社会观念的转变,大学生的创业意识及就业方向也悄然发生转变.在国家提供税收、担保贷款等多方面的政策扶持下,某大学生选择加盟某专营店自主创业,该专营店统计了近五年来的创收利润Y(单位:万元)与时间T(单位:年)的相关数据,列表如下:
T 1 2 3 4 5
Y 2.4 2.7 4.1 6.4 7.9
(1)依据表中给出的数据,是否可用线性回归模型拟合Y与T的关系?请计算相关系数r并加以说明(计算结果精确到0.01,若|r|>0.8,则认为Y与T高度相关,可用线性回归模型拟合Y与T的关系).
附:相关系数
∵0.97>0.8,
∴Y与T高度相关,可用线性回归模型拟合.
专营店老板希望该顾客选择参加四次抽奖.
理由如下:用X表示顾客在四次抽奖中中奖的次数,
∵顾客每次抽奖的结果相互独立,
由于顾客每中一次奖就可获得100元现金奖励,
因此顾客在四次抽奖中可获得的现金奖励的期望为1.6×100=160(元).
∵160<4×50=200,
∴专营店老板希望该顾客选择参加四次抽奖.
6.近年来,手机行业的竞争已经进入白热化阶段,各大品牌手机除了靠不断提高手机的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀升,用“烧钱”来形容毫不为过.小明对某品牌手机近5年的广告费投入(单位:亿美元)进行了统计,具体数据见下表.
年份代号X 1 2 3 4 5
广告费投入Y 5.8 6.6 7.2 8.8 9.6
并随机调查了300名市民对该品牌手机的喜爱情况,得到的部分数据见下表
年龄 喜爱情况 总计
喜欢 不喜欢
50岁以下市民 50
50岁以上市民 60 40
总计
(1)求广告费投入Y关于年份代号X的线性回归方程;
(2)是否有99%的把握认为市民的年龄与对该品牌手机的喜爱度具有相关性?
补充完整的2×2列联表如下
年龄 喜爱情况 总计
喜欢 不喜欢
50岁以下市民 150 50 200
50岁以上市民 60 40 100
总计 210 90 300
故有99%的把握认为市民的年龄与对该品牌手机的喜爱度具有相关性.
(3)若以这300名市民的年龄与对该品牌手机的喜爱度的情况估计整体情况,则从这300名市民中随机选取3人,记选到喜欢该品牌手机且50岁以上的市民人数为Z.求Z的分布列及数学期望EZ.
依题意知随机变量Z的可能取值为0,1,2,3.

展开更多......

收起↑

资源列表