第十章 第九节 概率与统计的综合问题(课件 学案 练习,共3份)2026届高中数学(人教A版)一轮复习

资源下载
  1. 二一教育资源

第十章 第九节 概率与统计的综合问题(课件 学案 练习,共3份)2026届高中数学(人教A版)一轮复习

资源简介

第九节 概率与统计的综合问题
题点一 频率分布直方图与分布列的综合
[例1] (2025·佛山模拟)随着5G网络信号的不断完善,5G手机已经成为手机销售市场的明星.某地区手机专卖商场对已售出的1 000部5G手机的价格数据进行分析得到如图所示的频率分布直方图:
(1)求5G手机价格的75%分位数;
(2)某夫妻两人到该商场准备购买价位在4 500~6 500元的手机各一部,商场工作人员应顾客的要求按照分层随机抽样的方式提供了9部手机让其从中购买两部,假定选择每部手机是等可能的,设这两人购买同一价位区间的手机的数量为X,求E(X).
|思维建模|
  高考常将求概率与等可能事件、互斥事件、相互独立事件、超几何分布、二项分布、频率分布直方图等交汇在一起进行考查,因此在解答此类题时,准确把题中所涉及的事件进行分解,明确所求问题所属的事件类型是关键.特别是要注意挖掘题目中的隐含条件.
[即时训练]
1.(2024·成都三模)某保险公司为了给年龄在20~70岁的民众提供某种疾病的医疗保障,设计了一款针对该疾病的保险,现从10 000名参保人员中随机抽取100名进行分析,这100个样本按年龄段[20,30),[30,40),[40,50),[50,60),[60,70]分成了五组,其频率分布直方图如图所示,每人每年所交纳的保费与参保年龄如表格所示(保费:元).据统计,该公司每年为该项保险支出的各种费用为一百万元.
年龄 [20,30) [30,40) [40,50) [50,60) [60,70]
保费 x 2x 3x 4x 5x
(1)用样本的频率分布估计总体的概率分布,为使公司不亏本,则保费x至少为多少元 (精确到整数)
(2)随着年龄的增加,该疾病患病的概率越来越大,经调查,年龄在[50,60)的老人中每15人就有1人患该项疾病,年龄在[60,70]的老人中每10人就有1人患该项疾病,现分别从年龄在[50,60)和[60,70]的老人中各随机选取1人,记X表示选取的这2人中患该疾病的人数,求X的数学期望.
题点二 概率与回归模型的综合
[例2] (2025·重庆期中)统计显示,我国在线直播生活购物用户规模近几年保持高速增长态势,下表为2019~2023年我国在线直播生活购物用户规模(单位:亿人),其中2019~2023年对应的代码依次为1~5.
年份代码/x 1 2 3 4 5
市场规模/y 3.98 4.56 5.04 5.86 6.36
(1)由上表数据可知,若用函数模型=+拟合y与x的关系,请估计2027年我国在线直播生活购物用户的规模;(结果精确到0.01)
(2)已知我国在线直播生活购物用户选择在品牌官方直播间购物的概率为p,现从我国在线直播购物用户中随机抽取5人,记这5人中选择在品牌官方直播间购物的人数为X,若P(X=5)=P(X=4),求X的均值和方差.
参考数据:=5.16,≈1.68, viyi≈45.10,其中vi=.
参考公式:对于一组数据(v1,y1),(v2,y2),…,(vn,yn),其经验回归直线=v+的斜率和截距的最小二乘估计公式分别为=, =-.
[即时训练]
2.近年来,国内掀起了全民新中式热潮,新中式穿搭、新中式茶饮、新中式快餐、新中式烘焙等.以下为某纺织厂生产“新中式”面料近5个月的利润y(万元)的统计表.
月份 2023.11 2023.12 2024.01 2024.02 2024.03
月份 编号/x 1 2 3 4 5
利润/y (万元) 27 23 20 17 13
(1)根据统计表,试求y与x之间的样本相关系数r(精确到0.001),并利用r说明y与x是否具有较强的线性相关关系;(若|r|>0.75,则认为两个变量具有较强的线性相关关系)
(2)该纺织厂现有甲、乙两条流水线生产同一种产品,为对产品质量进行监控,质检人员先用简单随机抽样的方法从甲、乙两条流水线上分别抽取了4件、2件产品进行初检,再从中随机选取3件做进一步的质检,记抽到“甲流水线产品”的件数为X,试求X的分布列与均值.
参考数据:≈34.06.
题点三 概率与独立性检验的综合
[例3] (2025·广州模拟)为了研究高三年级学生的性别和身高是否大于170 cm的关联性,随机调查了某中学部分高三年级的学生,整理得到如下列联表(单位:人):
性别 身高 合计
低于170 cm 不低于170 cm
女 19 5 24
男 6 10 16
合计 25 15 40
(1)依据α=0.01的独立性检验,能否认为该中学高三年级学生的性别与身高有关联
(2)从身高不低于170 cm的15名学生中随机抽取三名学生,设抽取的三名学生中女生人数为X,求X的分布列及E(X).
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
[即时训练]
3.某医疗科研小组为研究某市市民患有疾病A与是否具有生活习惯B的关系,从该市市民中随机抽查了100人,得到如下数据:
疾病A 生活习惯B
具有 不具有
患病 25 15
未患病 20 40
(1)依据α=0.01的独立性检验,能否认为该市市民患有疾病A与是否具有生活习惯B有关
(2)从该市市民中任选一人,M表示事件“选到的人不具有生活习惯B”,N表示事件“选到的人患有疾病A”,试利用该调查数据,给出P(|)的估计值;
(3)从该市市民中任选3人,记这3人中具有生活习惯B,且未患有疾病A的人数为X,试利用该调查数据,求X的均值.
附:χ2=,其中n=a+b+c+d.
α 0.10 0.05 0.010 0.001
xα 2.706 3.841 6.635 10.828
第九节 概率与统计的综合问题
题点一
[例1] 解:(1)由频率分布直方图可得(0.045+2a+0.01+0.005)×10=1,解得a=0.02.
因为5G手机的价格在1 500~4 500元的频率为(0.005+0.02+0.045)×10=0.7,
而价格在4 500~5 500元的频率为0.02×10=0.2,
故5G手机价格的75%分位数应该在4 500~5 500元这一组,且75%分位数为×100=4 750元.
(2)因为购买价位在4 500~5 500元和5 500~6 500元的手机占的比率分别为0.2和0.1,
故按照分层随机抽样的方式在4 500~5 500元这一价位选取了6部,在5 500~6 500元这一价位选取了3部,这两人购买同一价位的手机数量X的可能值有0,2.
则P(X=0)==,P(X=2)==,
X的分布列为
X 0 2
P
故E(X)=0×+2×=1.
[即时训练]
1.快审准解:(1)根据小矩形面积的和为1得到关于a的方程,解出a的值,再列出不等式,解出即可;
(2)首先分析出X的取值为0,1,2,再列出对应概率值,利用期望公式计算即可.
解:(1)(0.007+0.016+a+0.025+0.02)×10=1,
解得a=0.032,
保险公司每年收取的保费为
10 000×(0.07x+0.16×2x+0.32×3x+0.25×4x+0.2×5x)=10 000×3.35x,
所以要使公司不亏本,
则10 000×3.35x≥1 000 000,即3.35x≥100,
解得x≥≈30,即保费至少为30元.
(2)由题意知X的取值为0,1,2,
P(X=0)=×==,
P(X=1)=×+×=,
P(X=2)=×=,
所以X的分布列为
X 0 1 2
P
所以E(X)=0×+1×+2×==.
题点二
[例2] 解:(1)设v=,则=v+,
因为=5.16,≈1.68,=xi=15,
所以===≈1.98.
把(1.68,5.16)代入=-,
得=5.16-1.98×1.68≈1.83.
所以y关于x的回归方程为=1.98+1.83.
由题意知2027年对应的代码为9,所以2027年我国在线直播生活购物用户的规模=1.98×3+1.83=7.77亿人.
(2)由题意知X~B(5,p),P(X=5)=p5(1-p)0=p5,
P(X=4)=p4(1-p)1=5p4(1-p),
由p5=5p4(1-p),得p=,
所以E(X)=5×=,D(X)=5××=.
[即时训练]
2.解:(1)∵=×(1+2+3+4+5)=3,
=×(27+23+20+17+13)=20, (xi-)2=10,
(yi-)2=116, (xi-)(yi-)=-34,r=
=≈≈-0.998.
又|r|=0.998>0.75,
所以可以说明y与x具有较强的线性相关关系.
(2)X的可能取值有1,2,3,
因为P(X=1)==,P(X=2)==,P(X=3)==,
所以X的分布列为
X 1 2 3
P
E(X)=1×+2×+3×=2.
题点三
[例3] 解:(1)零假设为H0:该中学高三年级学生的性别与身高无关联,根据列联表中的数据,经计算得到χ2=≈7.111>6.635=x0.01,
根据小概率值α=0.01的独立性检验,推断H0不成立,即认为该中学高三年级学生的性别与身高有关联,此推断犯错误的概率不大于0.01.
(2)依题意,X的取值可能为0,1,2,3,
则P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==.
则X的分布列为
X 0 1 2 3
P
故E(X)=0×+1×+2×+3×=1.
[即时训练]
3.解:(1)由已知得列联表如下:
疾病A 生活习惯B 合计
具有 不具有
患病 25 15 40
未患病 20 40 60
合计 45 55 100
零假设为H0:该市市民患有疾病A与是否具有生活习惯B无关.
根据列联表中的数据,经计算得到
χ2==≈8.249>6.635=x0.01.
依据α=0.01的独立性检验,推断H0不成立,即认为该市市民患有疾病A与是否具有生活习惯B有关,此推断犯错误的概率不大于0.01.
(2)由(1)数据可得
P()==,P()==,
所以P(|)===.
(3)由题意知可用B估计X的分布,
所以E(X)=np=3×=.(共51张PPT)
第九节
概率与统计的综合问题
目录
01.题点一 频率分布直方图与分布列的综合
02.题点二 概率与回归模型的综合
04.课时跟踪检测
03.题点三 概率与独立性检验的综合
[例1] (2025·佛山模拟)随着5G网络信号的不断完善,5G手机已经成为手机销售市场的明星.某地区手机专卖商场对已售出的1 000部5G手机的价格数据进行分析得到如图所示的频率分布直方图:
题点一 频率分布直方图与分布列的综合
(1)求5G手机价格的75%分位数;
解:由频率分布直方图可得(0.045+2a+0.01+0.005)×10=1,解得a=0.02.
因为5G手机的价格在1 500~4 500元的频率为
(0.005+0.02+0.045)×10=0.7,
而价格在4 500~5 500元的频率为0.02×10=0.2,
故5G手机价格的75%分位数应该在4 500~5 500元这一组,且75%分位数为×100=4 750元.
(2)某夫妻两人到该商场准备购买价位在4 500~6 500元的手机各一部,商场工作人员应顾客的要求按照分层随机抽样的方式提供了9部手机让其从中购买两部,假定选择每部手机是等可能的,设这两人购买同一价位区间的手机的数量为X,求E(X).
解:因为购买价位在4 500~5 500元和5 500~6 500元的手机占的比率分别为0.2和0.1,
故按照分层随机抽样的方式在4 500~5 500元这一价位选取了6部,在5 500~6 500元这一价位选取了3部,这两人购买同一价位的手机数量X的可能值有0,2.
则P(X=0)==,P(X=2)==,
X的分布列为
故E(X)=0×+2×=1.
X 0 2
P
高考常将求概率与等可能事件、互斥事件、相互独立事件、超几何分布、二项分布、频率分布直方图等交汇在一起进行考查,因此在解答此类题时,准确把题中所涉及的事件进行分解,明确所求问题所属的事件类型是关键.特别是要注意挖掘题目中的隐含条件.
思维建模
1.(2024·成都三模)某保险公司为了给年龄在20~70岁的民众提供某种疾病的医疗保障,设计了一款针对该疾病的保险,现从10 000名参保人员中随机抽取100名进行分析,这100个样本按年龄段[20,30),[30,40),[40,50),[50,60),[60,70]分成了
五组,其频率分布直方图如图所示,每人每年
所交纳的保费与参保年龄如表格所示(保费:元).
据统计,该公司每年为该项保险支出的各种费
用为一百万元.
即时训练
年龄 [20,30) [30,40) [40,50) [50,60) [60,70]
保费 x 2x 3x 4x 5x
(1)用样本的频率分布估计总体的概率分布,为使公司不亏本,则保费x至少为多少元 (精确到整数)
快审准解:根据小矩形面积的和为1得到关于a的方程,解出a的值,再列出不等式,解出即可;
解: (0.007+0.016+a+0.025+0.02)×10=1,解得a=0.032,
保险公司每年收取的保费为
10 000×(0.07x+0.16×2x+0.32×3x+0.25×4x+0.2×5x)
=10 000×3.35x,所以要使公司不亏本,
则10 000×3.35x≥1 000 000,即3.35x≥100,
解得x≥≈30,即保费至少为30元.
(2)随着年龄的增加,该疾病患病的概率越来越大,经调查,年龄在[50,60)的老人中每15人就有1人患该项疾病,年龄在[60,70]的老人中每10人就有1人患该项疾病,现分别从年龄在[50,60)和[60,70]的老人中各随机选取1人,记X表示选取的这2人中患该疾病的人数,求X的数学期望.
快审准解:首先分析出X的取值为0,1,2,再列出对应概率值,利用期望公式计算即可.
解:由题意知X的取值为0,1,2,
P(X=0)=×==,P(X=1)=×+×=,
P(X=2)=×=,所以X的分布列为
所以E(X)=0×+1×+2×==.
X 0 1 2
P
[例2] (2025·重庆期中)统计显示,我国在线直播生活购物用户规模近几年保持高速增长态势,下表为2019~2023年我国在线直播生活购物用户规模(单位:亿人),其中2019~2023年对应的代码依次为1~5.
(1)由上表数据可知,若用函数模型=+拟合y与x的关系,请估计2027年我国在线直播生活购物用户的规模;(结果精确到0.01)
题点二 概率与回归模型的综合
年份代码/x 1 2 3 4 5
市场规模/y 3.98 4.56 5.04 5.86 6.36
解:设v=,则=v+,因为=5.16,≈1.68, = xi=15,
所以 ==≈1.98.
把(1.68,5.16)代入=-,得=5.16-1.98×1.68≈1.83.
所以y关于x的回归方程为=1.98+1.83.
由题意知2027年对应的代码为9,所以2027年我国在线直播生活购物用户的规模=1.98×3+1.83=7.77亿人.
(2)已知我国在线直播生活购物用户选择在品牌官方直播间购物的概率为p,现从我国在线直播购物用户中随机抽取5人,记这5人中选择在品牌官方直播间购物的人数为X,若P(X=5)=P(X=4),求X的均值和方差.
参考数据:=5.16,≈1.68, viyi≈45.10,其中vi=.
参考公式:对于一组数据(v1,y1),(v2,y2),…,(vn,yn),其经验回归直线=v+的斜率和截距的最小二乘估计公式分别为= , =-.
解:由题意知X~B(5,p),
P(X=5)=p5(1-p)0=p5,
P(X=4)=p4(1-p)1=5p4(1-p),
由p5=5p4(1-p),得p=,
所以E(X)=5×=,D(X)=5××=.
2.近年来,国内掀起了全民新中式热潮,新中式穿搭、新中式茶饮、新中式快餐、新中式烘焙等.以下为某纺织厂生产“新中式”面料近5个月的利润y(万元)的统计表.
即时训练
月份 2023.11 2023.12 2024.01 2024.02 2024.03
月份编号/x 1 2 3 4 5
利润/y(万元) 27 23 20 17 13
(1)根据统计表,试求y与x之间的样本相关系数r(精确到0.001),并利用r说明y与x是否具有较强的线性相关关系;(若|r|>0.75,则认为两个变量具有较强的线性相关关系)
解:∵=×(1+2+3+4+5)=3,
=×(27+23+20+17+13)=20, (xi-)2=10, (yi-)2=116, (xi-)(yi-)=-34,r= =≈≈-0.998.又|r|=0.998>0.75,所以可以说明y与x具有较强的线性相关关系.
(2)该纺织厂现有甲、乙两条流水线生产同一种产品,为对产品质量进行监控,质检人员先用简单随机抽样的方法从甲、乙两条流水线上分别抽取了4件、2件产品进行初检,再从中随机选取3件做进一步的质检,记抽到“甲流水线产品”的件数为X,试求X的分布列与均值.
参考数据:≈34.06.
解:X的可能取值有1,2,3,
因为P(X=1)==,P(X=2)==,P(X=3)==,
所以X的分布列为
E(X)=1×+2×+3×=2.
X 1 2 3
P
[例3] (2025·广州模拟)为了研究高三年级学生的性别和身高是否大于170 cm的关联性,随机调查了某中学部分高三年级的学生,整理得到如下列联表(单位:人):
题点三 概率与独立性检验的综合
性别 身高 合计
低于170 cm 不低于170 cm
女 19 5 24
男 6 10 16
合计 25 15 40
(1)依据α=0.01的独立性检验,能否认为该中学高三年级学生的性别与身高有关联
解:零假设为H0:该中学高三年级学生的性别与身高无关联,根据列联表中的数据,经计算得到χ2=≈7.111>6.635=x0.01,
根据小概率值α=0.01的独立性检验,推断H0不成立,即认为该中学高三年级学生的性别与身高有关联,此推断犯错误的概率不大于0.01.
(2)从身高不低于170 cm的15名学生中随机抽取三名学生,设抽取的三名学生中女生人数为X,求X的分布列及E(X).
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:依题意,X的取值可能为0,1,2,3,
则P(X=0)==,P(X=1)==,P(X=2)==,P(X=3)==.则X的分布列为
故E(X)=0×+1×+2×+3×=1.
X 0 1 2 3
P
3.某医疗科研小组为研究某市市民患有疾病A与是否具有生活习惯B的关系,从该市市民中随机抽查了100人,得到如下数据:
即时训练
疾病A 生活习惯B
具有 不具有
患病 25 15
未患病 20 40
(1)依据α=0.01的独立性检验,能否认为该市市民患有疾病A与是否具有生活习惯B有关
解:由已知得列联表如下:
疾病A 生活习惯B 合计
具有 不具有
患病 25 15 40
未患病 20 40 60
合计 45 55 100
零假设为H0:该市市民患有疾病A与是否具有生活习惯B无关.
根据列联表中的数据,经计算得到
χ2==≈8.249>6.635=x0.01.
依据α=0.01的独立性检验,推断H0不成立,即认为该市市民患有疾病A与是否具有生活习惯B有关,此推断犯错误的概率不大于0.01.
(2)从该市市民中任选一人,M表示事件“选到的人不具有生活习惯B”,N表示事件“选到的人患有疾病A”,试利用该调查数据,给出P(|)的估计值;
解:由(1)数据可得
P()==,P()==,
所以P(|)===.
(3)从该市市民中任选3人,记这3人中具有生活习惯B,且未患有疾病A的人数为X,试利用该调查数据,求X的均值.
附:χ2=,其中n=a+b+c+d.
α 0.10 0.05 0.010 0.001
xα 2.706 3.841 6.635 10.828
解:由题意知可用B估计X的分布,
所以E(X)=np=3×=.
数智赋能:电子版随堂训练(概率统计与其他知识交汇),根据课堂情况灵活选用
课时跟踪检测
04
1
2
3
4
1.(15分)教练统计了甲12次投篮训练的投篮次数和乙8次投篮训练的投篮次数,得到如下数据:
已知甲12次投篮次数的方差=,乙8次投篮次数的方差=23.
甲 77 73 77 81 85 81 77 85 93 73 77 81
乙 71 81 73 73 71 73 85 73
(1)求这20次投篮次数的平均数与方差s2;(5分)
解:甲12次投篮次数的平均数=80,乙8次投篮次数的平均数=75.这20次投篮次数的平均数
=+=(3×80+2×75)=78,
方差s2=+
=×+×=33.
1
2
3
4
(2)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为,乙每次投篮的命中率均为.已知第一次投篮的人是甲,且甲、乙总共投篮了3次,X表示甲投篮的次数,求X的分布列与期望.(10分)
1
2
3
4
解:X的可能取值为1,2,3,则P=××1=,P=××1+××1=,P=××1=,
所以X的分布列为
E(X)=1×+2×+3×=.
1
2
3
4
X 1 2 3
P
2.(15分)(2024·淄博二模)汽车尾气排放超标是导致全球变暖、海平面上升的重要因素.我国近几年着重强调可持续发展,加大新能源项目的支持力度,积极推动新能源汽车产业迅速发展.某汽车制造企业对某地区新能源汽车的销售情况进行调查,得到下面的统计表:
1
2
3
4
年份/t 2015 2016 2017 2018 2019
年份代码/x(x=t-2014) 1 2 3 4 5
销量/y(万辆) 10 12 17 20 26
(1)计算销量y关于年份代码x的样本相关系数r,并判断是否可以认为y与x有较强的线性相关关系(若|r|≥0.75,则认为有较强的线性相关关系).若是,求出y关于x的经验回归方程;若不是,请说明理由;(5分)
解:由题意得=×(1+2+3+4+5)=3,
=×(10+12+17+20+26)=17,
xiyi=295, =55, (yi-)2=164,
1
2
3
4
r= =>≈0.976>0.75,
因此,销量y与年份代码x有较强的线性相关关系.
因为= ==4,
=-=17-4×3=5,
所以y关于x的经验回归方程为=4x+5.
1
2
3
4
(2)为了解购车车主的性别与购车种类(分为新能源汽车与传统燃油汽车)的情况,该企业又随机调查了该地区100名购车车主的购车情况,假设一位车主只购一辆车.男性车主中购置传统燃油汽车的有40名,购置新能源汽车的有30名;女性车主中有一半购置新能源汽车.将频率视为概率,已知一位车主购得新能源汽车,请问这位车主是女性的概率.(10分)
1
2
3
4
附:若(x1,y1),(x2,y2),…,(xn,yn)为样本点,
则样本相关系数r= =
=x+为经验回归方程,则= =-.
1
2
3
4
解:由题意知,该地区100名购车车主中,男性车主有70名,女性车主有30名,购置新能源汽车的男性车主有30名,购置新能源汽车的女性车主有15名.
“一位车主购得新能源汽车”记作事件A,“车主是女性”记作事件B,
一位车主购得新能源汽车,这位车主是女性的概率为
P(B|A)===.
1
2
3
4
3.(15分)(2025·桂林模拟)为了研究学生的性别和是否喜欢跳绳的关联性,随机调查了某中学的100名学生,整理得到如下列联表:
1
2
3
4
男学生 女学生 合计
喜欢跳绳 35 35 70
不喜欢跳绳 10 20 30
合计 45 55 100
(1)依据α=0.1的独立性检验,能否认为学生的性别和是否喜欢跳绳有关联 (5分)
解:零假设为H0:学生的性别和是否喜欢跳绳无关.
χ2=≈2.357<2.706=x0.1,
所以根据α=0.1的独立性检验,不能认为学生的性别与是否喜欢跳绳有关.
1
2
3
4
(2)已知该校学生每分钟的跳绳个数X~N(170,100),该校学生经过训练后,跳绳个数都有明显进步.假设经过训练后每人每分钟的跳绳个数都增加10,该校有1 000名学生,预估经过训练后该校学生每分钟的跳绳个数在[170,200]内的人数.(结果精确到整数)(10分)
附:χ2=,其中n=a+b+c+d.
若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)
≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
1
2
3
4
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
解:训练前该校学生每分钟的跳绳个数X~N(170,100),
则μ=170,σ2=100,σ=10,
即训练前学生每分钟的跳绳个数在[160,190],160=μ-σ,190=μ+2σ,
P(μ-σ≤X≤μ+2σ)=+
≈+=0.341 35+0.477 25=0.818 6,
1
2
3
4
由1 000×0.818 6=818.6≈819(人),
估计训练前该校学生每分钟的跳绳个数在[160,190]内的人数为819.
即预估经过训练后该校学生每分钟的跳绳个数在[170,200]内的人数为819.
1
2
3
4
4.(17分)(2025·广州模拟)在某地区进行高中学生每周户外运动调查,随机调查了1 000名高中学生户外运动的时间(单位:小时),得到如下样本数据的频率分布直方图.
1
2
3
4
(1)求a的值,估计该地区高中学生每周户外运动的平均时间;(同一组数据用该区间的中点值作代表)(4分)
解:由已知2×(0.02+0.03+0.05+0.05+0.15+a+0.05+0.04+0.01)=1,解得a=0.1,
所以平均数为
1×0.04+3×0.06+5×0.1+7×0.1+9×0.3+11×0.2+13×0.1+15×0.08+17×0.02=9.16.
1
2
3
4
(2)为进一步了解这1 000名高中学生户外运动的时间分配,在[14,16),[16,18]两组内的学生中,采用分层随机抽样的方法抽取了5人,现从这5人中随机抽取3人进行访谈,记在[14,16)内的人数为X,求X的分布列和期望;(6分)
解:这1 000名高中学生户外运动的时间分配,
在[14,16),[16,18]两组内的学生分别有1 000×0.08=80人和1 000
×0.02=20人,所以根据分层随机抽样可知5人中在[14,16)的人数为5×=4,在[16,18]内的人数为5-4=1,
1
2
3
4
所以随机变量X的可能取值有2,3,
所以P(X=2)==,P(X=3)==,
则X的分布列为
E(X)=2×+3×=.
1
2
3
4
X 2 3
P
(3)以频率估计概率,从该地区的高中学生中随机抽取8名学生,用“P8(k)”表示这8名学生中恰有k名学生户外运动时间在[8,10)内的概率,当P8(k)最大时,求k的值.(7分)
解:由频率分布直方图可知运动时间在[8,10)内的频率为0.15×2=0.3=,则P8(k)=·
=··,
1
2
3
4
若P8(k)为最大值,则

即解得1.7≤k≤2.7,又k∈N,
且0≤k≤8,则k=2.
1
2
3
4课时跟踪检测(八十) 概率与统计的综合问题
1.(15分)教练统计了甲12次投篮训练的投篮次数和乙8次投篮训练的投篮次数,得到如下数据:
甲 77 73 77 81 85 81 77 85 93 73 77 81
乙 71 81 73 73 71 73 85 73
已知甲12次投篮次数的方差=,乙8次投篮次数的方差=23.
(1)求这20次投篮次数的平均数与方差s2;(5分)
(2)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为,乙每次投篮的命中率均为.已知第一次投篮的人是甲,且甲、乙总共投篮了3次,X表示甲投篮的次数,求X的分布列与期望.(10分)
2.(15分)(2024·淄博二模)汽车尾气排放超标是导致全球变暖、海平面上升的重要因素.我国近几年着重强调可持续发展,加大新能源项目的支持力度,积极推动新能源汽车产业迅速发展.某汽车制造企业对某地区新能源汽车的销售情况进行调查,得到下面的统计表:
年份/t 2015 2016 2017 2018 2019
年份代码/x(x=t-2014) 1 2 3 4 5
销量/y(万辆) 10 12 17 20 26
(1)计算销量y关于年份代码x的样本相关系数r,并判断是否可以认为y与x有较强的线性相关关系(若|r|≥0.75,则认为有较强的线性相关关系).若是,求出y关于x的经验回归方程;若不是,请说明理由;(5分)
(2)为了解购车车主的性别与购车种类(分为新能源汽车与传统燃油汽车)的情况,该企业又随机调查了该地区100名购车车主的购车情况,假设一位车主只购一辆车.男性车主中购置传统燃油汽车的有40名,购置新能源汽车的有30名;女性车主中有一半购置新能源汽车.将频率视为概率,已知一位车主购得新能源汽车,请问这位车主是女性的概率.(10分)
附:若(x1,y1),(x2,y2),…,(xn,yn)为样本点,
则样本相关系数r==;=x+为经验回归方程,则=,=-.
3.(15分)(2025·桂林模拟)为了研究学生的性别和是否喜欢跳绳的关联性,随机调查了某中学的100名学生,整理得到如下列联表:
男学生 女学生 合计
喜欢跳绳 35 35 70
不喜欢跳绳 10 20 30
合计 45 55 100
(1)依据α=0.1的独立性检验,能否认为学生的性别和是否喜欢跳绳有关联 (5分)
(2)已知该校学生每分钟的跳绳个数X~N(170,100),该校学生经过训练后,跳绳个数都有明显进步.假设经过训练后每人每分钟的跳绳个数都增加10,该校有1 000名学生,预估经过训练后该校学生每分钟的跳绳个数在[170,200]内的人数.(结果精确到整数)(10分)
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
4.(17分)(2025·广州模拟)在某地区进行高中学生每周户外运动调查,随机调查了1 000名高中学生户外运动的时间(单位:小时),得到如下样本数据的频率分布直方图.
(1)求a的值,估计该地区高中学生每周户外运动的平均时间;(同一组数据用该区间的中点值作代表)(4分)
(2)为进一步了解这1 000名高中学生户外运动的时间分配,在[14,16),[16,18]两组内的学生中,采用分层随机抽样的方法抽取了5人,现从这5人中随机抽取3人进行访谈,记在[14,16)内的人数为X,求X的分布列和期望;(6分)
(3)以频率估计概率,从该地区的高中学生中随机抽取8名学生,用“P8(k)”表示这8名学生中恰有k名学生户外运动时间在[8,10)内的概率,当P8(k)最大时,求k的值.(7分)
课时跟踪检测(八十)
1.解:(1)甲12次投篮次数的平均数=80,乙8次投篮次数的平均数=75.
这20次投篮次数的平均数
=+=(3×80+2×75)=78,
方差s2=+
=×+×=33.
(2)X的可能取值为1,2,3,则P=××1=,P=××1+××1=,P=××1=,
所以X的分布列为
X 1 2 3
P
E(X)=1×+2×+3×=.
2.解:(1)由题意得=×(1+2+3+4+5)=3,
=×(10+12+17+20+26)=17,
xiyi=295,=55,(yi-)2=164,
r==>≈0.976>0.75,
因此,销量y与年份代码x有较强的线性相关关系.
因为===4,
=-=17-4×3=5,
所以y关于x的经验回归方程为=4x+5.
(2)由题意知,该地区100名购车车主中,男性车主有70名,女性车主有30名,购置新能源汽车的男性车主有30名,购置新能源汽车的女性车主有15名.
“一位车主购得新能源汽车”记作事件A,“车主是女性”记作事件B,
一位车主购得新能源汽车,这位车主是女性的概率为
P(B|A)===.
3.解:(1)零假设为H0:学生的性别和是否喜欢跳绳无关.
χ2=≈2.357<2.706=x0.1,
所以根据α=0.1的独立性检验,不能认为学生的性别与是否喜欢跳绳有关.
(2)训练前该校学生每分钟的跳绳个数X~N(170,100),
则μ=170,σ2=100,σ=10,即训练前学生每分钟的跳绳个数在[160,190],160=μ-σ,190=μ+2σ,
P(μ-σ≤X≤μ+2σ)=+≈+=0.341 35+0.477 25=0.818 6,
由1 000×0.818 6=818.6≈819(人),
估计训练前该校学生每分钟的跳绳个数在[160,190]内的人数为819.
即预估经过训练后该校学生每分钟的跳绳个数在[170,200]内的人数为819.
4.解:(1)由已知2×(0.02+0.03+0.05+0.05+0.15+a+0.05+0.04+0.01)=1,解得a=0.1,
所以平均数为1×0.04+3×0.06+5×0.1+7×0.1+9×0.3+11×0.2+13×0.1+15×0.08+17×0.02=9.16.
(2)这1 000名高中学生户外运动的时间分配,
在[14,16),[16,18]两组内的学生分别有1 000×0.08=80人和1 000×0.02=20人,
所以根据分层随机抽样可知5人中在[14,16)的人数为5×=4,在[16,18]内的人数为5-4=1,
所以随机变量X的可能取值有2,3,
所以P(X=2)==,P(X=3)==,
则X的分布列为
X 2 3
P
E(X)=2×+3×=.
(3)由频率分布直方图可知运动时间在[8,10)内的频率为0.15×2=0.3=,
则P8(k)=·=··,
若P8(k)为最大值,则

即解得1.7≤k≤2.7,
又k∈N,且0≤k≤8,则k=2.

展开更多......

收起↑

资源列表