专题15 统计 讲义-2024届高考数学三轮冲刺(含解析)

资源下载
  1. 二一教育资源

专题15 统计 讲义-2024届高考数学三轮冲刺(含解析)

资源简介

专题15 统计
◆ ◆ ◆ ◆ ◆ ◆ ◆
高考频度 ★★★★★
考情分析 高考数学中,统计这个考点考查相关性、频率分布直方图、样本的数字特征、独立性检验、回归分析等.考查学生读取数据、分析数据、处理数据的能力。
一、选择题
【真题1】(2023 天津)鸢是鹰科的一种鸟,《诗经 大雅 旱麓》曰“鸢飞戾天,鱼跃于渊”.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制对应散点图(图2)如下:
计算得样本相关系数为0.8642,利用最小二乘法求得相应的经验回归方程为0.7501x+0.6105.根据以上信息,如下判断正确的为(  )
A.花萼长度和花瓣长度不存在相关关系
B.花萼长度和花瓣长度负相关
C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值约为5.8612cm
D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.8642
二、多选题
【真题2】(2023 新高考Ⅰ)有一组样本数据x1,x2, ,x6,其中x1是最小值,x6是最大值,则(  )
A.x2,x3,x4,x5的平均数等于x1,x2, ,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2, ,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2, ,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2, ,x6的极差
三、填空题
【真题3】(2023 上海)现有某地一年四个季度的GDP(亿元),第一季度GDP为232(亿元),第四季度GDP为241(亿元),四个季度的GDP逐季度增长,且中位数与平均数相同,则该地一年的GDP为   .
四、解答题
【真题4】(2023 乙卷)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…10).试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi﹣yi(i=1,2, ,10),记z1,z2, ,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.(如果2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【真题5】(2023 甲卷)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(1)计算试验组的样本平均数;
(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表;
<m ≥m
对照组
试验组
(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?
附:K2,
P(K2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
【真题6】(2023 新高考Ⅱ)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f(c)=p(c)+q(c).当c∈[95,105],求f(c)的解析式,并求f(c)在区间[95,105]的最小值.
考向1 样本的数字特征
解法技巧 样本的数字特征: (1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. (2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (3)平均数:一组数据的算术平均数,即. (4)极差:用一组数据中最大数据减去最小数据的差来反映这组数据的变化范围,这个数据就叫极差. (5)方差:一组数据中各数据与平均数差的平方和的平均数叫做方差. (6)标准差:方差的算术平方根就为标准差. (7)方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.
【模拟01】(2024 大庆模拟)小明希望自己的高考数学成绩能超过120分,为了激励自己,他记录了近8次数学考试成绩,并绘制成折线统计图,如图,这8次成绩的第80百分位数是(  )
A.100 B.105 C.110 D.120
【模拟02】(2024 湖南模拟)某10人的射击小组,在一次射击训练中射击成绩数据如下表,则这组数据的中位数为(  )
成绩(单位:环) 6 7 8 9 10
人数 1 2 2 4 1
A.2 B.8 C.8.2 D.8.5
【模拟03】(2024 高碑店市校级模拟)数据x1,x2,…,x9的平均数为4,标准差为2,则数据3x1+2,3x2+2,…,3x9+2的方差和平均数分别为(  )
A.36,14 B.14,36 C.12,19 D.4,12
【模拟04】(多选)(2024 海口模拟)已知甲、乙两组样本各有10个数据,甲、乙两组数据合并后得到一组新数据,下列说法正确的是(  )
A.若甲、乙两组数据的平均数都为a,则新数据的平均数等于a
B.若甲、乙两组数据的极差都为b,则新数据的极差可能大于b
C.若甲、乙两组数据的方差都为c,则新数据的方差可能小于c
D.若甲、乙两组数据的中位数都为d,则新数据的中位数等于d
【模拟05】(2024 重庆模拟)某体育器材店在两个购物平台上均开设了网店,平台一有1万人给出评分,综合好评率为96%,平台二有2万人给出评分,综合好评率为93%,则这家体育器材店的总体综合好评率为   .
考向2 频率分布直方图
解法技巧 频率分布直方图的特征: (1)各长方形面积等于相应各组的频率的数值,所有小矩形面积和为1. (2)从频率分布直方图可以清楚地看出数据分布的总体趋势. (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉. (4)众数:频率分布直方图中最高矩形的底边中点的横坐标. (5)平均数:频率分布直方图各小矩形的面积乘底边中点的横坐标之和. (6)中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.
【模拟01】(2024 安庆二模)在一次学科核心素养能力测试活动中,随机抽取了100名同学的成绩,将所有数据按[40,50],(50,60],(60,70],(70,80],(80,90],(90,100]进行分组,整理得到频率分布直方图如图所示,则估计这次调查数据的第64百分位数为(  )
A.80 B.78 C.76 D.74
【模拟02】(2024 成都模拟)高三某班学生每天完成作业所需的时间的频率分布直方图如图,为响应国家减负政策,若每天作业布置量在此基础上减少0.5小时,则减负后完成作业的时间的说法中正确的是(  )
A.减负后完成作业的时间的标准差减少0.5
B.减负后完成作业的时间的方差减少0.25
C.减负后完成作业的时间在4小时以上的概率大于10%
D.减负后完成作业的时间的中位数在2至2.5之间
【模拟03】(多选)(2024 金华模拟)从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在50 350KW h之间,进行适当分组后(每组为左闭右开区间),画出频率分布直方图如图所示,记直方图中六个小矩形的面积从左到右依次为si(i=1,2,…,6),则(  )
A.x的值为0.0044
B.这100户居民该月用电量的中位数为175
C.用电量落在区间[150,350)内的户数为75
D.这100户居民该月的平均用电量为
【模拟04】(多选)(2024 山东模拟)某地区为了解某一学科学生的竞赛成绩(均在区间[40,100]内),通过随机抽样抽取了部分学生的成绩,得到如图所示的频率分布直方图.若分数位于区间[80,100],等级评价为“优秀”;若分数位于区间[60,80),等级评价为“良好”;分数位于区间[40,60),等级评价为“一般”.为更好地了解学生学习需要,老师计划从三类评价等级中按分层随机抽样的方式抽取60人进行调查问卷,则(  )
A.老师需要从“优秀”等级中抽取15人参与调查问卷
B.60%分位数为75
C.该学科竞赛成绩的平均数为68.8
D.该学科竞赛成绩的中位数小于平均数
【模拟05】(2024 内江一模)某汽车公司最近研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程的测试.现对测试数据进行分析,得到如图所示的频率分布直方图:估计这100辆汽车的单次最大续航里程的平均值为   千米.
考向3 独立性检验
解法技巧 独立性检验的步骤: (1)认真读题,取出相关数据,作出2×2列联表. (2)根据2×2列联表中的数据,计算K2的观测值k. (3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.
【模拟01】(2024 原州区校级模拟)2023年9月23日至10月8日,第19届亚洲运动会在中国杭州举行,这是我国继北京、广州亚运会后第三次举办亚运会,浙江某市一调研机构为了解本市市民对“亚运会”相关知识的认知程度,举办了一次“亚运会”网络知识竞赛,满分100分,并规定成绩不低于80分的市民获得优秀奖,成绩不低于70分的市民则认为成绩达标,现从参加了竞赛的男、女市民中各抽取了100名市民的竞赛成绩作为样本进行数据分析,对男市民的竞赛成绩进行统计后,得到如图所示的成绩频率分布直方图.
(1)试分别估计男市民成绩达标以及获得优秀奖的概率;
(2)已知样本中女市民获得优秀奖的人数占比为5%,则是否有99.9%的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关?
附:,其中n=a+b+c+d.
P(K2≥k0) 0.1 0.05 0.01 0.005 0.001
k0 2.706 3.841 6.635 7.879 10.828
【模拟02】(2024 雅安模拟)已知甲社区有120人计划去四川旅游,他们每人将从峨眉山与青城山中选择一个去旅游,将这120人分为东、西两小组,两组的人数相等,已知东小组中去峨眉山的人数是去青城山人数的两倍,西小组中去峨眉山的人数比去青城山的人数少10.
(1)完成下面的2×2列联表,并判断是否有99%的把握认为游客的选择与所在的小组有关;
去峨眉山旅游 去青城山旅游 合计
东小组
西小组
合计
(2)判断是否有99%的把握认为游客的选择与所在的小组有关,说明你的理由.
参考公式:,n=a+b+c+d.
P(K2≥k0) 0.050 0.010 0.001
k0 3.841 6.635 10.828
【模拟03】(2024 嘉兴二模)春季流感对广大民众的健康生活带来一定的影响,为了有效预防流感,很多民众注射了流感疫苗.某市防疫部门从辖区居民中随机抽取了1000人进行调查,发现其中注射疫苗的800人中有220人感染流感,另外没注射疫苗的200人中有80人感染流感.医学研究表明,流感的检测结果是有错检的可能,已知患有流感的人其检测结果有95%呈阳性(感染),而没有患流感的人其检测结果有99%呈阴性(未感染).
(1)估计该市流感感染率是多少?
(2)根据所给数据,判断是否有99.9%的把握认为注射流感疫苗与预防流感有关;
(3)已知某人的流感检测结果呈阳性,求此人真的患有流感的概率.(精确到0.001)
附:,
P(K2>k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
【模拟04】(2024 榆林三模)“直播的尽头是带货”,如今网络直播带货越来越火爆,但商品的质量才是一个主播能否持久带货的关键.某主播委托甲、乙两个工厂为其生产加工商品,为了了解商品质量情况,分别从甲、乙两个工厂各随机抽取了100件商品,根据商品质量可将其分为一、二、三等品,统计的结果如图:
(1)根据独立性检验,判断是否有90%的把握认为商品为一等品与加工工厂有关?
(2)该主播在抽取的所有二等品和三等品中采用分层抽样的方法抽取7件商品进行质检分析,再从这7件商品中随机抽取2件送到专业质检机构组进行最终质检分析,求抽取的这2件商品中至少有1件为二等品的概率.

P(K2 k0) 0.100 0.050 0.010 0.005
k0 2.706 3.841 6.635 7.879
【模拟05】(2024 汉中模拟)2024年03月04日《人民日报》发表文章《开展全民健身实现全民健康》,文中提到:体育锻炼要从小抓起.“让孩子们跑起来”“要长得壮壮的、练得棒棒的”“体育锻炼是增强少年儿童体质最有效的手段”…习近平总书记的殷殷嘱托,牢牢印刻在广大教育工作者和孩子们的心中.某学校为了了解学生体育锻炼的情况,随机抽取了n名同学,统计了他们每周体育锻炼的时间,作出了频率分布直方图如图所示.其中体育锻炼时间在(4,6]内的人数为50人.
(1)求n及a的值(a的取值保留三位小数);
(2)估计该校学生每周体育锻炼时间的平均值(同一组中的数据用该组区间的中点值作代表);
(3)我们把每周体育锻炼时间超过8小时的学生称为“运动达人”,为了了解“运动达人”与性别是否有关系,我们对随机抽取的n名学生的性别进行了统计,得到如下2×2列联表:
非运动达人 运动达人 总计
男生 30
女生 70
总计
补全2×2列联表,并判断能否有90%的把握认为成为“运动达人”与性别有关?
附:
P(K2≥k) 0.100 0.050 0.025 0.010
k 2.706 3.841 5.024 6.635专题15 统计
◆ ◆ ◆ ◆ ◆ ◆ ◆
高考频度 ★★★★★
考情分析 高考数学中,统计这个考点考查相关性、频率分布直方图、样本的数字特征、独立性检验、回归分析等.考查学生读取数据、分析数据、处理数据的能力。
一、选择题
【真题1】(2023 天津)鸢是鹰科的一种鸟,《诗经 大雅 旱麓》曰“鸢飞戾天,鱼跃于渊”.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制对应散点图(图2)如下:
计算得样本相关系数为0.8642,利用最小二乘法求得相应的经验回归方程为0.7501x+0.6105.根据以上信息,如下判断正确的为(  )
A.花萼长度和花瓣长度不存在相关关系
B.花萼长度和花瓣长度负相关
C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值约为5.8612cm
D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.8642
【答案】C
【解答】解:∵相关系数r=0.8642>0.75,且散点图呈左下角到右上角的带状分布,
∴花瓣长度和花萼长度呈正相关,且相关性较强,∴A,B选项错误;
当x=7时,代入经验回归方程为0.7501x+0.6105,可得y=5.8612,∴花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值约为5.8612cm,∴C选项正确;
若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数不一定是0.8642,∴D选项错误.
故选:C.
二、多选题
【真题2】(2023 新高考Ⅰ)有一组样本数据x1,x2, ,x6,其中x1是最小值,x6是最大值,则(  )
A.x2,x3,x4,x5的平均数等于x1,x2, ,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2, ,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2, ,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2, ,x6的极差
【答案】BD
【解答】解:A选项,x2,x3,x4,x5的平均数不一定等于x1,x2, ,x6的平均数,A错误;
B选项,x2,x3,x4,x5的中位数等于,x1,x2, ,x6的中位数等于,B正确;
C选项,设样本数据x1,x2, ,x6为0,1,2,8,9,10,可知x1,x2, ,x6的平均数是5,x2,x3,x4,x5的平均数是5,x1,x2, ,x6的方差[(0﹣5)2+(1﹣5)2+(2﹣5)2+(8﹣5)2+(9﹣5)2+(10﹣5)2],x2,x3,x4,x5的方差[(1﹣5)2+(2﹣5)2+(8﹣5)2+(9﹣5)2],,∴s1>s2,C错误.
D选项,x6>x5,x2>x1,∴x6﹣x1>x5﹣x2,D正确.
故选:BD.
三、填空题
【真题3】(2023 上海)现有某地一年四个季度的GDP(亿元),第一季度GDP为232(亿元),第四季度GDP为241(亿元),四个季度的GDP逐季度增长,且中位数与平均数相同,则该地一年的GDP为   .
【答案】946(亿元).
【解答】解:设第二季度GDP为x亿元,第三季度GDP为y亿元,则232<x<y<241,
∵中位数与平均数相同,∴,∴x+y=473,
∴该地一年的GDP为232+x+y+241=946(亿元).
故答案为:946(亿元).
四、解答题
【真题4】(2023 乙卷)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…10).试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi﹣yi(i=1,2, ,10),记z1,z2, ,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.(如果2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【答案】见试题解答内容
【解答】解:(1)根据表中数据,计算zi=xi﹣yi(i=1,2,…,10),填表如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
zi=xi﹣yi 9 6 8 ﹣8 15 11 19 18 20 12
计算平均数为zi(9+6+8﹣8+15+11+19+18+20+12)=11,
方差为s2[(﹣2)2+(﹣5)2+(﹣3)2+(﹣19)2+42+02+82+72+92+12]=61.
(2)由(1)知,11,2225,
所以2,认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【真题5】(2023 甲卷)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(1)计算试验组的样本平均数;
(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表;
<m ≥m
对照组
试验组
(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?
附:K2,
P(K2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
【答案】(1)19.8.
(2)(i)中位数是23.4;列联表是
<m ≥m 合计
对照组 6 14 20
试验组 14 6 20
合计 20 20 40
(ii)有95%的把握认为有差异.
【解答】解:(1)根据题意,计算试验组样本平均数为(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=19.8.
(2)(i)由题意知,这40只小鼠体重的中位数是将两组数据合在一起,从小到大排列后第20位与第21位数据的平均数,
因为原数据的第11位数据是18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6,…,
所以第20位为23.2,第21位数据为23.6,
所以这组数据的中位数是m(23.2+23.6)=23.4;
填写列联表如下:
<m ≥m 合计
对照组 6 14 20
试验组 14 6 20
合计 20 20 40
(ii)根据列联表中数据,计算K26.4>3.841,
所以有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.
【真题6】(2023 新高考Ⅱ)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f(c)=p(c)+q(c).当c∈[95,105],求f(c)的解析式,并求f(c)在区间[95,105]的最小值.
【答案】见试题解答内容
【解答】解:(1)当漏诊率p(c)=0.5%时,
则(c﹣95) 0.002=0.5%,解得c=97.5;
q(c)=0.01×2.5+5×0.002=0.035=3.5%;
(2)当c∈[95,100]时,
f(c)=p(c)+q(c)=(c﹣95) 0.002+(100﹣c) 0.01+5×0.002=﹣0.008c+0.82≥0.02,
当c∈(100,105]时,f(c)=p(c)+q(c)=5×0.002+(c﹣100) 0.012+(105﹣c) 0.002=0.01c﹣0.98>0.02,
故f(c),
所以f(c)的最小值为0.02.
考向1 样本的数字特征
解法技巧 样本的数字特征: (1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. (2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (3)平均数:一组数据的算术平均数,即. (4)极差:用一组数据中最大数据减去最小数据的差来反映这组数据的变化范围,这个数据就叫极差. (5)方差:一组数据中各数据与平均数差的平方和的平均数叫做方差. (6)标准差:方差的算术平方根就为标准差. (7)方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.
【模拟01】(2024 大庆模拟)小明希望自己的高考数学成绩能超过120分,为了激励自己,他记录了近8次数学考试成绩,并绘制成折线统计图,如图,这8次成绩的第80百分位数是(  )
A.100 B.105 C.110 D.120
【答案】C
【解答】解:根据题意,因为8×80%=6.4,
结合结合折线统计图,将8次成绩由小到大排序,第7个数据为110,所以这8次成绩的第80百分位数是110.
故选:C.
【模拟02】(2024 湖南模拟)某10人的射击小组,在一次射击训练中射击成绩数据如下表,则这组数据的中位数为(  )
成绩(单位:环) 6 7 8 9 10
人数 1 2 2 4 1
A.2 B.8 C.8.2 D.8.5
【答案】D
【解答】解:10×0.5=5,则这组数据的中位数为.
故选:D.
【模拟03】(2024 高碑店市校级模拟)数据x1,x2,…,x9的平均数为4,标准差为2,则数据3x1+2,3x2+2,…,3x9+2的方差和平均数分别为(  )
A.36,14 B.14,36 C.12,19 D.4,12
【答案】A
【解答】解:∵数据x1,x2,…,x9的平均数为4,标准差为2,
∴数据x1,x2,…,x9的方差为4,平均数为4,
∴根据方差和平均数的性质可得3x1+2,3x2+2,…,3x9+2的方差为32×4=36,平均数为3×4+2=14.
故选:A.
【模拟04】(多选)(2024 海口模拟)已知甲、乙两组样本各有10个数据,甲、乙两组数据合并后得到一组新数据,下列说法正确的是(  )
A.若甲、乙两组数据的平均数都为a,则新数据的平均数等于a
B.若甲、乙两组数据的极差都为b,则新数据的极差可能大于b
C.若甲、乙两组数据的方差都为c,则新数据的方差可能小于c
D.若甲、乙两组数据的中位数都为d,则新数据的中位数等于d
【答案】ABD
【解答】解:设甲:x1,x2,…,x10,乙:y1,y2,…,y10,新数据为:z1,z2,…,z20,对于A,因为,所以A正确;
对于B,设甲:1,2,…,10,乙:21,22,…,30,两组数据极差均为9,但混合后数据的极差为29,所以B正确;
对于C,因为,所以 ,,,所以新数据的方差为20)(10c+1010c+1020)=c,因为,所以新数据的方差一定不小于c,所以C错误;
对于D,不妨设x1≤x2≤ ≤x10,y1≤y2≤ ≤y10,则,将混合后数据按从小到大排列,若x5≤y5,则x6≥y6,所以第10,11个数为y5和y6,若x5>y5,则x6<y6,所以第10,11个数为x5和x6,两种情形下,新数据的中位数都等于d,所以D正确.
故选:ABD.
【模拟05】(2024 重庆模拟)某体育器材店在两个购物平台上均开设了网店,平台一有1万人给出评分,综合好评率为96%,平台二有2万人给出评分,综合好评率为93%,则这家体育器材店的总体综合好评率为   .
【答案】94%.
【解答】解:这家体育器材店的总体综合好评率为94%.
故答案为:94%.
考向2 频率分布直方图
解法技巧 频率分布直方图的特征: (1)各长方形面积等于相应各组的频率的数值,所有小矩形面积和为1. (2)从频率分布直方图可以清楚地看出数据分布的总体趋势. (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉. (4)众数:频率分布直方图中最高矩形的底边中点的横坐标. (5)平均数:频率分布直方图各小矩形的面积乘底边中点的横坐标之和. (6)中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.
【模拟01】(2024 安庆二模)在一次学科核心素养能力测试活动中,随机抽取了100名同学的成绩,将所有数据按[40,50],(50,60],(60,70],(70,80],(80,90],(90,100]进行分组,整理得到频率分布直方图如图所示,则估计这次调查数据的第64百分位数为(  )
A.80 B.78 C.76 D.74
【答案】B
【解答】解:前3组数据频率之和为(0.005+0.015+0.02)×10=0.4,
前4组数据频率之和为(0.005+0.015+0.02+0.03)×10=0.7,
设估计这次调查数据的第64百分位数为x,
则0.4+(x﹣70)×0.03=0.64,解得x=78.
故选:B.
【模拟02】(2024 成都模拟)高三某班学生每天完成作业所需的时间的频率分布直方图如图,为响应国家减负政策,若每天作业布置量在此基础上减少0.5小时,则减负后完成作业的时间的说法中正确的是(  )
A.减负后完成作业的时间的标准差减少0.5
B.减负后完成作业的时间的方差减少0.25
C.减负后完成作业的时间在4小时以上的概率大于10%
D.减负后完成作业的时间的中位数在2至2.5之间
【答案】D
【解答】解:依题意若每天作业布置量在此基础上减少0.5小时,
则平均数减少0.5小时,方差和标准差均不变,故A,B都错误;
减负前完成作业的时间在4.5小时以上的概率为0.1×0.5=0.05<10%,
∴减负前完成作业的时间在4小时以上的概率为0.1×0.5=0.05<10%,故C错误;
由频率分布直方图可得(0.1+0.3+0.5)×0.5=0.45<0.5,
(0.1+0.3+0.5+0.4)×0.5=0.65>0.5,
∴减负后完成作业的时间的中位数在2至2.5之间,故D正确.
故选:D.
【模拟03】(多选)(2024 金华模拟)从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在50 350KW h之间,进行适当分组后(每组为左闭右开区间),画出频率分布直方图如图所示,记直方图中六个小矩形的面积从左到右依次为si(i=1,2,…,6),则(  )
A.x的值为0.0044
B.这100户居民该月用电量的中位数为175
C.用电量落在区间[150,350)内的户数为75
D.这100户居民该月的平均用电量为
【答案】AD
【解答】解:对于A,由频率分布直方图的性质可知,(0.0024+0.0036+0.0060+x+0.0024+0.0012)×50=1,解得x=0.0044,故A正确;
对于B,因为(0.0024+0.0036)×50=0.3<0.5,(0.0024+0.0036+0.0060)×50=0.6>0.5,所以中位数落在区间[150,200)内,设其为m,则0.3+(m﹣150)×0.006=0.5,解得m≈183,故B错误;
对于C,用电量落在区间[150,350)内的户数为(0.0060+0.0044+0.0024+0.0012)×50×100=70,故C错误;
对于D,这100户居民该月的平均用电量为(50+25)s1+(50×2+25)s2+…+(50×6+25)s6si,故D正确.
故选:AD.
【模拟04】(多选)(2024 山东模拟)某地区为了解某一学科学生的竞赛成绩(均在区间[40,100]内),通过随机抽样抽取了部分学生的成绩,得到如图所示的频率分布直方图.若分数位于区间[80,100],等级评价为“优秀”;若分数位于区间[60,80),等级评价为“良好”;分数位于区间[40,60),等级评价为“一般”.为更好地了解学生学习需要,老师计划从三类评价等级中按分层随机抽样的方式抽取60人进行调查问卷,则(  )
A.老师需要从“优秀”等级中抽取15人参与调查问卷
B.60%分位数为75
C.该学科竞赛成绩的平均数为68.8
D.该学科竞赛成绩的中位数小于平均数
【答案】ACD
【解答】解:设[80,90)内的频率与组距的比为a,由频率分布直方图知,(0.012+0.018+0.025+0.020+a+0.010)×10=1,解得a=0.015,所以[80,100]内的频率为(0.015+0.010)×10=0.25,根据分层抽样法知,应从“优秀”等级中抽取60×0.25=15(人),选项A正确;
设60%分位数为x,因为(0.012+0.018+0.025)×10+(x﹣70)×0.020=0.60,解得x=72.5,所以60%分位数为72.5,选项B错误;
计算这组数据的平均值为:45×0.12+55×0.18+65×0.25+75×0.20+85×0.15+95×0.10=68.8,选项C正确;
设中位数为y,则(0.012+0.018)×10+(y﹣60)×0.025=0.5,解得y=68,所以中位数小于平均数,选项D正确.
故选:ACD.
【模拟05】(2024 内江一模)某汽车公司最近研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程的测试.现对测试数据进行分析,得到如图所示的频率分布直方图:估计这100辆汽车的单次最大续航里程的平均值为   千米.
【答案】300.
【解答】解:由频率分布直方图,计算平均值为:205×0.002×50+255×0.004×50+305×0.009×50+355×0.004×50+405×0.001×50=300(千米).
故答案为:300.
考向3 独立性检验
解法技巧 独立性检验的步骤: (1)认真读题,取出相关数据,作出2×2列联表. (2)根据2×2列联表中的数据,计算K2的观测值k. (3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.
【模拟01】(2024 原州区校级模拟)2023年9月23日至10月8日,第19届亚洲运动会在中国杭州举行,这是我国继北京、广州亚运会后第三次举办亚运会,浙江某市一调研机构为了解本市市民对“亚运会”相关知识的认知程度,举办了一次“亚运会”网络知识竞赛,满分100分,并规定成绩不低于80分的市民获得优秀奖,成绩不低于70分的市民则认为成绩达标,现从参加了竞赛的男、女市民中各抽取了100名市民的竞赛成绩作为样本进行数据分析,对男市民的竞赛成绩进行统计后,得到如图所示的成绩频率分布直方图.
(1)试分别估计男市民成绩达标以及获得优秀奖的概率;
(2)已知样本中女市民获得优秀奖的人数占比为5%,则是否有99.9%的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关?
附:,其中n=a+b+c+d.
P(K2≥k0) 0.1 0.05 0.01 0.005 0.001
k0 2.706 3.841 6.635 7.879 10.828
【答案】(1)男市民成绩达标的概率为0.75,男市民成绩优秀奖的概率为0.25;
(2)有99.9%的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关.
【解答】解:(1)设取得的成绩为X,男市民成绩达标的概率为p(X≥70)=(0.05+0.02+0.005)×10=0.75,
男市民获得优秀奖的概率为p(X≥80)=(0.02+0.005)×10=0.25;
(2)因为女市民获得优秀奖的人数占比为5%,所以女市民优秀人数为100×0.05=5人,男市民优秀人数为100×0.25=25人,
2×2列联表如图:
分类 优秀 不优秀 总计
女市民 5 95 100
男市民 25 75 100
总计 30 170 200
所以K215.686>10.828,
所以有99.9%的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关.
【模拟02】(2024 雅安模拟)已知甲社区有120人计划去四川旅游,他们每人将从峨眉山与青城山中选择一个去旅游,将这120人分为东、西两小组,两组的人数相等,已知东小组中去峨眉山的人数是去青城山人数的两倍,西小组中去峨眉山的人数比去青城山的人数少10.
(1)完成下面的2×2列联表,并判断是否有99%的把握认为游客的选择与所在的小组有关;
去峨眉山旅游 去青城山旅游 合计
东小组
西小组
合计
(2)判断是否有99%的把握认为游客的选择与所在的小组有关,说明你的理由.
参考公式:,n=a+b+c+d.
P(K2≥k0) 0.050 0.010 0.001
k0 3.841 6.635 10.828
【答案】(1)2×2列联表如下:
去峨眉山旅游 去青城山旅游 合计
东小组 40 20 60
西小组 25 35 60
合计 65 55 120
(2)有99%的把握认为游客的选择与所在的小组有关.
【解答】解:(1)由题意可知,东、西两小组的人数都是60人,
所以东小组中去峨眉山的人数为40人,去青城山的人数为20人,西小组中去峨眉山的人数为25人,去青城山的人数为35人,
列出2×2列联表如下:
去峨眉山旅游 去青城山旅游 合计
东小组 40 20 60
西小组 25 35 60
合计 65 55 120
(2)因为K27.552>6.635,
所以有99%的把握认为游客的选择与所在的小组有关.
【模拟03】(2024 嘉兴二模)春季流感对广大民众的健康生活带来一定的影响,为了有效预防流感,很多民众注射了流感疫苗.某市防疫部门从辖区居民中随机抽取了1000人进行调查,发现其中注射疫苗的800人中有220人感染流感,另外没注射疫苗的200人中有80人感染流感.医学研究表明,流感的检测结果是有错检的可能,已知患有流感的人其检测结果有95%呈阳性(感染),而没有患流感的人其检测结果有99%呈阴性(未感染).
(1)估计该市流感感染率是多少?
(2)根据所给数据,判断是否有99.9%的把握认为注射流感疫苗与预防流感有关;
(3)已知某人的流感检测结果呈阳性,求此人真的患有流感的概率.(精确到0.001)
附:,
P(K2>k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
【答案】(1)0.3;
(2)有99.9%的把握认为注射流感疫苗与流感发病人数有关;
(3)97.6%.
【解答】解:(1)估计流感的感染率;
(2)根据题意,得到2×2列联表如下:
疫苗情况 流感情况 合计
患有流感 不患有流感
打疫苗 220 580 800
不打疫苗 80 120 200
合计 300 700 1000

因为11.9>10.828,
所以有99.9%的把握认为注射流感疫苗与流感发病人数有关;
(3)设事件A为“一次检测结果呈阳性”,事件B为“被检测者确实患有流感”,
由题意得,
由全概率公式得,
所以P(B|A)97.6%,
即此人真的患有流感的概率是97.6%.
【模拟04】(2024 榆林三模)“直播的尽头是带货”,如今网络直播带货越来越火爆,但商品的质量才是一个主播能否持久带货的关键.某主播委托甲、乙两个工厂为其生产加工商品,为了了解商品质量情况,分别从甲、乙两个工厂各随机抽取了100件商品,根据商品质量可将其分为一、二、三等品,统计的结果如图:
(1)根据独立性检验,判断是否有90%的把握认为商品为一等品与加工工厂有关?
(2)该主播在抽取的所有二等品和三等品中采用分层抽样的方法抽取7件商品进行质检分析,再从这7件商品中随机抽取2件送到专业质检机构组进行最终质检分析,求抽取的这2件商品中至少有1件为二等品的概率.

P(K2 k0) 0.100 0.050 0.010 0.005
k0 2.706 3.841 6.635 7.879
【答案】(1)没有90%的把握认为商品为一等品与加工工厂有关;
(2).
【解答】解:(1)由题意得列联表如下:
一等品 非一等品 合计
甲 70 30 100
乙 60 40 100
合计 130 70 200
因为,
所以没有90%的把握认为商品为一等品与加工工厂有关;
(2)在抽取的商品中,二等品与三等品之比为4:3,所以二等品抽了4件,三等品抽了3件,
所以抽取的这2件商品中均为三等品的概率为,
则取的这2件商品中至少有1件为二等品的概率为1.
【模拟05】(2024 汉中模拟)2024年03月04日《人民日报》发表文章《开展全民健身实现全民健康》,文中提到:体育锻炼要从小抓起.“让孩子们跑起来”“要长得壮壮的、练得棒棒的”“体育锻炼是增强少年儿童体质最有效的手段”…习近平总书记的殷殷嘱托,牢牢印刻在广大教育工作者和孩子们的心中.某学校为了了解学生体育锻炼的情况,随机抽取了n名同学,统计了他们每周体育锻炼的时间,作出了频率分布直方图如图所示.其中体育锻炼时间在(4,6]内的人数为50人.
(1)求n及a的值(a的取值保留三位小数);
(2)估计该校学生每周体育锻炼时间的平均值(同一组中的数据用该组区间的中点值作代表);
(3)我们把每周体育锻炼时间超过8小时的学生称为“运动达人”,为了了解“运动达人”与性别是否有关系,我们对随机抽取的n名学生的性别进行了统计,得到如下2×2列联表:
非运动达人 运动达人 总计
男生 30
女生 70
总计
补全2×2列联表,并判断能否有90%的把握认为成为“运动达人”与性别有关?
附:
P(K2≥k) 0.100 0.050 0.025 0.010
k 2.706 3.841 5.024 6.635
【答案】(1)a=0.200,n=200;
(2)6.8小时;
(3)没有90%的把握认为成为“运动达人”与性别有关.
【解答】解:(1)根据频率和为1,列方程得(0.050+0.125+a+0.075+0.050)×2=1,解得a=0.200,
由频率分布直方图知,体育锻炼时间在(4,6]内的频率为0.125×2=0.25,
所以n200;
(2)利用频率分布直方图,计算3×0.1+5×0.25+7×0.4+9×0.15+11×0.1=6.8,
估计该校学生每周体育锻炼时间的平均值为6.8小时;
(3)每周体育锻炼时间超过8小时的频率为(0.075+0.050)×2=0.25,
所以“运动达人”有200×0.25=50(人),“非运动达人”有150人,填写2×2列联表如下:
非运动达人 运动达人 总计
男生 80 30 110
女生 70 20 90
总计 150 50 200
计算K20.6734<2.706,
所以没有90%的把握认为成为“运动达人”与性别有关.

展开更多......

收起↑

资源列表