第2讲 用样本估计总体 讲义——2026届高三数学一轮复习

资源下载
  1. 二一教育资源

第2讲 用样本估计总体 讲义——2026届高三数学一轮复习

资源简介

〖知识梳理〗
1、用样本的数字特征估计总体
(1)平均数:如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn),简记为=xi .
(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的一个数据(或两个数据的平均数).
(3)众数:一组数据中,出现次数最多的数据.
(4)百分位数
①定义:一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有%的数据小于或等于这个值,且至少有(100-)%的数据大于或等于这个值.
②计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
③四分位数:第25百分位数,第50百分位数,第75百分位数.其中:第25百分位数又称第一四分位数或下四分位数,第75百分位数又称第三四分位数或上四分位数.
(5)方差和标准差
如果x1,x2,…,xn的平均数为,则其方差s2=(xi-)2=-,标准差s=.
注:方差越大,说明数据的离散程度或波动幅度越大,反之数据越集中,其单位是原始数据单位的平方.
重要性质:若数据x1,x2,…,xn的平均数为,方差为s2,则数据yi=axi+b(i=1,2,…,n,a,b∈R)的平均数=a+b,方差为a2s2.
2、用样本的频率分布估计总体
(1)众数:最高的小矩形底边中点的横坐标.
(2)中位数:从左侧开始满足小矩形面积和为0.5的横坐标的值;根据百分位数的定义,求第p百分位数同样转化为从左侧求小矩形的累计面积和满足的条件.
(3)平均数:每个小矩形底边中点的横坐标与对应频率的积的和.
〖例题讲解〗
题型一 样本的数字特征的求解与应用
例1
(1)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)都在[900,1200)内,并整理得到下表:
亩产量 [900, 950) [950, 1000) [1000, 1050) [1050, 1100) [1100, 1150) [1150, 1200)
频数 6 12 18 30 24 10
根据表中数据,下列结论正确的是(  )
A.100块稻田亩产量的中位数小于1050 kg
B.100块稻田中亩产量低于1100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg到300 kg之间
D.100块稻田亩产量的平均值介于900 kg到1000 kg之间
(2)(多选题)已知一组数据12,31,24,33,22,35,45,25,16,若去掉12和45,则剩下的数据与原数据相比,下列结论正确的是(  )
A.中位数不变
B.平均数不变
C.方差不变
D.第40百分位数不变
(3)(多选题)今年,被称为“村超”的贵州榕江县“和美乡村足球超级联赛”,使榕江成为网络顶流,刷爆各大网络平台,更吸引了大量游客到赛事举办地观赛游玩,为更好地发展当地的旅游业,政府随机调查了18个旅游团对榕江县旅游满意度的综合评分情况,得到如下数据:
,80,81,80,82,83,84,84,85,86,87,89,90,93,95,97,95,100.若a恰好是这组数据的上四分位数,则的值可能为( )
A.93 B.94 C.95 D.96
(4)数据1,2,3,4,5,6的60%分位数为( )
A.3 B.3.5 C.3.6 D.4
题型二 样本的频率分布估计总体
例2
(1)(多选题)青少年是国家的未来和民族的希望,国家不断出台相关政策法规,引导广大青少年积极参与体育健身.近年来,随着政策措施牵引带动,学生体质与健康水平不断迈上新台阶.某学校共有2000名男生,为了了解这部分学生的身体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论正确的是(  )
A.样本的众数为67.5
B.样本的80%分位数为72.5
C.样本的平均值为66
D.估计该校男生中体重低于60 kg的学生有300人
(2)某市为了解新高三学生的数学学习情况,以便为即将展开的一轮复习提供准确的数据,在开学初该市教体局组织高三学生进行了一次摸底考试,现从参加考试的学生中随机抽取200名,根据统计结果,将他们的数学成绩(满分150分)分为[70,80),[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]共8组,得到如图所示的频率分布直方图.
利用所给数据估计本次数学考试成绩的平均数及方差(各组数据以其中点值作代表).
参考数据:
(x1-)2=998.56,(x2-)2=466.56,(x3-)2=134.56,(x4-)2=2.56,(x5-)2=70.56,(x6-)2=338.56,(x7-)2=806.56,
(x8-)2=1 474.56,其中xi(i=1,2,…,8)为第i组数据的中点值.
题型三 总体离散程度的估计
例3
(1)为了测试小班教学的实践效果,刘老师对、两班的学生进行了阶段测试,并将所得成绩统计如图所示;记本次测试中,、两班学生的平均成绩分别为,,、两班学生成绩的方差分别为,,则观察茎叶图可知( )
A., B.,
C., D.,
(2)已知样本数据由小到大依次为2,3,3,7,,,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则,的值分别为( )
A.10,11 B.10.5,9.5 C.10.4,10.6 D.10.5,10.5
(3)已知数据的平均数为,方差为,则,,…,的平均数和方差分别为( )
A.和 B.和 C.和 D.和
〖课堂练习〗
1.已知数据1,2,2,3,4,5,6,6,7,8的中位数为m,60%分位数为a,则m=    ,a=    .
2.从某小区抽取100户居民进行月用电量调查,发现他们的月用电量都在50~350 kW·h之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.
(1)直方图中x的值为    ;
(2)在被调查的用户中,月用电量落在区间[100,250)内的户数为    .
3.甲、乙、丙、丁四人参加运动会射击项目选拔赛,四人的平均环数和方差如下表所示:
甲 乙 丙 丁
平均环数 8.5 8.8 8.8 8
方差s2 3.5 3.5 2.1 8.5
则参加运动会的最佳人选应为    .
4.某校举行了一次知识竞赛,满分10分,有10名学生代表班级参加比赛,已知学生得分均为整数,比赛结束后统计得这10名学生得分情况的折线图,如图所示,则这10名学生得分的极差为    ,80%分位数是    .
5.某班全体学生参加物理测试成绩(单位:分)的频率分布直方图如图所示,则估计该班物理测试成绩的众数、中位数、平均数分别是    、    、    .
6.已知x1,x2,…,xn的平均数为10,标准差为2,则2x1-1,2x2-1,…,2xn-1的平均数和标准差分别为    和    .
〖反馈练习〗
1.某鞋店试销一种新款女鞋,销售情况如下表:
鞋号 34 35 36 37 38 39 40 41
日销量/双 2 5 9 16 9 5 3 2
如果你是鞋店经理,那么下列统计量中对你来说最重要的是(  )               
A.平均数 B.众数 C.中位数 D.极差
2.某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图(如图所示),则a的值为 (  )
A.0.20 B.0.040 C.0.020 D.0.015
3.为全面普及无人机知识,激发青少年探索航空的创造力与想象力,提升青少年科学素养和创新能力,培养航空后备人才,某省将于2025年4月中旬举办青少年无人机大赛.某校在校内进行选拔赛,10名学生成绩依次为85,105,75,100,90,95,85,90,80,95,则这组数据的60%分位数为(  )
A.90 B.92.5 C.85 D.95
4.某地区中午11时到夜里23时的气温分布如图所示,关于这5个时刻的温度,以下说法错误的是(  )
A.5个时刻温度的极差为7
B.5个时刻温度的中位数为9
C.平均温度为5 ℃
D.下午17时温度最高
5.(多选题)在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则下列说法错误的是(  )
A.成绩在[70,80)的考生中,甲班人数多于乙班人数
B.甲班考生成绩在[80,90)内人数最多
C.乙班考生成绩在[70,80)内人数最多
D.甲班考生成绩的极差比乙班考生成绩的极差小
6.某大学有男生2000名,为了解该校男生的体重情况,随机抽查了该校100名男生的体重,并将这100名男生的体重(单位:kg)按[54,58),[58,62),[62,66),[66,70),[70,74),[74,78]分成六组,绘制成如图所示的频率分布直方图,则估计该校体重(单位:kg)在区间[70,78]内的男生有     人.
7.如图所示的频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成右边“拖尾”形态,图(3)形成左边“拖尾”形态,根据所给图作出以下判断,其中正确的是     .(填序号)
①图(1)的平均数=中位数=众数;
②图(2)的众数<中位数<平均数;
③图(2)的众数<平均数<中位数;
④图(3)的平均数<中位数<众数.
8.某部门30名员工一年中请假天数(未请假则请假天数为0)与对应人数的柱形图(图中只有请假天数为0的未显示)如图所示,则下列说法错误的为(  )
A.该部门一年中请假天数为0的人数为10
B.该部门一年中请假天数大于5的人数为10
C.这30名员工一年中请假天数的第40百分位数为4
D.这30名员工一年中请假天数的平均数小于4
9.如图为某同学两次月考成绩占总成绩百分数的扇形统计图,已知该同学第一次月考总分低于第二次月考总分,则(  )
A.该同学数学学科成绩一定下降
B.该同学政治学科成绩一定下降
C.该同学化学学科成绩可能下降
D.该同学语文学科成绩一定提升
10.(多选题)中秋节起源于上古时代,普及于汉代,定型于唐朝初年,如今已成为中华民族弥足珍贵的文化遗产.某校举行与中秋节相关的“中国传统文化”知识竞赛,随机抽取了100人的成绩整理后得到如图所示的频率分布直方图,则下列结论正确的是(  )
A.样本的众数估计为75
B.样本的71%分位数估计为75
C.样本的平均值估计为68.5
D.估计该校学生中得分低于60分的占20%
11.(多选题)国家统计局统计了2024年1月全国多个大中城市二手住宅销售价格的分类指数,其中北方和南方各4个城市的90 m2及以下二手住宅销售价格的环比数据如下:
北方城市 环比(单位:%,上月=100) 南方城市 环比(单位:%,上月=100)
北京 99.5 上海 99.5
天津 99.6 南京 99.5
石家庄 99.6 南昌 99.6
沈阳 99.7 福州 99.8
则(  )
A.4个北方城市的环比数据的极差小于4个南方城市的环比数据的极差
B.4个北方城市的环比数据的均值小于4个南方城市的环比数据的均值
C.4个北方城市的环比数据的方差大于4个南方城市的环比数据的方差
D.4个北方城市的环比数据的中位数大于4个南方城市的环比数据的中位数
12.若一组数据4x1,4x2,…,4x12的中位数为16,方差为64,则另一组数据x1-1,x2-1,…,x12-1的中位数为    ,方差为    .
13.若实数x,y(4≤x14.某新能源汽车配件厂生产一种新能源汽车精密零件,为提高产品质量引入了一套新生产线,为检验新生产线所生产出来的零件质量有无显著提高,现同时用旧生产线和新生产线各生产了10个零件,得到各个零件的质量指标的数据如下:
旧生产线 5.2 4.8 4.8 5.0 5.0 5.2 5.1 4.8 5.1 5.0
新生产线 5.0 5.2 5.3 5.1 5.4 5.2 5.2 5.3 5.2 5.1
设旧生产线和新生产线所生产零件的质量指标的样本平均数分别为和,样本方差分别为和.
(1)求,及;
(2)若-≥,则认为新生产线生产零件的质量有显著提高,否则不认为有显著提高,现计算得=0.022,试判断新生产线生产的零件质量较旧生产线生产的零件质量是否有显著提高.
15.学校为提升高一年级学生自主体育锻炼的意识,拟将每周自主体育锻炼的时间不低于6小时的同学称为“体育迷”并予以奖励,为了确定奖励方案,先对学生自主体育锻炼的情况进行抽样调查,学校从高一年级随机抽取100名学生,将他们分为男生组、女生组,对每周自主体育锻炼的时间(单位:小时)分段进行统计.第一段[0,2),第二段[2,4),第三段[4,6),第四段[6,8),第五段[8,10].将男生在各段的频率及女生在各段的频数用折线图表示如下:
(1)求折线图中m的值,并估计该校高一年级学生中“体育迷”所占的比例;
(2)若中学生每周自主体育锻炼的时间不低于5小时,才能保持身体的健康发展,试估计该校高一年级学生的周平均自主体育锻炼时间是否达到保持身体健康发展的水平 (同一段中的数据用该组区间的中点值为代表)
参考答案
1.B [解析] 鞋店经理最关心的是哪个鞋号的日销量最大,所以最重要的是众数.故选B.
2.C [解析] 由频率分布直方图可知,0.1+10a+0.45+10a+0.05=20a+0.6=1,解得a=0.020.故选C.
3.B [解析] 10名学生成绩从低到高依次为75,80,85,85,90,90,95,95,100,105,且10×60%=6,故60%分位数为第6个数和第7个数的平均数=92.5.故选B.
4.B [解析] 由图可知,5个时刻温度的极差为9-2=7,故A中说法正确;中位数为4,故B中说法错误;平均温度为×(2+3+4+7+9)=5(℃),故C中说法正确;比较几个数值可知下午17时温度最高,故D中说法正确.故选B.
5.ACD [解析] 对于A,由图知,每一组中的成绩占比都是以各自班级的总人数为基数的,所以每一组中的甲班、乙班人数不能从所占的百分比来判断,故A中说法错误;对于B,C,由图可知甲班考生成绩主要集中在[80,90),乙班考生成绩主要集中在[60,70),故B中说法正确,C中说法错误;对于D,由图可知甲班考生成绩的极差和乙班考生成绩的极差的大小无法确定,故D中说法错误.故选ACD.
6.240 [解析] 由频率分布直方图估计,该校体重(单位:kg)在区间[70,78]内的男生的人数为2000×(0.02+0.01)×4=240.
7.①②④ [解析] 图(1)的频率分布直方图是对称的,所以平均数=中位数=众数,故①正确;图(2)众数最小,右边“拖尾”平均数大于中位数,故②正确,③错误;图(3)左边“拖尾”众数最大,平均数小于中位数,故④正确.故填①②④.
8.B [解析] 对于A,该部门一年中请假天数为0的人数为30-6-3-4-4-3=10,A中说法正确.对于B,该部门一年中请假天数大于5的人数为4+4+3=11,B中说法错误.对于C,因为30×40%=12,且请假天数为0的人数为10,请假天数为4的人数为6,所以这30名员工一年中请假天数的第40百分位数为4,C中说法正确.对于D,这30名员工一年中请假天数的平均数为×(4×6+5×3+6×4+7×4+8×3)=<4,D中说法正确.故选B.
9.D [解析] 对于A,第一次月考数学成绩占16%,第二次月考数学成绩占17%,且第一次月考总分低于第二次月考总分,所以第二次月考数学成绩比第一次月考数学成绩要高,故A错误;对于B,第一次月考政治成绩占17%,第二次月考政治成绩占16%,由于只知道第一次月考总分低于第二次月考总分,故无法判断这两次月考政治学科成绩的变化,故B错误;对于C,第一次月考化学成绩占16%,第二次月考化学成绩占17%,且第一次月考总分低于第二次月考总分,所以第二次月考化学成绩比第一次月考化学成绩要高,故C错误;对于D,第一次月考语文成绩占16%,第二次月考语文成绩占18%,且第一次月考总分低于第二次月考总分,所以第二次月考语文成绩比第一次月考语文成绩要高,故D正确.故选D.
10.AC [解析] 依题意,(0.015+0.025+0.035+0.005+2a)×10=1,解得a=0.010.对于A,∵最高小矩形的中点的横坐标为75,∴估计众数是75,故A正确.对于B,设样本的71%分位数为x,又10×(0.010+0.015+0.025)=0.5,∴0.5+(x-70)×0.035=0.71,解得x=76,故B错误.对于C,估计平均数为45×0.1+55×0.15+65×0.25+75×0.35+85×0.1+95×0.05=68.5,故C正确.对于D,样本中得分低于60分的占(0.010+0.015)×10×100%=25%,∴估计该校学生中得分低于60分的占25%,故D错误.故选AC.
11.AD [解析] 对于A,4个北方城市的环比数据的极差为99.7-99.5=0.2,4个南方城市的环比数据的极差为99.8-99.5=0.3,所以4个北方城市的环比数据的极差小于4个南方城市的环比数据的极差,故A正确;对于B,4个北方城市的环比数据的均值为=99.6,4个南方城市的环比数据的均值为=99.6,所以4个北方城市的环比数据的均值与4个南方城市的环比数据的均值相等,故B错误;对于C,4个北方城市的环比数据的方差为×[(99.5-99.6)2+(99.6-99.6)2+(99.6-99.6)2+(99.7-99.6)2]=0.005,4个南方城市的环比数据的方差为×[(99.5-99.6)2+(99.5-99.6)2+(99.6-99.6)2+(99.8-99.6)2]=0.015,所以4个北方城市的环比数据的方差小于4个南方城市的环比数据的方差,故C错误;对于D,4个北方城市的环比数据的中位数为99.6,4个南方城市的环比数据的中位数为=99.55,所以4个北方城市的环比数据的中位数大于4个南方城市的环比数据的中位数,故D正确.故选AD.
12.3 4 [解析] 因为数据4x1,4x2,…,4x12的中位数为16,方差为64,所以数据x1,x2,…,x12的中位数为4,方差为=4,所以数据x1-1,x2-1,…,x12-1的中位数为4-1=3,方差为4.
13. [解析] 根据题意,数据1,3,4,x,y,y+2的平均数为,数据1,3,4,x,y,y+2的50%分位数为,∴=,即y=x+1,代入数据x,y,y+2,即为x,x+1,x+3,此组数据的平均数为=x+,∴数据x,y,y+2的方差为=×=.
14.解:(1)由题意得=×(5.2+4.8+4.8+5.0+5.0+5.2+5.1+4.8+5.1+5.0)=5.0,=×(5.0+5.2+5.3+5.1+5.4+5.2+5.2+5.3+5.2+5.1)=5.2,=×(4×0.12+2×0.22)=0.012.
(2)由(1)可得-=5.2-5.0=0.2=,==,因为>,所以-≥成立,故新生产线生产的零件质量较旧生产线生产的零件质量有显著提高.
15.解:(1)由男生自主体育锻炼时间的频率折线图可得,m=1-0.04-0.20-0.24-0.16=0.36.
由女生自主体育锻炼时间的频数折线图可知,女生共有1+4+5+12+3=25(人),其中“体育迷”有12+3=15(人),
故男生共有100-25=75(人),其中“体育迷”有75×(0.24+0.16)=30(人),因此估计该校高一年级学生中“体育迷”所占比例为×100%=45%.
(2)由折线图可知,男生自主体育锻炼时间在第一段至第五段的频数分别为75×0.04=3,75×0.20=15,75×0.36=27,75×0.24=18,75×0.16=12,故这100名学生每周的自主体育锻炼时间在第一段至第五段的频率分别为(1+3)÷100=0.04,(4+15)÷100=0.19,(5+27)÷100=0.32,(12+18)÷100=0.30,(3+12)÷100=0.15,所以估计该校高一年级学生的周平均自主体育锻炼时间为1×0.04+3×0.19+5×0.32+7×0.30+9×0.15=5.66.
因为5.66>5,所以估计该校高一年级学生的周平均自主体育锻炼时间达到了保持身体健康发展的水平.

展开更多......

收起↑

资源预览