【数学总复习-考点精讲】RJA 第十章 第2讲 用样本估计总体 学案(含解析)

资源下载
  1. 二一教育资源

【数学总复习-考点精讲】RJA 第十章 第2讲 用样本估计总体 学案(含解析)

资源简介

中小学教育资源及组卷应用平台
第2讲 用样本估计总体
考向预测 核心素养
利用样本的均值、方差估计总体的集中趋势和离散程度是高考考查的热点,以客观题为主,中低难度. 数据分析
一、知识梳理
1.总体百分位数的估计
(1)百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)百分位数的意义
反映该组数中小于或等于该百分位数的分布特点.
2.总体集中趋势的估计
名称 概念
平均数 如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)就是这组数据的平均数,用表示,即=(x1+x2+…+xn) 
中位数 将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)叫做这组数据的中位数
众数 一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)叫做这组数据的众数
3.总体离散程度的估计
总体(样本)方差和总体(样本)标准差
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,那么这n个数的
(1)标准差
s=eq \r(\f(1,n)[(x1-)2+(x2-)2+…+(xn-)2]);
(2)方差
s2=[(x1-)2+(x2-)2+…+(xn-)2].
4.分层随机抽样的均值与方差
分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为,样本方差为s2.
以分两层抽样的情况为例.假设第一层有m个数分别为x1,x2,…,xm,平均数为,方差为s;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为s.则=i,s=(xi-)2,=i,s=(yi-)2.
则(1)=+;
(2)s2={m[s+(-)2]+n[s+(-)2]}.
常用结论
1.若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+a;
2.若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2;
3.s2= (xi-)2=x-2,即各数平方的平均数减去平均数的平方.
二、教材衍化
1.(人A必修第二册P202例2改编)一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,则该组数据的第75百分位数为________,第86百分位数为________.
2.(人A必修第二册P212例6改编)为调查高一年级学生期中考试数学成绩的情况,从(1)班抽取了12名学生的成绩,他们的平均分为91分,方差为3,从(2)班抽取了8名学生的成绩,他们的平均分为89分,方差为5,则合在一起后的样本均值为________,样本方差为________.
参考答案
1解析:因为75%×20=15,
所以第75百分位数为=14.5.
因为86%×20=17.2,
所以第86百分位数为第18个数据17.
答案:14.5 17
2解析:样本均值==90.2,
样本方差s2=
=4.76.
答案:90.2 4.76
一、思考辨析
判断正误(正确的打“√”,错误的打“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.(  )
(2)方差和标准差的单位是一样的.(  )
(3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.(  )
二、易错纠偏
1.(统计量意义作用不清致误)某鞋店试销一款新女鞋,销售情况如下表:
鞋号/码 34 35 36 37 38 39 40 41
数量/双 2 5 9 16 9 5 3 2
如果你是鞋店经理,那么下列统计量中对你来说最重要的是(  )
A.平均数   B.众数
C.中位数 D.方差
2.(平均数、方差含义不明致误)如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则(  )
A.A>B,sA>sB B.AsB
C.A>B,sA3.(分层随机抽样所得样本的均值方差公式记忆不准致误)某学校有高中学生500人.其中男生320人,女生180人.希望获得全体高中生身高的信息,按照分层随机抽样原则抽取样本,男生样本量为32,女生样本量为18,通过计算男生身高样本均值为173.5 cm,方差为17;女生身高样本均值为163.83 cm,方差为30.03,则所有数据的样本均值为________cm,方差为________.
参考答案
一、思考辨析
答案:(1)× (2)× (3)√
二、易错纠偏
1解析:选B.鞋店经理最关心的是哪种鞋号的鞋销量最大,即数据的众数.
2解析:选B.观察题图可得样本A的数据均小于或等于10,样本B的数据均大于或等于10,故AsB.
3解析:由题意得=×173.5+×163.83≈170.02(cm),
s2=×{[32×17+32×(173.5-170.02)2]+[18×30.03+18×(163.83-170.02)2]}≈43.24.
答案:170.02 43.24
考点一 总体取值规律和百分位数的估计(自主练透)
复习指导:通过样本数据或统计图表可对总体取值规律和百分位数进行估计.
1.如图所示是某年第一季度五省GDP情况图,则下列说法中不正确的是(  )
A.该年第一季度GDP增长率由高到低排位第3的是山东省
B.该年第一季度浙江省的GDP总量最低
C.该年第一季度GDP总量和增长率由高到低排位均居同一位次的省份有2个
D.与去年同期相比,该年第一季度的GDP总量实现了增长
2.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
3.下表为12名毕业生的起始月薪:
毕业生 起始月薪 毕业生 起始月薪
1 2 850 7 2 890
2 2 950 8 3 130
3 3 050 9 2 940
4 2 880 10 3 325
5 2 755 11 2 920
6 2 710 12 2 880
则此12名毕业生起始月薪的第85百分位数是________.
参考答案
1解析:选B.由题图可知A,D项均正确,该年第一季度GDP总量和增长率由高到低排位均居同一位的省份有江苏均第一,河南均第四,共2个,故C项正确;该年浙江省的GDP增长率最低.故B项不正确.故选B.
2解析:底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24.
答案:24
3解析:将12个数据按从小到大排序:2 710,2 755,2 850,2 880,2 880,2 890,2 920,2 940,2 950,3 050,3 130,3 325.
计算i=12×85%=10.2,
所以所给数据的第85百分位数是第11个数据3 130.
答案:3 130
(1)计算一组数据第p百分位数的步骤
(2)应用统计图表或样本数据提取关键信息,对总体取值规律作出估计,可培养数据分析的核心素养.
考点二 总体集中趋势的估计(综合研析)
复习指导:众数、平均数、中位数等可以用来估计总体集中趋势.
(1)(2022·江西景德镇一中7月月考)为了解果树树苗的生长情况,现从甲、乙两个品种中各随机抽取了100株进行高度(单位:cm)测量,并将高度数据制成了如图所示的频率分布直方图.由频率分布直方图求得甲、乙两个品种树苗高度的平均值都是65.5,用样本估计总体,则下列描述正确的是(  )
A.甲品种的平均高度高于乙品种,但乙品种比甲品种长得整齐
B.乙品种的平均高度高于甲品种,但甲品种比乙品种长得整齐
C.甲、乙品种的平均高度差不多,且甲品种比乙品种长得整齐
D.甲、乙品种的平均高度差不多,且乙品种比甲品种长得整齐
(2)统计局就某地居民的月收入(单位:元)情况调查了10 000人,并根据所得数据画出了频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[2 500,3 000)内.
①估计该地居民的月收入的中位数为________,众数为________.
②估计该地居民月收入的平均数为________.
【解析】 (1)由题可知,甲、乙两个品种高度的平均值相同,均为65.5,即甲、乙品种的平均高度差不多,从频率分布直方图可以看出乙品种比甲品种高度更集中,长得更整齐,故选D.
(2)①由题图得,(0.000 2+0.000 4+a+a+0.000 3+0.000 1)×500=1,解得a=0.000 5.因为0.000 2×500=0.1,0.000 4×500=0.2,0.000 5×500=0.25,0.1+0.2+0.25=0.55>0.5,
所以样本数据的中位数是3 500+=3 900.
因此估计该地居民月收入的中位数是3 900元.
在频率分布直方图中,众数是最高矩形底边中点的横坐标,
所以众数应为=4 000.
②样本平均数为(2 750×0.000 2+3 250×0.000 4+3 750×0.000 5+4 250×0.000 5+4 750×0.000 3+5 250×0.000 1)×500=3 900,
因此估计该地居民月收入的平均数为3 900元.
【答案】 (1)D (2)①3 900 4 000 ②3 900
估计总体集中趋势的几个数字特征
(1)中位数、众数分别反映了一组数据的“中等水平”“多数水平”,平均数反映了数据的平均水平,我们需要根据实际需要选择使用.
(2)频率分布直方图的数字特征
①众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标;
②中位数:在频率分布直方图中,中位数左边和右边的直方图的面积和应该相等;
③平均数:平均数在频率分布表中等于组中值与对应频率之积的和,即在频率分布直方图中,每个小矩形的面积乘以小矩形底边中点的横坐标之和.
|跟踪训练|
1.从某小学随机抽取100名同学,将他们的身高(单位:厘米)分布情况汇总如下:
身高 [100,110) [110,120) [120,130) [130,140) [140,150]
频数 5 35 30 20 10
由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)(  )
A.119.3          B.119.7
C.123.3 D.126.7
2.(多选)(2022·辽宁新高考名校5月联考)某大学共有12 000名学生,为了了解学生课外图书阅读情况,该校随机地从全校学生中抽取1 000名,统计他们年度阅读书籍的数量,并制成如图所示的频率分布直方图,由此来估计全体学生年度阅读书籍的情况.下列说法中不正确的是(注:同一组数据用该组区间的中点值作为代表)(  )
A.该校学生年度阅读书籍本数的中位数为6
B.该校学生年度阅读书籍本数的众数为10
C.该校学生年度阅读书籍本数的平均数为6.88
D.该校学生年度读书不低于8本的人数约为3 600
参考答案
1解析:选C.由题意知身高在[100,110),[110,120),[120,130)内的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x,则(x-120)×=0.1,解得x≈123.3.故选C.
2解析:选ABD.对于A:由题图可知,中位数在[4,8)内,设中位数为x,则0.06×4+0.10×(x-4)=0.5,解得x=6.6,故A错误.对于B:由题图可知,众数在[4,8)内,故B错误.对于C:平均数为4×(2×0.06+6×0.1+10×0.07+14×0.015+18×0.005)=6.88,故C正确.对于D:由题图可知,该校抽取的学生年度读书不低于8本的频率之和为1-0.16×4=0.36,所以该校学生年度读书不低于8本的人数约为0.36×12 000=4 320,D错误.故选ABD.
考点三 总体离散程度的估计(综合研析)
复习指导:通过方差、标准差等数字特征可对总体离散程度进行估计.
某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组 [-0.20,0) [0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80]
企业数 2 24 53 14 7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
【解】 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.
产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=ni(yi-)2
=×[(-0.40)2×2+(-0.20)2×24+02×53+
0.202×14+0.402×7]
=0.029 6,
s==0.02×≈0.17.
所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
总体离散程度的估计
标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.
|跟踪训练|
1.(多选)为了比较甲、乙两地某月14时的气温情况,随机抽取了该月中的5天,将这5天中14时的气温数据(单位:℃)列表如下:
甲 26 28 31 29 31
乙 28 30 29 31 32
以下结论正确的是(  )
A.甲地该月14时的平均气温低于乙地该月14时的平均气温
B.甲地该月14时的平均气温高于乙地该月14时的平均气温
C.甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差
D.甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差
2.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:
甲 乙 丙 丁
平均环数 8.3 8.8 8.8 8.7
方差s2 3.5 3.6 2.2 5.4
从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是________.
参考答案
1解析:选AD.方法一:因为甲==29,
乙==30,
所以甲<乙,
又s==,
s==2,
所以s甲>s乙.
故可判断结论AD正确.
方法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论AD正确.
2解析:由题表中数据可知,乙、丙的平均环数最高,但丙方差最小,说明技术稳定,且成绩好.
答案:丙
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://www.21cnjy.com/" 21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源预览