高三一轮总复习高效讲义第九章第2节 用样本估计总体 学案(Word版含答案)

资源下载
  1. 二一教育资源

高三一轮总复习高效讲义第九章第2节 用样本估计总体 学案(Word版含答案)

资源简介

第二节 用样本估计总体 
[课标要求] ①结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义;②结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义;③结合实例,能用样本估计总体的取值规律;④结合实例,能用样本估计百分位数,理解百分位数的统计含义.
 备考第1步——梳理教材基础,落实必备知识
1.总体集中趋势的估计
数字特征 概念 优点与缺点
众数 一组数据中出现次数最多的数 众数通常用于描述变量的值出现次数最多的数,但显然它对其他数据信息的忽视使它无法客观地反映总体特征
中位数 把一组数据按从小到大顺序排列,处在中间位置的一个数据(或两个数据的平均数) 中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数 如果有n个数据x1,x2,…,xn,那么这n个数的平均数x= 平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
2.总体百分位数的估计
(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)意义:反映该组数中小于或等于该百分位数的分布特点.
3.总体离散程度的估计
(1)假设一组数据是x1,x2,…xn,用x表示这组数据的平均数,那么这n个数的
①标准差
s=
②方差
s2=[(x1-x)2+(x2-x)2+(x2-x)2+…(xn-x)2].
(2)分层随机抽样的均值与方差
分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为ω,样本方差为s2.
以分两层抽样的情况为例.假设第一层有m个数分别为x1,x2,…,xm,平均数为x,方差为s;第二层有n个数,分别为y1,y2,…,yn,平均数为y,方差为s.则x=xi.
s=(xi-x)2,y=yi,s=(yi-y)2.
则①ω=x+y;
②s2={m[s+(x-ω)2]+n[s+(y-ω)2]}.
(一)必背常用结论
1.简单随机抽样样本平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
2.分层随机抽样样本均值、方差的计算公式的推广
如果将总体分为k层,第j层抽取的样本为xj1,xj2,…,xjn,第j 层的样本量为nj,样本均值为xj,样本方差为s,j=1,2,…,k.记nj=n,所有数据的样本均值ω和方差s2为:ω=,s2==[s+(xj-x)2].
(二)盘点易错易混
1.求总体百分位数时对定义把握不准致错,如求得i的值,需分i为整数及非整数确定百分位数.
2.求中位数等百分位数时,一定要先对数据进行大小排序,还要注意数字的个数.
3.在频率分布直方图中求中位数或百分位数时,容易因方法不当出错.
4.应用平均数与方差的性质解题时因对性质不理解致错.
【小题热身】
1.某机构调查了解10种食品的卡路里含量,结果如下:107,135,138,140,146,175,179,182,191,195.则这组数据的第25百分位数和中位数分别是(  )
A.138,160.5 B.138,146
C.138,175 D.135,160.5
解析:将10个数按从小到大排列:107,135,138,140,146,175,179,182,191,195,而10×25%=2.5,为第3项138;中位数为=160.5.
答案:A
2.某校为增强学生垃圾分类的意识,举行了一场垃圾分类知识问答测试,满分为100分.如图所示的茎叶图为某班20名同学的测试成绩(单位:分).则这组数据的极差和众数分别是(  )
A.20,88 B.30,8
C.20,82 D.30,91
解析:由茎叶图中的数据可得:最高成绩为98分,最低成绩为68分,所以极差为98-68=30,又由数据的众数的概念,可得数据的众数为88分.
答案:B
3.(多选)(2021·新高考全国卷Ⅱ)下列统计量中,能度量样本x1,x2,…,xn的离散程度的是(  )
A.样本x1,x2,…,xn的标准差
B.样本x1,x2,…,xn的中位数
C.样本x1,x2,…,xn的极差
D.样本x1,x2,…,xn的平均数
解析:由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势.
答案:AC
4.某大学艺术专业的400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据按[20,30),[30,40),…,[80,90]分成7组,并整理得到如图所示的频率分布直方图.
估计总体的众数为________.
解析:众数为频率分布直方图最高矩形的中点横坐标,可估计为=75.
答案:75
5.(多选)已知数据1:x1,x2,…,xn,数据2:2x1-1,2x2-1,…,2xn-1,则下列统计量中,数据2是数据1的两倍的有(  )
A.均值 B.极差 C.方差 D.标准差
解析:设数据1:x1,x2,…,xn的均值为x,标准差为s,极差为R=xmax-xmin,则数据2:2x1-1,2x2-1,…,2xn-1的均值为2x-1,方差为4s2,所以选项A,C错误;数据2的标准差为=2s,极差为(2xmax-1)-(2xmin-1)=2(xmax-xmin)=2R,所以选项B,D正确.
答案:BD
 备考第2步——突破核心考点,提升关键能力
考点1__总体百分位数的估计[多维讲练]
计算第p百分位数是新教材增加的内容,也势必会成为考试的热点,主要有两种类型:一是给出一组数据计算第p百分位数,需注意先按大小排序,再根据公式计算;另一类是在频率分布直方图中计算第p百分位数.题型多为选择或填空题,难度不大.
角度1 计算一组数据的第p百分位数
【例1】 从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,50,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品,合格品、优先品和特优品,依照这个样本的数据,给出该公司珍珠的划分标准.
解析:(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,则第25百分位数是=8.15,则第50百分位数是=8.5,则第95百分位数是第12个数据9.9.
(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.
(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
[思维升华] 计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
[对点练] 1.(2021·天津河东模拟)某次能力测试中,10人的成绩统计如表,则这10人成绩的20%分位数为________.
分数 5 4 3 2 1
人数(单位:人) 3 1 2 1 3
解析:将10人的成绩按照从小到大的顺序排列,得1,1,1,2,3,3,4,5,5,5,10×20%=2,故这10人成绩的20%分位数为=1.
答案:1
角度2 根据频率分布直方图计算样本数据的百分位数
【例2】 对某种电子元件使用寿命跟踪调查,所得样本的频率分布直方图如图.由图可知,这一批电子元件中寿命的65%分位数为(  )
A.500 h B.450 h
C.350 h D.550 h
解析:由频率分布直方图得[0,400)的频率为:×100=0.45,[0,500)的频率为:×100=0.85,所以65%分位数位于[400,500)之间,设65%分位数为x,则×100+(x-400)×=0.65,解得x=450.∴由图可知,这一批电子元件中寿命的65%分位数为450 h.
答案:B
[思维升华]1.根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的含义,其次估计百分位数在哪一组,再应用公式求解.
2.确定要求第p百分位数所在分组[A,B),由频率分布表或频率分布直方图可知,样本中小于A的频率为a,小于B的频率为b,所以第p百分位数=A+组距×.
[对点练] 2.某公司计划招收500名新员工,共报名了2 000人,远超计划,故该公司采用笔试的方法进行选拔,并按照笔试成绩择优录取.现采用随机抽样的方法抽取200名报名者的笔试成绩,绘制频率分布直方图如下:
则录取分数线可估计为(  )
A.70.5  B.72.5  C.75.5  D.77.5
解析:=0.25.因此75%的人不能录取.
由频率分布直方图得70分以下的频率为(0.004+0.008+0.016+0.032)×10=0.6,80分以下的频率为0.6+0.02×10=0.8,设录取分数线为x,则=,解得x=77.5.
答案:D
考点2__样本的数字特征[多维讲练]
样本的数字特征高考必考,一是给出一组数据,直接利用公式计算;二是结合频率分布直方图、茎叶图等统计图表考查.多为选择或填空题,尤其是多选题常涉及此考点,难度中低档.主要考查数据分析和逻辑推理的数学素养.尤其注意在统计图表中比较方差和平均数大小时,有时不需要计算,只需观察图表特点即可.
角度1 中位数、众数、平均数
【例3】 (1)(多选)一组数据按从小到大排列为2,3,3,x,7,10,若这组数据的平均数是中位数的倍,则下列说法正确的是(  )
A.x=4 B.众数为3
C.中位数为4 D.方差为
(2)(多选)随着生活水平的不断提高,我国居民的平均身高也在增长.某市为了调查本市小学一年级男生身高情况,从某小学一年级随机抽取了100名同学进行身高测量,得到如下频率分布直方图,其中右侧三组小长方形面积成等差数列.则下列说法正确的是(  )
A.身高在[130,140]范围内的频率为0.18
B.身高的众数的估计值为115 cm
C.身高的中位数的估计值为125 cm
D.身高的平均数的估计值为121.8 cm
解析:(1)一组数据按从小到大排列为2,3,3,x,7,10,
∵这组数据的平均数是中位数的倍,
∴(2+3+3+x+7+10)=×,
解得x=5,故A错误;众数为3,故B正确;
中位数为=4,故C正确;
平均数为:(2+3+3+5+7+10)=5,
方差为[(2-5)2+(3-5)2+(3-5)2+(5-5)2+(7-5)2+(10-5)2]=,故D正确.
(2)∵前三组的频率分别为0.04,0.08,0.34,
∴后三组的频率和为1-(0.04+0.08+0.34)=0.54.
∵右侧三组小长方形面积成等差数列,设[130,140]的频率为x,
∴3x=0.54,可得x=0.18,而[140,150]的频率为0.06,则[120,130]的频率为0.3,A正确;
由直方图知:频率最高的区间[110,120],所以身高的众数的估计值为115 cm,B正确;
由图知:中位数x在区间[120,130],所以0.46+(x-120)×0.03=0.5得x=120+≈121.3 cm,C错误;
由题意:x=95×0.04+105×0.08+115×0.34+125×0.3+135×0.18+145×0.06=121.8 cm,D正确.故选ABD.
答案:(1)BCD (2)ABD
[思维升华]1.计算一组数据的平均数、中位数和众数时的注意点
(1)求平均数时要注意数据的个数,不要重记或漏记.
(2)求中位数时,一定先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数.
(3)若有两个或两个以上的数据出现的最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.
2.频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
[对点练] 1.(多选)已知一组数据的平均数、中位数、众数依次成等差数列,若这组数据丢失了其中的一个,剩下的六个数据分别是2,2,4,2,5,10,则丢失的这个数据可能是(  )
A.-11  B.3  C.9  D.17
解析:设这个数据为a,由题意得,众数为2,平均数为.
若a≤2时,这列数为a,2,2,2,4,5,10,则中位数为2,则,2,2成等差数列,所以2×2=+2,解得a=-11<2,满足题意,故A正确;
若2若a≥4时,这列数为2,2,2, 4,a,5,10,则中位数为4,则,4,2成等差数列,所以2×4=+2,解得a=17>4,满足题意,故D正确.
答案:ABD
2.(多选)为了了解某外贸企业职工对“一带一路”的认知程度,随机抽取了100名职工组织了“一带一路”知识竞赛,满分为100分(80分及以上为认知程度较高),并将所得成绩分组得到了如图所示的频率分布折线图.从频率分布折线图中得到的这100名职工成绩的以下信息正确的是(  )
A.成绩是50分或100分的职工人数是0
B.对“一带一路”认知程度较高的人数是35人
C.中位数是74.5
D.平均分是75.5
解析:对于A,由于频率分布折线图表示的是某一个范围的频率,不能判断成绩是50分或100分的职工人数,A错误;
对于B,由题意可得a=0.1-(0.01+0.015+0.04+0.005)=0.03,所以,成绩80分及以上的职工人数为(0.03+0.005)×10×100=35人,B正确;
对于C,设中位数为x,
∵(0.01+0.015)×10=0.25,(0.01+0.015+0.04)×10=0.65,所以x∈(70,80),由题意可得0.25+(x-70)×0.04=0.5,解得x=76.25,C错误;
对于D,平均分为55×0.1+65×0.15+75×0.4+85×0.3+95×0.05=75.5,D正确.
答案:BD
角度2 方差与标准差
【例4】 某中学要从高一年级甲、乙两个班级中选择一个班参加市电视台组织的“环保知识竞赛”.该校对甲、乙两班的参赛选手(每班7人)进行了一次环境知识测试,他们取得的成绩的茎叶图如图所示,其中甲班学生的平均分是85分,乙班学生成绩的中位数是85.
(1)求x,y的值;
(2)根据茎叶图,求甲、乙两班同学成绩的方差的大小,并从统计学角度分析,该校应选择甲班还是乙班参赛.
[思维点拨]
解:(1)因为甲班学生的平均分是85,所以x甲==85,解得x=9.因为乙班学生成绩的中位数是85,所以y=5.
(2)由(1)可知,x甲=85,所以s=[(x1-x)2+(x2-x)2+…+(x7-)2]=×[(-7)2+(-10)2+42+(-5)2+72+112]=.由茎叶图可得x乙==85,
所以s=[(x1-x)2+(x2-x)2+…+(x7-x)2]=×=.所以x甲=x乙,s>s.故该校应该选择乙班参赛.
[思维升华](1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
[对点练] 3.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则(  )
A.甲的成绩的平均数大于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
解析:根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;乙的中靶情况为5环、5环、5环、6环、9环,
对于A,甲的平均数为=6,乙的平均数为=6,故A错误;
对于B,甲的中位数是6,乙的中位数是5,故B错误;
对于C,甲的方差是
=2,乙的方差是
=2.4,故C正确;
对于D,甲的极差是8-4=4,乙的极差是9-5=4,故D错误.
答案:C
角度3 分层抽样中的方差与标准差
【例5】 (多选)(2022·广东珠海模拟)某高中有学生500人,其中男生300人,女生200人,希望获得全体学生的身高信息,按照分层抽样的原则抽取了容量为50的样本.经计算得到男生身高样本均值为170 cm,方差为17 cm2;女生身高样本均值为160 cm,方差为30 cm2.
下列说法中正确的是(  )
A.男生样本量为30
B.每个女生入样的概率均为
C.所有样本的均值为166 cm
D.所有样本的方差为22.2 cm2
[思维点拨] 由分层抽样可判断A;计算女生入样的概率可判断B;计算总体的均值可判断C;计算总体的方差可判断D,进而可得正确选项.
解析:对于A,抽样比为=,所以样本中男生有×300=30人,故选项A正确;
对于B,每个女生入样的概率等于抽样比=,故选项B不正确;
对于C,由分层抽样知,样本中男生有30人,女生有20人,所有的样本均值为:=166,故选项C正确;
对于D,设男生分别为x1,x2,…,x30,平均数x=170,s=17,女生分别为y1,y2,…,y20,平均数y=160,s=30,总体的平均数为166,方差为s2,
s2=
因为(xi-166)2=
=(xi-170)2+(170-166)2+2(xi-170)(170-166),
而(xi-170)(170-166)=(170-166) (xi-170)=4=0,
所以(xi-166)2=(xi-170)2+(170-166)2=30×17+42×30=990,
同理可得(yi-166)2=(yi-160)2+(160-166)2=30×20+62×20=1 320,
所以s2=
=(990+1 320)=46.2,
故选项D不正确.
答案:AC
[思维升华] 计算分层随机抽样的方差s2的步骤
(1)确定x1,x2,s,s;
(2)确定x;
(3)应用公式s2=[s+(x1-x)2]+[s+(x2-x)2],计算s2.
[对点练] 4.某学校统计教师职称及年龄,中级职称教师的人数为50,其平均年龄为38岁,方差是2,高级职称的教师有3人58岁,5人40岁,2人38岁,求该校中级职称和高级职称教师年龄的平均数和方差.
解:由已知条件可知高级职称教师的平均年龄为x高==45(岁),年龄的方差为s=×[3×(58-45)2+5×(40-45)2+2×(38-45)2]=73,所以该校中级职称和高级职称的平均年龄为x=×38+×45≈39.2(岁),该校中级职称和高级职称教师的年龄的方差是s2=×[2+(38-39.2)2]+×[73+(45-39.2)2]≈20.64.

展开更多......

收起↑

资源预览