资源简介 4.2 分层随机抽样的均值与方差、百分位数 (教学方式:深化学习课—梯度进阶式教学)[课时目标]1.理解分层随机抽样的均值与方差公式的推导过程,会求分层随机抽样的均值与方差.2.理解百分位数的统计含义,会求样本数据的p分位数.(一)分层随机抽样的均值与方差1.权重一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为1+2.记w1=,w2=,则这个新样本的平均数为__________,其中w1,w2称为权重.2.分层随机抽样的均值与方差分层随机抽样的均值 设样本中不同层的平均数和相应权重分别为1,2,…,n和w1,w2,…,wn,则这个样本的平均数为________________________=wii分层随机抽样的方差 设样本中不同层的平均数分别为1,2,…,n,方差分别为s,s,…,s,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=________________,其中为这个样本的平均数(二)百分位数1.总体的p分位数的概念一般地,当总体是连续变量时,给定一个百分数p∈__________,总体的p分位数有这样的特点:总体数据中的任意一个数__________它的可能性是p.2.四分位数________________分位数是三个常用的百分位数.把总体数据按照__________排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是.因此这三个百分位数也称为总体的四分位数.3.计算一组n个数据的p分位数的一般步骤第一步,按照________排列原始数据;第二步,计算i=______;第三步,若i不是整数,大于i的最小整数为j,则p分位数为__________;若i是整数,则p分位数为第i项与第____________项数据的__________.基础落实训练1.(多选)下列表述正确的是( )A.50%分位数就是总体的中位数B.p百分位数可以有单位C.一个总体的四分位数有4个D.样本容量越大,第p百分位数估计总体就越准确2.某单位共有员工100人,其中有年轻人20人,平均年薪为5万元,中年人有80人,平均年薪为8万元,则该单位员工的平均年薪为( )A.5万元 B.8万元C.6.5万元 D.7.4万元3.利用分层随机抽样抽得A,B两组数据,其平均数分别是A=2.3,B=2.8,若这两组数据的平均数=2.4,则A组数据在两组数据中的权重wA=________.4.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的30%分位数是________.题型(一) 分层随机抽样的均值与方差的计算[例1] 某校从在校学生中,用分层随机抽样的方法抽取男生32人,女生18人.测得他们的身高后,计算得到男生身高的样本平均数为173.5 cm,方差为17 cm2;女生身高的样本平均数为163.83 cm,方差为30.03 cm2.求所有50个身高数据的样本方差.听课记录:|思|维|建|模|1.分层随机抽样的平均数的计算方法(1)第i层的权重wi、第i层的个体数xi、样本容量n,三者满足wi=,已知其中2个可求另外1个.(2)利用公式=w1 1+w22+…+wnn求分层随机抽样的平均数.2.计算分层随机抽样的方差s2的步骤(1)确定1,2,…,n,s,s,…,s ,w1,w2,…,wn;(2)确定;(3)应用公式 s2=wi[s+(i-)2]计算s2.[针对训练]1.(多选)某分层随机抽样中,有关数据如下:样本量 均值 方差第1层 45 4 2第2层 35 8 1第3层 10 6 3则下列叙述正确的是(结果保留两位小数)( )A.第1,2层所有数据的均值为5.75B.第1,2层所有数据的方差为1.50C.第1,2,3层所有数据的均值约为7.68D.第1,2,3层所有数据的方差约为5.232.已知某省二、三、四线城市数量之比为1∶3∶6,2024年6月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,求二线城市的房价的方差.题型(二) 百分位数的计算[例2] 以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的80%分位数是( ) 听课记录:[例3] 已知30个数据的60%分位数是8.2,将这30个数据从小到大排列后第18个数据是7.8,则第19个数据是________.听课记录:|思|维|建|模|计算一组数据的p分位数时,不要忽略对i是否为整数的讨论.若i不是整数,则p分位数是大于i的最小整数个数据;若i是整数,则p分位数为第i个与第(i+1)个数据的平均数.[针对训练]3.按从小到大顺序排列的一组数据:26,30,35,36,38,42,m,47,50,52,若这组数据的第65百分位数比第40百分位数多8,则m=( )A.43 B.44C.45 D.464.以下数据为某学校参加学科节数学竞赛决赛的10人的成绩:(单位:分)72,78,79,80,81,83,84,86,88,90.这10人成绩的第p百分位数是85,则p=( )A.65 B.70C.75 D.805.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,75,95百分位数;(2)请你找出珍珠质量较小的前15%的珍珠质量;(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.题型(三) 百分位数的综合问题[例4] 在某市的一次数学测试中,为了解学生的测试情况,从中随机抽取100名学生的测试成绩,被抽取成绩全部介于40分到100分之间(满分100分),将统计结果按如下方式分成六组:第一组[40,50),第二组[50,60),…,第六组[90,100],画出频率分布直方图如图所示.(1)求第三组[60,70)的频率;(2)估计该市学生这次测试成绩的平均值(同一组中的数据用该组区间的中点值为代表)和25%分位数.听课记录:|思|维|建|模|频率分布直方图中p分位数的求解方法可以模仿中位数的求解思路:(1)确定p分位数所在的区间[a,b).(2)确定小于a和小于b的数据所占的百分比分别为fa,fb,则p分位数为a+×(b-a).[针对训练]6.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)求样本成绩的第75百分位数;(3)已知落在[50,60)的平均成绩是54,方差是7,落在[60,70)的平均成绩为66,方差是4,求两组成绩的总平均数和总方差.分层随机抽样的均值与方差、百分位数?课前预知教材(一)1.w11+w222.w11+w22+…+wnnwi[s+(i-)2](二)1.(0,1) 小于或等于 2.25%,50%,75% 从小到大 3.从小到大 np 第j项数据 (i+1) 平均数[基础落实训练] 1.ABD 2.D 3. 4.8.4?课堂题点研究[题型(一)][例1] 解:记男生样本为y1,y2,…,y32,平均数为男,方差为s;记女生样本为z1,z2,…,z18,平均数为女,方差为s;所有数据样本的平均数为总,方差为s.样本总量为50.所有50个数据的平均数为总=男+女=×173.5+×163.83≈170.02(cm).若总体划为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为m,1,s,n,2,s,总的样本平均数为,样本方差为s2,则s2=[s+(1-)2]+[s+(2-)2].根据此公式得s=[17+(173.5-170.02)2]+[30.03+(163.83-170.02)2]≈43.24(cm2).[针对训练]1.选AD 第1,2层所有数据的均值为12=×4+×8=5.75,A正确;第1,2层所有数据的方差为s=×+×[1+(8-5.75)2]=5.5,B不正确;第1,2,3层所有数据的均值约为=×4+×8+×6≈5.78,C不正确;第1,2,3层所有数据的方差约为s2=×+×+×[3+(6-5.78)2]≈5.23,D正确.2.解:设二线城市的房价的方差为s2,由题意可知20=[s2+(2.4-1.2)2]+[10+(1.8-1.2)2]+[8+(0.8-1.2)2],解得s2=118.52,即二线城市的房价的方差为118.52.[题型(二)][例2] 选B 把成绩按从小到大的顺序排列为56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,是整数,所以这15人成绩的80%分位数是=90.5.[例3] 解析:由于30×60%=18,设第19个数据为x,则=8.2,解得x=8.6,即第19个数据是8.6.答案:8.6[针对训练]3.选C 由10×40%=4,得第40百分位数是第4个数据和第5个数据的平均值,为=37.又由10×65%=6.5,得第65百分位数是第7个数据,为m,因为这组数据的第65百分位数比第40百分位数多8,可得m=37+8=45.4.选B 因为10人成绩的第p百分位数是85,而85=,即第7位与第8位的平均值,所以85是这10人成绩的第70百分为数.5.解:(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,则第25百分位数是=8.15,第75百分位数是=8.75,第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.[题型(三)][例4] 解:(1)由频率分布直方图知,第三组的频率为0.020×10=0.2.(2)平均值=45×0.004×10+55×0.012×10+65×0.020×10+75×0.030×10+85×0.024×10+95×0.010×10=73.8,因为(0.004+0.012)×10=0.16,(0.004+0.012+0.020)×10=0.36,所以25%分位数为60+×10=64.5.[针对训练]6.解:(1)因为每组小矩形的面积之和为1,所以(0.005+0.010+0.020+a+0.025+0.010)×10=1,则a=0.030.(2)成绩落在[40,80)内的频率为(0.005+0.010+0.020+0.030)×10=0.65,落在[40,90)内的频率为(0.005+0.010+0.020+0.030+0.025)×10=0.9,设第75百分位数为m,由0.65+(m-80)×0.025=0.75,得m=84,故第75百分位数为84.(3)由题图可知,成绩在[50,60)的市民人数为100×0.1=10,成绩在[60,70)的市民人数为100×0.2=20,故这两组成绩的总平均数为=62,由样本方差计算总体方差公式可得总方差为s2=×[7+(54-62)2]+×[4+(66-62)2]=37.5 / 5(共68张PPT)分层随机抽样的均值与方差、百分位数(教学方式:深化学习课—梯度进阶式教学)4.2课时目标1.理解分层随机抽样的均值与方差公式的推导过程,会求分层随机抽样的均值与方差.2.理解百分位数的统计含义,会求样本数据的p分位数.CONTENTS目录123课前预知教材·自主落实基础课堂题点研究·迁移应用融通课时跟踪检测课前预知教材·自主落实基础(一)分层随机抽样的均值与方差1.权重一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为+.记w1=,w2=,则这个新样本的平均数为__________,其中w1,w2称为权重.w1+w22.分层随机抽样的均值与方差w1+w2+…+wn(二)百分位数1.总体的p分位数的概念一般地,当总体是连续变量时,给定一个百分数p∈_____,总体的p分位数有这样的特点:总体数据中的任意一个数___________它的可能性是p.2.四分位数_____________分位数是三个常用的百分位数.把总体数据按照_________排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是.因此这三个百分位数也称为总体的四分位数.(0,1)小于或等于25%,50%,75%从小到大3.计算一组n个数据的p分位数的一般步骤第一步,按照__________排列原始数据;第二步,计算i=____;第三步,若i不是整数,大于i的最小整数为j,则p分位数为___________;若i是整数,则p分位数为第i项与第______项数据的_______.从小到大np第j项数据(i+1)平均数基础落实训练1.下列表述不正确的是( )A.50%分位数就是总体的中位数B.p百分位数可以有单位C.一个总体的四分位数有4个D.样本容量越大,第p百分位数估计总体就越准确解析:一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,所以C错误.√2.某单位共有员工100人,其中有年轻人20人,平均年薪为5万元,中年人有80人,平均年薪为8万元,则该单位员工的平均年薪为 ( )A.5万元 B.8万元C.6.5万元 D.7.4万元解析:由题意可知=×5+×8=7.4(万元).√3.利用分层随机抽样抽得A,B两组数据,其平均数分别是=2.3,=2.8,若这两组数据的平均数=2.4,则A组数据在两组数据中的权重wA= . 解析:由=wA+wB,可得2.4=wA×2.3+(1-wA)×2.8,解得wA=.4.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的30%分位数是 . 解析:因为8×30%=2.4,故30%分位数是第3个数据8.4.8.4课堂题点研究·迁移应用融通题型(一) 分层随机抽样的均值与方差的计算[例1] 某校从在校学生中,用分层随机抽样的方法抽取男生32人,女生18人.测得他们的身高后,计算得到男生身高的样本平均数为173.5 cm,方差为17 cm2;女生身高的样本平均数为163.83 cm,方差为30.03 cm2.求所有50个身高数据的样本方差.解:记男生样本为y1,y2,…,y32,平均数为,方差为;记女生样本为z1,z2,…,z18,平均数为,方差为;所有数据样本的平均数为,方差为.样本总量为50.所有50个数据的平均数为=+=×173.5+×163.83≈170.02(cm).若总体划为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为m,,,n,,,总的样本平均数为,样本方差为s2,则s2=·[+]+[+].根据此公式得=[17+(173.5-170.02)2]+[30.03+(163.83-170.02)2]≈43.24(cm2).|思|维|建|模|1.分层随机抽样的平均数的计算方法(1)第i层的权重wi、第i层的个体数xi、样本容量n,三者满足wi=,已知其中2个可求另外1个.(2)利用公式=w1 1+w2+…+wn求分层随机抽样的平均数.2.计算分层随机抽样的方差s2的步骤(1)确定,,…,,,,…, ,w1,w2,…,wn;(2)确定;(3)应用公式 s2= wi[+(-)2]计算s2.针对训练1.(多选)某分层随机抽样中,有关数据如下: 样本量 均值 方差第1层 45 4 2第2层 35 8 1第3层 10 6 3则下列叙述正确的是(结果保留两位小数) ( )A.第1,2层所有数据的均值为5.75B.第1,2层所有数据的方差为1.50C.第1,2,3层所有数据的均值约为7.68D.第1,2,3层所有数据的方差约为5.23√√解析:第1,2层所有数据的均值为=×4+×8=5.75,A正确;第1,2层所有数据的方差为=×+×=5.5,B不正确;第1,2,3层所有数据的均值约为=×4+×8+×6≈5.78,C不正确;第1,2,3层所有数据的方差约为s2=×+×+×≈5.23,D正确.2.已知某省二、三、四线城市数量之比为1∶3∶6,2024年6月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,求二线城市的房价的方差.解:设二线城市的房价的方差为s2,由题意可知20=[s2+(2.4-1.2)2]+[10+(1.8-1.2)2]+[8+(0.8-1.2)2],解得s2=118.52,即二线城市的房价的方差为118.52.题型(二) 百分位数的计算[例2] 以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的80%分位数是 ( )A.90 B.90.5C.91 D.91.5√解析:把成绩按从小到大的顺序排列为56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,是整数,所以这15人成绩的80%分位数是=90.5.[例3] 已知30个数据的60%分位数是8.2,将这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 . 解析:由于30×60%=18,设第19个数据为x,则=8.2,解得x=8.6,即第19个数据是8.6.8.6|思|维|建|模|计算一组数据的p分位数时,不要忽略对i是否为整数的讨论.若i不是整数,则p分位数是大于i的最小整数个数据;若i是整数,则p分位数为第i个与第(i+1)个数据的平均数. 针对训练3.按从小到大顺序排列的一组数据:26,30,35,36,38,42,m,47,50,52,若这组数据的第65百分位数比第40百分位数多8,则m= ( )A.43 B.44C.45 D.46解析:由10×40%=4,得第40百分位数是第4个数据和第5个数据的平均值,为=37.又由10×65%=6.5,得第65百分位数是第7个数据,为m,因为这组数据的第65百分位数比第40百分位数多8,可得m=37+8=45.√4.以下数据为某学校参加学科节数学竞赛决赛的10人的成绩:(单位:分)72,78,79,80,81,83,84,86,88,90.这10人成绩的第p百分位数是85,则p= ( )A.65 B.70C.75 D.80解析:因为10人成绩的第p百分位数是85,而85=,即第7位与第8位的平均值,所以85是这10人成绩的第70百分为数.√5.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,75,95百分位数;解:将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,则第25百分位数是=8.15,第75百分位数是=8.75,第95百分位数是第12个数据为9.9.(2)请你找出珍珠质量较小的前15%的珍珠质量;解:因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解:由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.题型(三) 百分位数的综合问题[例4] 在某市的一次数学测试中,为了解学生的测试情况,从中随机抽取100名学生的测试成绩,被抽取成绩全部介于40分到100分之间(满分100分),将统计结果按如下方式分成六组:第一组[40,50),第二组[50,60),…,第六组[90,100],画出频率分布直方图如图所示.(1)求第三组[60,70)的频率;解:由频率分布直方图知,第三组的频率为0.020×10=0.2.(2)估计该市学生这次测试成绩的平均值(同一组中的数据用该组区间的中点值为代表)和25%分位数.解:平均值=45×0.004×10+55×0.012×10+65×0.020×10+75×0.030×10+85×0.024×10+95×0.010×10=73.8,因为(0.004+0.012)×10=0.16,(0.004+0.012+0.020)×10=0.36,所以25%分位数为60+×10=64.5.|思|维|建|模| 频率分布直方图中p分位数的求解方法可以模仿中位数的求解思路:(1)确定p分位数所在的区间[a,b).(2)确定小于a和小于b的数据所占的百分比分别为fa,fb,则p分位数为a+×(b-a).针对训练6.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值;解:因为每组小矩形的面积之和为1,所以(0.005+0.010+0.020+a+0.025+0.010)×10=1,则a=0.030.(2)求样本成绩的第75百分位数;解:成绩落在[40,80)内的频率为(0.005+0.010+0.020+0.030)×10=0.65,落在[40,90)内的频率为(0.005+0.010+0.020+0.030+0.025)×10=0.9,设第75百分位数为m,由0.65+(m-80)×0.025=0.75,得m=84,故第75百分位数为84.(3)已知落在[50,60)的平均成绩是54,方差是7,落在[60,70)的平均成绩为66,方差是4,求两组成绩的总平均数和总方差.解:由题图可知,成绩在[50,60)的市民人数为100×0.1=10,成绩在[60,70)的市民人数为100×0.2=20,故这两组成绩的总平均数为=62,由样本方差计算总体方差公式可得总方差为s2=×[7+(54-62)2]+×[4+(66-62)2]=37.课时跟踪检测134567891011121314152A级——综合提能1.下列一组数据的25%分位数是( )2.1 3.0 3.4 3.2 3.8 4.0 4.2 4.4 5.3 5.6A.3.2 B.3.0C.4.4 D.3.4解析:把该组数据按照由小到大排列,可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6.由10×25%=2.5,不是整数,则第3个数据3.2是25%分位数.√1567891011121314152342.有两种糖块,A种糖块18元/千克,B种糖块24元/千克,超市计划把A,B两种糖块按照1∶2的比例混合出售,则合理的价格应为 ( )A.18元/千克 B.24元/千克C.21元/千克 D.22元/千克解析:=×18+×24=22元/千克.√1567891011121314153423.已知100个数据的75%分位数是9.3,则下列说法正确的是 ( )A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据按从小到大排列后,9.3是第75个数据C.把这100个数据按从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据按从小到大排列后,9.3是第74个数据和第75个数据的平均数√15678910111213342解析:因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3.156789101112133424.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50%分位数为b,则有 ( )A.a=13.7,b=15.5 B.a=14,b=15C.a=12,b=15.5 D.a=14.7,b=15√15678910111213342解析:把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,50%分位数为b==15.156789101112133425.(多选)某学校高一年级在校人数为600人,其中男生320人,女生280人,为了解学生身高发展情况,按分层随机抽样的方法抽取80名男生身高为一个样本,其样本平均数为170.2 cm,方差为2.1;抽取70名女生身高为一个样本,其样本平均数为162.0 cm,方差为3.则 ( )A.该校高一学生的平均身高约为166.4B.该校高一学生的平均身高约为168.2C.该校高一学生身高的方差约为2.5D.该校高一学生身高的方差约为19.315678910111213342解析:设样本中男、女生身高的平均数分别为,,由题意可知,=170.2,=162.0且M=320,N=280,所以样本平均数=+=×170.2+×162.0≈166.4(cm),样本方差s2=×[2.1+(170.2-166.4)2]+×[3+(162.0-166.4)2]≈19.3,故该校高一学生的平均身高约为166.4 cm,方差约为19.3.156789101112133426.已知甲、乙两组按从小到大顺序排列的数据:甲组:14,30,37,a,41,52,53,55,58,80;乙组:17,22,32,b,45,47,51,59.若甲组数据的30%分位数和乙组数据的中位数相等,则a-b等于 . 解析:因为10×30%=3,甲组数据的30%分位数为第三个数和第四个数的平均数,乙组数据的中位数为第四个数和第五个数的平均数,根据题意可得=,解得a-b=8.8156789101112133427.为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,已知所抽取的所有员工的平均体重为60 kg,标准差为60,男员工的平均体重为70 kg,标准差为50,女员工的平均体重为50 kg,标准差为60,若样本中有20名男员工,则女员工的人数为 . 解析:由题意可知s2=w男[+(-)2]+w女[+(-)2],即w男[502+(70-60)2]+(1-w男)[602+(50-60)2]=602,解得w男=,w女=,因为样本中有20名男员工,则样本中女员工的人数为200.200156789101112133428.(8分)农科院在试验田中种植了两个小麦品种,亩数、亩均产量和标准差如下:品种 甲 乙亩数(单位:亩) 10 8亩均产量(单位:kg) 540 576标准差 3 215678910111213342求甲、乙两个品种的平均亩产量和方差.解:甲、乙两个品种的平均亩产量为×540+×576=556 kg;甲、乙两个品种的亩产量的方差是s2=w甲[+(-)2]+w乙[+(-)2]=[32+(540-556)2]+[22+(576-556)2]≈326.78.即甲、乙两个品种的平均亩产量和方差分别是556 kg,326.78.15678910111213342B级——重点培优9.(多选)已知数据x1,x2,x3,…,xn的极差、平均数、众数、80%分位数分别是a1,b1,c1,d1,数据y1,y2,y3,…,yn的极差、平均数、众数、80%分位数分别是a2,b2,c2,d2,且满足yi=3xi-1(i=1,2,3,…,n),则( )A.a2=3a1-1 B.b2=3b1-1C.c2=3c1-1 D.d2=3d1-1√√√15678910111213342解析:对于A,a2=3a1,故A错误;对于B,由题意可知,两组数据满足yi=3xi-1(i=1,2,3,…,n),由平均数计算公式得×(y1+y2+…+yn)=×[(3x1-1)+(3x2-1)+…+(3xn-1)]=3××(x1+x2+…+xn)-1,所以b2=3b1-1,故B正确;对于C,由众数知识得c2=3c1-1,故C正确;对于D,对于数据x1,x2,x3,…,xn,假设其80%分位数为d1,当0.8n=k是整数时,d1=,当0.8n不是整数时,设其整数部分为k,15678910111213342则d1=xk+1,所以对于数据3x1-1,3x2-1,3x3-1,…,3xn-1,假设其80%分位数为d2,当0.8n=k是整数时,d2==3d1-1,当0.8n不是整数时,设其整数部分为k,则d2=3xk+1-1=3d1-1,所以d2=3d1-1,故D正确.1567891011121334210.(多选)从某校男生中随机抽取100人测量他们的身高,发现他们的身高都在155~185 cm之间,将统计得到的原始数据进行分组,得到如图所示的频率分布直方图(每组均为左闭右开区间),则下列说法正确的是 ( )15678910111213342A.已知该校一共有1 500名男生,该校身高在[165,170)内的男生人数约为450B.该校男生身高的90%分位数约为178.3(结果精确到0.1)C.将身高不低于170 cm的男生称为“高个子”,低于170 cm的男生称为“非高个子”.已知在原始数据中,高个子男生的身高的平均数为177,方差为10,100名男生的身高的平均数为168,方差为64,则非高个子男生的身高的方差为10D.据此估计该校男生的平均身高一定是168.6√√√15678910111213342解析:由频率分布直方图可知(0.024+0.036+x+0.044+0.024+0.012)×5=1,得x=0.06.故估计该校1 500名男生中身高在[165,170)内的人数为1 500×0.06×5=450,故A正确;前四组的频率之和为(0.024+0.036+0.06+0.044)×5=0.82<0.9,前五组的频率之和为0.82+0.024×5=0.94>0.9,所以90%分位数位于区间[175,180)内,15678910111213342故估计该校男生身高的90%分位数为175+×5≈178.3,故B正确;由频率分布直方图可知,样本中高个子男生有40人,非高个子男生有60人.将高个子男生的身高数据记为x1,x2,…,x40,其平均数记为,方差记为;将非高个子男生的身高数据记为y1,y2,…,y60,其平均数记为,方差记为;把全部样本数据的平均数记为,方差记为s2.则=177,=10,=168,s2=64.15678910111213342由已知可得=+,即168=177×0.4+0.6,得=162,s2=[+(-)2]+[+(-)2].所以64=0.4×(10+92)+0.6×(+62),解得=10,故C正确;根据直方图可知据此估计该校男生的平均身高约为(157.5×0.024+162.5×0.036+167.5×0.06+172.5×0.044+177.5×0.024+182.5×0.012)×5=168.6,故D错误.1567891011121334211.某学校共有学生2 000人,其中高一800人,高二、高三各600人,学校对学生在暑假中每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为=3,方差为s2=2.003,其中高一学生、高二学生每天读书时间的平均数分别为=2.6,=3.2,又已知三个年级学生每天读书时间的方差分别为=1,=2,=3,则高三学生每天读书时间的平均数= . 3.3或2.715678910111213342解析:由s2=w1[+(-)2]+w2[+(-)2]+w3[+(-)2],可得2.003=[1+(2.6-3)2]+[2+(3.2-3)2]+[3+(-3)2],解得=3.3或2.7.1567891011121334212.(13分)为了普及法律知识,达到“法在心中”的目的,某市法制办组织了一次普法知识竞赛,统计局调查队从甲、乙两单位中各随机抽取了5名职工的成绩,如下:甲单位职工的成绩(分) 87 88 91 91 93乙单位职工的成绩(分) 85 89 91 92 9315678910111213342(1)根据表中的数据,分别求出样本中甲、乙两单位职工成绩的平均数和方差,并判断哪个单位职工对法律知识的掌握更为稳定;解:甲单位5名职工成绩的平均数=×(87+88+91+91+93)=90(分),乙单位5名职工成绩的平均数=×(85+89+91+92+93)=90(分),甲单位5名职工成绩的方差=×[(87-90)2+(88-90)2+(91-90)2+(91-90)2+(93-90)2]=4.8,乙单位5名职工成绩的方差=×[(85-90)2+(89-90)2+(91-90)2+(92-90)2+(93-90)2]=8.∵<,∴甲单位职工对法律知识的掌握更为稳定.15678910111213342(2)求被抽取的这10名职工成绩的平均数和方差.解:∵甲单位职工的权重w甲=,乙单位职工的权重w乙=,=90分,=90分,=4.8,=8,∴这10名职工成绩的平均数=×90+×90=90(分),这10名职工成绩的方差s2=w甲[+(-)2]+w乙[+(-)2]=×[4.8+(90-90)2]+×[8+(90-90)2]=6.4.15678910111213141534213.(16分)某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并购买一定数量的书籍丰富小区图书站.由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.15678910111213342(1)求在这40名读书者中年龄分布在[40,70)的人数;解:由频率分布直方图知,年龄在[40,70)的频率为(0.020+0.030+0.025)×10=0.75,故这40名读书者中年龄分布在[40,70)的人数为40×0.75=30.15678910111213342(2)求这40名读书者的年龄的50%分位数.解:设这40名读书者年龄的50%分位数为x,则0.005×10+0.010×10+0.020×10+0.030×(x-50)=0.5,解得x=55,故这40名读书者年龄的50%分位数为55.课时跟踪检测(四十五) 分层随机抽样的均值与方差、百分位数(满分90分,A级选填小题每题5分,B级选填小题每题6分)A级——达标评价1.下列一组数据的25%分位数是( )2.1 3.0 3.4 3.2 3.8 4.0 4.2 4.4 5.3 5.6A.3.2 B.3.0C.4.4 D.3.42.有两种糖块,A种糖块18元/千克,B种糖块24元/千克,超市计划把A,B两种糖块按照1∶2的比例混合出售,则合理的价格应为( )A.18元/千克 B.24元/千克C.21元/千克 D.22元/千克3.已知100个数据的75%分位数是9.3,则下列说法正确的是( )A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据按从小到大排列后,9.3是第75个数据C.把这100个数据按从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据按从小到大排列后,9.3是第74个数据和第75个数据的平均数4.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50%分位数为b,则有( )A.a=13.7,b=15.5 B.a=14,b=15C.a=12,b=15.5 D.a=14.7,b=155.(多选)某学校高一年级在校人数为600人,其中男生320人,女生280人,为了解学生身高发展情况,按分层随机抽样的方法抽取80名男生身高为一个样本,其样本平均数为170.2 cm,方差为2.1;抽取70名女生身高为一个样本,其样本平均数为162.0 cm,方差为3.则( )A.该校高一学生的平均身高约为166.4B.该校高一学生的平均身高约为168.2C.该校高一学生身高的方差约为2.5D.该校高一学生身高的方差约为19.36.已知甲、乙两组按从小到大顺序排列的数据:甲组:14,30,37,a,41,52,53,55,58,80;乙组:17,22,32,b,45,47,51,59.若甲组数据的30%分位数和乙组数据的中位数相等,则a-b等于______.7.为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,已知所抽取的所有员工的平均体重为60 kg,标准差为60,男员工的平均体重为70 kg,标准差为50,女员工的平均体重为50 kg,标准差为60,若样本中有20名男员工,则女员工的人数为________.8.(8分)农科院在试验田中种植了两个小麦品种,亩数、亩均产量和标准差如下:品种 甲 乙亩数(单位:亩) 10 8亩均产量(单位:kg) 540 576标准差 3 2求甲、乙两个品种的平均亩产量和方差.B级——重点培优9.(多选)已知数据x1,x2,x3,…,xn的极差、平均数、众数、80%分位数分别是a1,b1,c1,d1,数据y1,y2,y3,…,yn的极差、平均数、众数、80%分位数分别是a2,b2,c2,d2,且满足yi=3xi-1(i=1,2,3,…,n),则( )A.a2=3a1-1 B.b2=3b1-1C.c2=3c1-1 D.d2=3d1-110.(多选)从某校男生中随机抽取100人测量他们的身高,发现他们的身高都在155~185 cm之间,将统计得到的原始数据进行分组,得到如图所示的频率分布直方图(每组均为左闭右开区间),则下列说法正确的是( )A.已知该校一共有1 500名男生,该校身高在[165,170)内的男生人数约为450B.该校男生身高的90%分位数约为178.3(结果精确到0.1)C.将身高不低于170 cm的男生称为“高个子”,低于170 cm的男生称为“非高个子”.已知在原始数据中,高个子男生的身高的平均数为177,方差为10,100名男生的身高的平均数为168,方差为64,则非高个子男生的身高的方差为10D.据此估计该校男生的平均身高一定是168.611.某学校共有学生2 000人,其中高一800人,高二、高三各600人,学校对学生在暑假中每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为=3,方差为s2=2.003,其中高一学生、高二学生每天读书时间的平均数分别为1=2.6,2=3.2,又已知三个年级学生每天读书时间的方差分别为s=1,s=2,s=3,则高三学生每天读书时间的平均数3=________.12.(13分)为了普及法律知识,达到“法在心中”的目的,某市法制办组织了一次普法知识竞赛,统计局调查队从甲、乙两单位中各随机抽取了5名职工的成绩,如下:甲单位职工的成绩(分) 87 88 91 91 93乙单位职工的成绩(分) 85 89 91 92 93(1)根据表中的数据,分别求出样本中甲、乙两单位职工成绩的平均数和方差,并判断哪个单位职工对法律知识的掌握更为稳定;(2)求被抽取的这10名职工成绩的平均数和方差.13.(16分)某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并购买一定数量的书籍丰富小区图书站.由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.(1)求在这40名读书者中年龄分布在[40,70)的人数;(2)求这40名读书者的年龄的50%分位数.课时跟踪检测(四十五)1.选A 把该组数据按照由小到大排列,可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6.由10×25%=2.5,不是整数,则第3个数据3.2是25%分位数.2.选D =×18+×24=22元/千克.3.选C 因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3.4.选D 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,50%分位数为b==15.5.选AD 设样本中男、女生身高的平均数分别为,,由题意可知,=170.2,=162.0且M=320,N=280,所以样本平均数=+=×170.2+×162.0≈166.4(cm),样本方差s2=×[2.1+(170.2-166.4)2]+×[3+(162.0-166.4)2]≈19.3,故该校高一学生的平均身高约为166.4 cm,方差约为19.3.6.解析:因为10×30%=3,甲组数据的30%分位数为第三个数和第四个数的平均数,乙组数据的中位数为第四个数和第五个数的平均数,根据题意可得=,解得a-b=8.答案:87.解析:由题意可知s2=w男[s+(男-)2]+w女[s+(女-)2],即w男[502+(70-60)2]+(1-w男)[602+(50-60)2]=602,解得w男=,w女=,因为样本中有20名男员工,则样本中女员工的人数为200.答案:2008.解:甲、乙两个品种的平均亩产量为×540+×576=556 kg;甲、乙两个品种的亩产量的方差是s2=w甲[s+(甲-)2]+w乙[s+(乙-)2]=[32+(540-556)2]+[22+(576-556)2]≈326.78.即甲、乙两个品种的平均亩产量和方差分别是556 kg,326.78.9.选BCD 对于A,a2=3a1,故A错误;对于B,由题意可知,两组数据满足yi=3xi-1(i=1,2,3,…,n),由平均数计算公式得×(y1+y2+…+yn)=×[(3x1-1)+(3x2-1)+…+(3xn-1)]=3××(x1+x2+…+xn)-1,所以b2=3b1-1,故B正确;对于C,由众数知识得c2=3c1-1,故C正确;对于D,对于数据x1,x2,x3,…,xn,假设其80%分位数为d1,当0.8n=k是整数时,d1=,当0.8n不是整数时,设其整数部分为k,则d1=xk+1,所以对于数据3x1-1,3x2-1,3x3-1,…,3xn-1,假设其80%分位数为d2,当0.8n=k是整数时,d2==3d1-1,当0.8n不是整数时,设其整数部分为k,则d2=3xk+1-1=3d1-1,所以d2=3d1-1,故D正确.10.选ABC 由频率分布直方图可知(0.024+0.036+x+0.044+0.024+0.012)×5=1,得x=0.06.故估计该校1 500名男生中身高在[165,170)内的人数为1 500×0.06×5=450,故A正确;前四组的频率之和为(0.024+0.036+0.06+0.044)×5=0.82<0.9,前五组的频率之和为0.82+0.024×5=0.94>0.9,所以90%分位数位于区间[175,180)内,故估计该校男生身高的90%分位数为175+×5≈178.3,故B正确;由频率分布直方图可知,样本中高个子男生有40人,非高个子男生有60人.将高个子男生的身高数据记为x1,x2,…,x40,其平均数记为,方差记为s;将非高个子男生的身高数据记为y1,y2,…,y60,其平均数记为,方差记为s;把全部样本数据的平均数记为,方差记为s2.则=177,s=10,=168,s2=64.由已知可得=+,即168=177×0.4+0.6,得=162,s2=[s+(-)2]+[s+(-)2].所以64=0.4×(10+92)+0.6×(s+62),解得s=10,故C正确;根据直方图可知据此估计该校男生的平均身高约为(157.5×0.024+162.5×0.036+167.5×0.06+172.5×0.044+177.5×0.024+182.5×0.012)×5=168.6,故D错误.11.解析:由s2=w1[s+(1-)2]+w2[s+(2-)2]+w3[s+(3-)2],可得2.003=[1+(2.6-3)2]+[2+(3.2-3)2]+[3+(3-3)2],解得3=3.3或2.7.答案:3.3或2.712.解:(1)甲单位5名职工成绩的平均数甲=×(87+88+91+91+93)=90(分),乙单位5名职工成绩的平均数乙=×(85+89+91+92+93)=90(分),甲单位5名职工成绩的方差s=×[(87-90)2+(88-90)2+(91-90)2+(91-90)2+(93-90)2]=4.8,乙单位5名职工成绩的方差s=×[(85-90)2+(89-90)2+(91-90)2+(92-90)2+(93-90)2]=8.∵s<s,∴甲单位职工对法律知识的掌握更为稳定.(2)∵甲单位职工的权重w甲=,乙单位职工的权重w乙=,甲=90分,乙=90分,s=4.8,s=8,∴这10名职工成绩的平均数=×90+×90=90(分),这10名职工成绩的方差s2=w甲[s+(甲-)2]+w乙[s+(乙-)2]=×[4.8+(90-90)2]+×[8+(90-90)2]=6.4.13.解:(1)由频率分布直方图知,年龄在[40,70)的频率为(0.020+0.030+0.025)×10=0.75,故这40名读书者中年龄分布在[40,70)的人数为40×0.75=30.(2)设这40名读书者年龄的50%分位数为x,则0.005×10+0.010×10+0.020×10+0.030×(x-50)=0.5,解得x=55,故这40名读书者年龄的50%分位数为55.1 / 3 展开更多...... 收起↑ 资源列表 4.2 分层随机抽样的均值与方差、百分位数.doc 4.2 分层随机抽样的均值与方差、百分位数.pptx 课时跟踪检测(四十五) 分层随机抽样的均值与方差、百分位数.doc