资源简介 4.2 分层随机抽样的均值与方差 4.3 百分位数1.已知有8个样本数据分别为4,7,8,11,13,15,20,22,则估计该组数据的75%分位数为( )A.9 B.12C.17.5 D.212.用分层随机抽样的方法抽得两组数据的平均数分别为8,12,若这两组数据的平均数是10,则这两组数据的权重比值为( )A. B.1C. D.23.某房地产公司为了解小区业主对户型结构——平层与复式结构的满意度,采取分层随机抽样方式对中央公园小区的业主进行问卷调查.20位已购买平层户型的业主满意度平均分为8,30位已购买复式户型的业主满意度平均分为9.若用样本平均数估计该小区业主对户型结构满意度的平均分,则其值为( )A.8.4 B.8.5C.8.6 D.8.74.期中考试后,班长算出了全班40人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均数为N,那么=( )A. B.1C. D.25.(多选)某校高一(1)班某次测试数学成绩累积频数分布折线图如图所示,则下列说法正确的是( )A.没有人的成绩在30~40分这组内B.50%分位数位于60~70分这组内C.25%分位数位于40~50分这组内D.75%分位数位于70~80分这组内6.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数大于乙的成绩的中位数C.甲的成绩的80%分位数等于乙的成绩的80%分位数D.甲的成绩的极差大于乙的成绩的极差7.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是 分.8.某校的男生、女生人数之比为2∶3,按照男女比例通过分层随机抽样的方法抽到一个样本,样本中男生和女生每天运动时间的平均数分别为100 min和80 min,则估计该校全体学生每天运动时间的平均数为 min.9.为调查高一年级学生期中考试数学成绩的情况,从(1)班抽取了12名学生的成绩,他们的平均分为91分,方差为3,从(2)班抽取了8名学生的成绩,他们的平均分为89分,方差为5,则合在一起后的样本均值为 ,样本方差为 .10.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂各随机选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:分别求甲、乙两厂样本轮胎宽度的10%分位数与90%分位数.11.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取10位某地市民,他们的幸福感指数为3,4,5,5,6,7,7,8,9,10.则这组数据的75%分位数是( )A.7 B.7.5C.8 D.8.512.某地区想实行阶梯电价,经调查发现,该地区居民用电量信息如下:分位数 50%分位数 70%分位数 80%分位数 90%分位数用电量/(kW·h) 160 176 215 230如果要求约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,可确定第二阶梯电价的用电量/(kW·h)范围为( )A.(160,176] B.(176,215]C.(176,230] D.(230,+∞)13.(多选)某班有50名学生,其中有30名男生和20名女生,随机询问了该班6名男生和4名女生在某次数学测验中的成绩,6名男生的成绩分别为86分,94分,88分,92分,90分,90分,4名女生的成绩分别为90分,93分,93分,88分,则下列说法正确的是( )A.这种抽样方法是分层随机抽样B.该班男生成绩的平均数小于该班女生成绩的平均数C.这6名男生成绩的方差大于这4名女生成绩的方差D.被抽取的10名学生成绩的平均数和方差分别为90.4分和6.0414.一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车A 轿车B 轿车C舒适型(单位:辆) 100 150 z售价(单位:万元) 12 16 18标准型(单位:辆) 300 450 600售价(单位:万元) 16 18 20按类型用分层随机抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆,其中z的值由于表格污损而不可知,则该汽车厂在该月生产的所有轿车的平均售价为 万元.15.某网络营销部门随机抽查了某市200名网友在2023年11月11日的网购金额,所得数据如下表:网购金额(单位:千元) 人数 频率[0,1) 16 0.08[1,2) 24 0.12[2,3) x p[3,4) y q[4,5) 16 0.08[5,6] 14 0.07合计 200 1.00已知网购金额不超过3千元与超过3千元的人数比恰为3∶2.(1)试确定x,y,p,q的值,并补全频率分布直方图(如图);(2)估计网购金额的25%分位数(结果保留3位有效数字).16.某学校统计教师职称及年龄,中级职称教师的人数为50,其平均年龄为38岁,方差是2,高级职称的教师中有3人58岁,5人40岁,2人38岁,求该校中级职称和高级职称教师年龄的平均数和方差.4.2 分层随机抽样的均值与方差4.3 百分位数1.C 8×0.75=6,故该组数据的75%分位数为第6个数和第7个数的平均数=17.5.故选C.2.B 设两组数据的权重分别为w1,w2,由w1×8+w2×12=10,又w1+w2=1,可解得w1=w2=,所以这两组数据的权重比值为1.3.C 估计小区业主对户型结构满意度的平均分为=×8+×9=8.6,故选C.4.B 平均数是用所有数据的和除以数据的总个数而得到的.设40位同学的成绩为xi(i=1,2,…,40),则M=,N==M,故=1.5.ABC 由题图知没有人的成绩在30~40分这组内,故A正确;由40×50%=20,取第20,21项数据的平均数,所以50%分位数位于60~70分这组内,故B正确;由40×25%=10,取第10,11项数据的平均数,所以25%分位数位于40~50分这组内,故C正确;由40×75%=30,取第30,31项数据的平均数,所以75%分位数位于60~70分这组内,故D不正确.故选A、B、C.6.BC 由题图可得,==6,==6,A项错误;甲的成绩的中位数为6,乙的成绩的中位数为5,B项正确;甲的成绩的80%分位数为=7.5,乙的成绩的80%分位数为=7.5,所以二者相等,所以C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项不正确.7.85 解析:由题意得,该校数学建模兴趣班的平均成绩是=85(分).8.88 解析:由题意,不妨设男生人数为2x,女生人数为3x,估计该校全体学生每天运动时间的平均数为=88(min).9.90.2 4.76 解析:样本均值==90.2,样本方差s2==4.76.10.解:甲厂轮胎宽度的数据从小到大排列,得193,193,194,194,195,195,196,196,197,197.又10×10%=1,10×90%=9,所以10%分位数为第1项与第2项数据的平均数,即193 mm;90%分位数为第9项与第10项数据的平均数,即197 mm.乙厂轮胎宽度的数据从小到大排列,得193,193,194,194,195,196,196,196,196,197,所以10%分位数为193 mm,90%分位数为196.5 mm.11.C 由题意,这10个人的幸福指数已经从小到大排列,因为75%×10=7.5,所以这10个人的75%分位数是从小到大排列后第8个人的幸福指数,即8.故选C.12.C ∵约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,∴由表中数据可得,第二阶梯电价的用电量/(kW·h)范围为(176,230].故选C.13.ACD 因为该班有30名男生和20名女生且抽取的男生和女生的比为3∶2,所以这种抽样方法是分层随机抽样,A正确;抽取的6名男生成绩的平均数==90(分),抽取的4名女生成绩的平均数==91(分),虽然<,但并不一定能说明该班男生成绩的平均数小于该班女生成绩的平均数,B不一定正确;这6名男生成绩的方差=×[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2+(90-90)2]=,这4名女生成绩的方差=×[(90-91)2+(93-91)2+(93-91)2+(88-91)2]=,因为>,所以C正确; 被抽取的10名学生成绩的平均数=×90+×91=90.4(分),被抽取的10名学生成绩的方差s2=×[+(90-90.4)2]+×[+(91-90.4)2]=6.04,D正确.故选A、C、D.14.17.85 解析:由已知=,解得z=400,所以该汽车厂在该月生产的汽车总数为100+300+150+450+400+600=2 000(辆),该汽车厂在该月生产的所有轿车的平均售价为=×12+×16+×16+×18+×18+×20=17.85(万元).15.解:(1)根据题意有解得所以p=0.4,q=0.25.补全频率分布直方图如图所示.(2)由(1)可知,网购金额不高于2千元的频率为0.08+0.12=0.2,网购金额不高于3千元的频率为0.2+0.4=0.6,所以网购金额的25%分位数在[2,3)内,则网购金额的25%分位数为2+×1≈2.13(千元).16.解:由已知条件可知高级职称教师的平均年龄为==45(岁),年龄的方差为=×[3×(58-45)2+5×(40-45)2+2×(38-45)2]=73,所以该校中级职称和高级职称教师的平均年龄为=×38+×45≈39.2(岁),该校中级职称和高级职称教师的年龄的方差是s2=×[2+(38-39.2)2]+×[73+(45-39.2)2]=20.64.3 / 34.2 分层随机抽样的均值与方差 4.3 百分位数新课程标准解读 核心素养1.结合实例,能用样本估计总体的取值规律.掌握分层随机抽样的均值与方差 数据分析2.结合实例,能用样本估计百分位数,理解百分位数的统计含义 数据运算、数据分析 甲班和乙班各有学生20人、40人,甲班的数学成绩的平均数为80分,方差为2,乙班的数学成绩的平均数为82分,方差为4.【问题】 甲班和乙班这60人的数学成绩的平均分是=81分吗?方差是=3吗?为什么? 知识点一 分层随机抽样的均值与方差1.分层随机抽样的平均数(1)一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为=·+·.于是,当已知上述两层构成的新样本中每层的平均数分别为和时,可得这个新样本的平均数为+.记w1=,w2=,则这个新样本的平均数为 ,其中w1,w2称为权重;(2)设样本中不同层的平均数和相应权重分别为,,…,和w1,w2,…,wn,则这个样本的平均数为 .为了简化表示,引进求和符号,记作 =wi.2.分层随机抽样的方差设样本中不同层的平均数分别为,,…,,方差分别为,,…,,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2= ,其中为这个样本的平均数.知识点二 百分位数1.p分位数一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数 它的可能性是p.2.四分位数 , , 分位数是三个常用的百分位数.把总体数据按照 排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是.因此这三个百分位数也称为总体的四分位数.3.计算p分位数的一般步骤第1步,按照 排列原始数据;第2步,计算i= ;第3步,若i不是整数,大于i的 整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的 .【想一想】1.某班级人数为50,班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?2.“这次数学测试成绩的70%分位数是85分”这句话是什么意思?1.判断正误.(正确的画“√”,错误的画“×”)(1)50%分位数就是中位数.( )(2)100个数据的80%分位数是85,那么这100个数据中一定有80个数小于或等于85.( )(3)按照定义可知,p分位数可能不唯一,也正因为如此,各种统计软件所得出的p分位数可能会有差异.( )2.下列关于p分位数的说法正确的是( )A.数据1,2,2,3,5,6,6,7,8,8的40%分位数为4,75%分位数为7B.50%分位数是总体数据中的任意一个数小于它的可能性一定是50%C.p分位数一定是这组数据中的一个数据D.p分位数适用于总体是离散型的数据3.已知某省二、三、四线城市数量之比为1∶3∶6,2023年8月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市的房价的方差为 .题型一 分层随机抽样的均值与方差的计算【例1】 (1)(多选)某分层随机抽样中,有关数据如下:样本量 均值 方差第1层 45 4 2第2层 35 8 1第3层 10 6 3则下列叙述正确的是(结果保留两位小数)( )A.第1,2层所有数据的均值为5.75B.第1,2层所有数据的方差为1.50C.第1,2,3层所有数据的均值约为7.68D.第1,2,3层所有数据的方差约为5.23(2)已知甲、乙两地人口之比为2∶3,其中甲地人均年收入为8万元,乙地人均年收入为10万元,则甲、乙两地的人均年收入为 万元.尝试解答通性通法1.分层随机抽样的平均数的计算方法(1)第i层的权重wi、第i层的个体数xi、样本容量n,三者满足wi=,已知其中2个可求另外1个;(2)利用公式=w1+w2+…+wn求分层随机抽样的平均数.2.计算分层随机抽样的方差s2的步骤(1)确定,,…,,,,…,,w1,w2,…,wn;(2)确定;(3)应用公式s2=wi[+(-)2]计算s2.【跟踪训练】 在对某中学高一年级学生身高(单位:cm)的调查中,采用分层随机抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?题型二 百分位数的计算【例2】 从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的25%,75%,95%分位数;(2)请你找出珍珠质量较小的前15%的珍珠质量;(3)若用25%,50%,95%分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.尝试解答通性通法 计算百分位数时,可先将这组数据按从小到大的顺序排列,再根据定义计算.【跟踪训练】 某校年级组长为了解本校高三学生一模考试的数学成绩(单位:分),随机抽取30名学生的一模数学成绩,如下所示:110 144 125 63 89 121 145 123 74 9697 142 115 68 83 116 139 124 85 98132 147 128 133 99 117 107 113 96 141估计该校高三学生一模数学成绩的25%分位数为 分,50%分位数为 分.题型三 百分位数的应用【例3】 某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值;(3)根据(2)中求得的数据计算用电量的75%分位数.尝试解答【母题探究】(变设问)根据本例(2)中求得的数据计算用电量的15%分位数.通性通法 根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用方程的思想方法,设出百分位数,解方程可得.【跟踪训练】 某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人.(1)求x;(2)求抽取的x人的年龄的50%分位数(结果保留整数);(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“中国梦”的伟大构想的认知程度,并谈谈你的感想.1.下列一组数据的25%分位数是( )2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A.3.2 B.3.0C.4.4 D.2.52.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:班级 人数 平均分数 方差甲 30 2乙 20 3其中=,则甲、乙两个班数学成绩的方差为( )A.2.2 B.2.6C.2.5 D.2.43.(多选)已知100个数据的75%分位数是9.3,则下列说法正确的是( )A.这100个数据中至少有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个与第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个与第74个数据的平均数4.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层随机抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为 ;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为 小时.4.2 分层随机抽样的均值与方差4.3 百分位数【基础知识·重落实】知识点一1.(1)w1+w2 (2)w1+w2+…+wn w1+w2+…+wn 2.wi[+(-)2]知识点二1.小于或等于 2.25% 50% 75% 从小到大 3.从小到大 np 最小 平均数想一想1.提示:不是.是指能够考取本科院校的同学占同学总数的百分比.2.提示:有70%的同学数学测试成绩小于或等于85分.自我诊断1.(1)√ (2)× (3)√2.A 由百分位数的意义可知选项B、C、D错误.3.118.52 解析:设二线城市的房价的方差为s2,由题意可知20=[s2+(2.4-1.2)2]+[10+(1.8-1.2)2]+[8+(0.8-1.2)2],解得s2=118.52,即二线城市的房价的方差为118.52.【典型例题·精研析】【例1】 (1)AD (2)9.2 解析:(1)第1,2层所有数据的均值为=×4+×8=5.75,A正确;第1,2层所有数据的方差为=×[2+(4-5.75)2]+×[1+(8-5.75)2]=5.5,B不正确;第1,2,3层所有数据的均值约为=×4+×8+×6≈5.78,C不正确;第1,2,3层所有数据的方差约为s2=×[2+(4-5.78)2]+×[1+(8-5.78)2]+×[3+(6-5.78)2]≈5.23,D正确.(2)=×8+×10=9.2(万元).跟踪训练 解:把样本中男生的身高记为x1,x2,…,x23,其平均数记为,方差记为;把样本中女生的身高记为y1,y2,…,y27,其平均数记为,方差记为,把样本的平均数记为,方差记为s2.则==165.2,s2===51.486 2,即样本的方差为51.486 2.因此估计高一年级全体学生身高的方差为51.486 2.【例2】 解:(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,则25%分位数是=8.15,75%分位数是=8.75,95%分位数是第12个数据9.9.(2)因为共有12个数据,所以12×15%=1.8,则15%分位数是第2个数据7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,7.9 g.(3)由(1)可知珍珠质量的25%分位数是8.15 g,50%分位数为8.5 g,95%分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.跟踪训练 96 115.5 解析:把这30名学生的数学成绩按从小到大的顺序排列,得63,68,74,83,85,89,96,96,97,98,99,107,110,113,115,116,117,121,123,124,125,128,132,133,139,141,142,144,145,147.因为30×25%=7.5,30×50%=15,所以这30名学生一模数学成绩的25%分位数为96分,50%分位数为=115.5(分).据此可以估计本校高三学生一模数学成绩的25%分位数为96分,50%分位数为115.5分.【例3】 解:(1)当0≤x≤200时,y=0.5x;当200<x≤400时,y=0.5×200+0.8×(x-200)=0.8x-60;当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.所以y与x之间的函数解析式为y=(2)由(1)可知,当y=260时,x=400,即用电量不超过400千瓦时的占80%,结合频率分布直方图可知解得a=0.001 5,b=0.002 0.(3)设75%分位数为m,因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,用电量不超过400千瓦时的占80%,所以75%分位数m在[300,400)内,所以0.6+(m-300)×0.002=0.75,解得m=375千瓦时,即用电量的75%分位数为375千瓦时.母题探究 解:设15%分位数为x,因为用电量低于100千瓦时的所占比例为0.001×100=10%,用电量不超过200千瓦时的占30%,所以15%分位数x在[100,200)内,所以0.1+(x-100)×0.002=0.15,解得x=125千瓦时,即用电量的15%分位数为125千瓦时.跟踪训练 解:(1)第一组频率为0.01×5=0.05,所以x==100.(2)由题图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的x人的年龄的50%分位数在[30,35)内,由30+5×=≈32(岁),所以抽取的x人的年龄的50%分位数为32岁.(3)把参赛的10人的成绩按从小到大的顺序排列:88,90,92,92,95,96,96,97,98,99,计算10×20%=2,所以这10人成绩的20%分位数为=91(分),这10人成绩的平均数为(88+90+92+92+95+96+96+97+98+99)=94.3(分).评价:从百分位数和平均数来看,参赛人员的认知程度很高.感想:略(结合本题和实际,符合社会主义核心价值观即可).随堂检测1.A 把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i=10×25%=2.5,不是整数,则第3个数据3.2是该组数据的25%分位数.2.D 由题意知,甲、乙两个班数学成绩的平均数为==,则两个班数学成绩的方差为s2=[2+(-)2]+[3+(-)2]=+=2.4.故选D.3.AC 易知选项A正确;当这100个数据均为9.3时,把这100个数据从小到大排列后,9.3不一定是第75个数据,选项B判断错误;把这100个数据从小到大排列后,9.3是第75个与第76个数据的平均数,则选项C判断正确,选项D判断错误.故选A、C.4.50 1 015 解析:由分层随机抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1 020×50%+980×20%+1 030×30%=1 015(小时).5 / 5(共81张PPT)4.2 分层随机抽样的均值与方差4.3 百分位数新课程标准解读 核心素养1.结合实例,能用样本估计总体的取值规律.掌握分层随机抽样的均值与方差 数据分析2.结合实例,能用样本估计百分位数,理解百分位数的统计含义 数据运算、数据分析目录基础知识·重落实01典型例题·精研析02知能演练·扣课标03基础知识·重落实01课前预习 必备知识梳理 甲班和乙班各有学生20人、40人,甲班的数学成绩的平均数为80分,方差为2,乙班的数学成绩的平均数为82分,方差为4.【问题】 甲班和乙班这60人的数学成绩的平均分是 =81分吗?方差是 =3吗?为什么? 知识点一 分层随机抽样的均值与方差1. 分层随机抽样的平均数(1)一般地,将样本 a1, a2,…, am 和样本 b1, b2,…, bn 合并成一个新样本,则这个新样本的平均数为= · +· .于是,当已知上述两层构成的新样本中每层的平均数分别为和 时,可得这个新样本的平均数为 + .记 w1= , w2= ,则这个新样本的平均数为 w1,其中 w1, w2称为权重;w1+ w2 (2)设样本中不同层的平均数和相应权重分别为 , ,…,和 w1, w2,…, wn ,则这个样本的平均数为 w1 + w2.为了简化表示,引进求和符号,记作 + w2 +…+ wn = wi .w1 + w2+…+ wn w1+ w2 +…+ wn 2. 分层随机抽样的方差设样本中不同层的平均数分别为 , ,…, ,方差分别为, ,…, ,相应的权重分别为 w1, w2,…, wn ,则这个样本的方差为 s2= ,其中 为这个样本的平均数.wi [ +( - )2]知识点二 百分位数1. p 分位数一般地,当总体是连续变量时,给定一个百分数 p ∈(0,1),总体的 p 分位数有这样的特点:总体数据中的任意一个数 它的可能性是 p .小于或等于 2. 四分位数, , 分位数是三个常用的百分位数.把总体数据按照 排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是 .因此这三个百分位数也称为总体的四分位数.25% 50% 75% 从小到大 3. 计算 p 分位数的一般步骤第1步,按照 排列原始数据;第2步,计算 i = ;第3步,若 i 不是整数,大于 i 的 整数为 j ,则 p 分位数为第j 项数据;若 i 是整数,则 p 分位数为第 i 项与第( i +1)项数据的 .【想一想】1. 某班级人数为50,班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?从小到大 np 最小 平均数 提示:不是.是指能够考取本科院校的同学占同学总数的百分比.2. “这次数学测试成绩的70%分位数是85分”这句话是什么意思?提示:有70%的同学数学测试成绩小于或等于85分.1. 判断正误.(正确的画“√”,错误的画“×”)(1)50%分位数就是中位数. ( √ )(2)100个数据的80%分位数是85,那么这100个数据中一定有80个数小于或等于85. ( × )(3)按照定义可知, p 分位数可能不唯一,也正因为如此,各种统计软件所得出的 p 分位数可能会有差异. ( √ )√×√2. 下列关于 p 分位数的说法正确的是( )A. 数据1,2,2,3,5,6,6,7,8,8的40%分位数为4,75%分位数为7B. 50%分位数是总体数据中的任意一个数小于它的可能性一定是50%C. p 分位数一定是这组数据中的一个数据D. p 分位数适用于总体是离散型的数据解析: 由百分位数的意义可知选项B、C、D错误.3. 已知某省二、三、四线城市数量之比为1∶3∶6,2023年8月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市的房价的方差为 .解析:设二线城市的房价的方差为 s2,由题意可知20= [ s2+(2.4-1.2)2]+ [10+(1.8-1.2)2]+ [8+(0.8-1.2)2],解得 s2=118.52,即二线城市的房价的方差为118.52.118.52 典型例题·精研析02课堂互动 关键能力提升题型一 分层随机抽样的均值与方差的计算【例1】 (1)(多选)某分层随机抽样中,有关数据如下:样本量 均值 方差第1层 45 4 2第2层 35 8 1第3层 10 6 3A. 第1,2层所有数据的均值为5.75B. 第1,2层所有数据的方差为1.50C. 第1,2,3层所有数据的均值约为7.68D. 第1,2,3层所有数据的方差约为5.23则下列叙述正确的是(结果保留两位小数)( AD )AD解析:第1,2层所有数据的均值为 = ×4+ ×8=5.75,A正确;第1,2层所有数据的方差为 = ×[2+(4-5.75)2]+ ×[1+(8-5.75)2]=5.5,B不正确;第1,2,3层所有数据的均值约为 = ×4+ ×8+ ×6≈5.78,C不正确;第1,2,3层所有数据的方差约为 s2= ×[2+(4-5.78)2]+ ×[1+(8-5.78)2]+ ×[3+(6-5.78)2]≈5.23,D正确.(2)已知甲、乙两地人口之比为2∶3,其中甲地人均年收入为8万元,乙地人均年收入为10万元,则甲、乙两地的人均年收入为 万元.解析: = ×8+ ×10=9.2(万元).9.2 通性通法1. 分层随机抽样的平均数的计算方法(1)第 i 层的权重 wi 、第 i 层的个体数 xi 、样本容量 n ,三者满足wi = ,已知其中2个可求另外1个;(2)利用公式 = w1 + w2 +…+ wn 求分层随机抽样的平均数.2. 计算分层随机抽样的方差 s2的步骤(1)确定 , ,…, , , ,…, , w1, w2,…,wn ;(2)确定 ;(3)应用公式 s2= wi [ +( - )2]计算 s2.【跟踪训练】在对某中学高一年级学生身高(单位:cm)的调查中,采用分层随机抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?解:把样本中男生的身高记为 x1, x2,…, x23,其平均数记为 ,方差记为 ;把样本中女生的身高记为 y1, y2,…, y27,其平均数记为,方差记为 ,把样本的平均数记为 ,方差记为 s2.则 = =165.2,s2===51.486 2,即样本的方差为51.486 2.因此估计高一年级全体学生身高的方差为51.486 2.题型二 百分位数的计算【例2】 从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的25%,75%,95%分位数;解:将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,则25%分位数是 =8.15,75%分位数是 =8.75,95%分位数是第12个数据9.9.(2)请你找出珍珠质量较小的前15%的珍珠质量;解:因为共有12个数据,所以12×15%=1.8,则15%分位数是第2个数据7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8g,7.9 g.(3)若用25%,50%,95%分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解:由(1)可知珍珠质量的25%分位数是8.15 g,50%分位数为8.5 g,95%分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.通性通法 计算百分位数时,可先将这组数据按从小到大的顺序排列,再根据定义计算.【跟踪训练】 某校年级组长为了解本校高三学生一模考试的数学成绩(单位:分),随机抽取30名学生的一模数学成绩,如下所示:110 144 125 63 89 121 145 123 74 9697 142 115 68 83 116 139 124 85 98132 147 128 133 99 117 107 113 96 141估计该校高三学生一模数学成绩的25%分位数为 分,50%分位数为 分.96 115.5 解析:把这30名学生的数学成绩按从小到大的顺序排列,得63,68,74,83,85,89,96,96,97,98,99,107,110,113,115,116,117,121,123,124,125,128,132,133,139,141,142,144,145,147.因为30×25%=7.5,30×50%=15,所以这30名学生一模数学成绩的25%分位数为96分,50%分位数为 =115.5(分).据此可以估计本校高三学生一模数学成绩的25%分位数为96分,50%分位数为115.5分.题型三 百分位数的应用【例3】 某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用 y (单位:元)关于月用电量 x (单位:千瓦时)的函数解析式;解:当0≤ x ≤200时, y =0.5 x ;当200< x ≤400时, y =0.5×200+0.8×( x -200)=0.8 x -60;当 x >400时, y =0.5×200+0.8×200+1.0×( x -400)= x -140.所以 y 与 x 之间的函数解析式为y =(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求 a , b 的值;解:由(1)可知,当 y =260时, x =400,即用电量不超过400千瓦时的占80%,结合频率分布直方图可知解得 a =0.001 5, b =0.002 0.(3)根据(2)中求得的数据计算用电量的75%分位数.解:设75%分位数为 m ,因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,用电量不超过400千瓦时的占80%,所以75%分位数 m 在[300,400)内,所以0.6+( m -300)×0.002=0.75,解得 m =375千瓦时,即用电量的75%分位数为375千瓦时.【母题探究】(变设问)根据本例(2)中求得的数据计算用电量的15%分位数.解:设15%分位数为 x ,因为用电量低于100千瓦时的所占比例为0.001×100=10%,用电量不超过200千瓦时的占30%,所以15%分位数 x 在[100,200)内,所以0.1+( x -100)×0.002=0.15,解得 x =125千瓦时,即用电量的15%分位数为125千瓦时.通性通法 根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用方程的思想方法,设出百分位数,解方程可得.【跟踪训练】某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了 x 人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人.(1)求 x ;解:第一组频率为0.01×5=0.05,所以 x = =100.(2)求抽取的 x 人的年龄的50%分位数(结果保留整数);解:由题图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的 x 人的年龄的50%分位数在[30,35)内,由30+5× = ≈32(岁),所以抽取的x 人的年龄的50%分位数为32岁.(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“中国梦”的伟大构想的认知程度,并谈谈你的感想.解:把参赛的10人的成绩按从小到大的顺序排列:88,90,92,92,95,96,96,97,98,99,计算10×20%=2,所以这10人成绩的20%分位数为 =91(分),这10人成绩的平均数为 (88+90+92+92+95+96+96+97+98+99)=94.3(分).评价:从百分位数和平均数来看,参赛人员的认知程度很高.感想:略(结合本题和实际,符合社会主义核心价值观即可).1. 下列一组数据的25%分位数是( )2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A. 3.2 B. 3.0C. 4.4 D. 2.5解析: 把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由 i =10×25%=2.5,不是整数,则第3个数据3.2是该组数据的25%分位数.2. 在高一期中考试中,甲、乙两个班的数学成绩统计如下表:班级 人数 平均分数 方差甲 30 2乙 20 3其中 = ,则甲、乙两个班数学成绩的方差为( )A. 2.2 B. 2.6C. 2.5 D. 2.4解析: 由题意知,甲、乙两个班数学成绩的平均数为 = =,则两个班数学成绩的方差为 s2= [2+( - )2]+[3+( - )2]= + =2.4.故选D.3. (多选)已知100个数据的75%分位数是9.3,则下列说法正确的是( )A. 这100个数据中至少有75个数小于或等于9.3B. 把这100个数据从小到大排列后,9.3是第75个数据C. 把这100个数据从小到大排列后,9.3是第75个与第76个数据的平均数D. 把这100个数据从小到大排列后,9.3是第75个与第74个数据的平均数解析: 易知选项A正确;当这100个数据均为9.3时,把这100个数据从小到大排列后,9.3不一定是第75个数据,选项B判断错误;把这100个数据从小到大排列后,9.3是第75个与第76个数据的平均数,则选项C判断正确,选项D判断错误.故选A、C.4. 某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层随机抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为 ;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为 小时.50 1 015 解析:由分层随机抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1 020×50%+980×20%+1 030×30%=1 015(小时).知能演练·扣课标03课后巩固 核心素养落地1. 已知有8个样本数据分别为4,7,8,11,13,15,20,22,则估计该组数据的75%分位数为( )A. 9 B. 12C. 17.5 D. 21解析: 8×0.75=6,故该组数据的75%分位数为第6个数和第7个数的平均数 =17.5.故选C.123456789101112131415162. 用分层随机抽样的方法抽得两组数据的平均数分别为8,12,若这两组数据的平均数是10,则这两组数据的权重比值为( )B. 1D. 2解析: 设两组数据的权重分别为 w1, w2,由 w1×8+ w2×12=10,又 w1+ w2=1,可解得 w1= w2= ,所以这两组数据的权重比值为1.123456789101112131415163. 某房地产公司为了解小区业主对户型结构——平层与复式结构的满意度,采取分层随机抽样方式对中央公园小区的业主进行问卷调查.20位已购买平层户型的业主满意度平均分为8,30位已购买复式户型的业主满意度平均分为9.若用样本平均数估计该小区业主对户型结构满意度的平均分,则其值为( )A. 8.4 B. 8.5C. 8.6 D. 8.712345678910111213141516解析: 估计小区业主对户型结构满意度的平均分为 =×8+ ×9=8.6,故选C.123456789101112131415164. 期中考试后,班长算出了全班40人数学成绩的平均分为 M ,如果把 M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均数为 N ,那么 =( )B. 1解析: 平均数是用所有数据的和除以数据的总个数而得到的.设40位同学的成绩为 xi ( i =1,2,…,40),则 M =, N = = M ,故 =1.D. 2123456789101112131415165. (多选)某校高一(1)班某次测试数学成绩累积频数分布折线图如图所示,则下列说法正确的是( )A. 没有人的成绩在30~40分这组内B. 50%分位数位于60~70分这组内C. 25%分位数位于40~50分这组内D. 75%分位数位于70~80分这组内12345678910111213141516解析: 由题图知没有人的成绩在30~40分这组内,故A正确;由40×50%=20,取第20,21项数据的平均数,所以50%分位数位于60~70分这组内,故B正确;由40×25%=10,取第10,11项数据的平均数,所以25%分位数位于40~50分这组内,故C正确;由40×75%=30,取第30,31项数据的平均数,所以75%分位数位于60~70分这组内,故D不正确.故选A、B、C.123456789101112131415166. (多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A. 甲的成绩的平均数小于乙的成绩的平均数B. 甲的成绩的中位数大于乙的成绩的中位数C. 甲的成绩的80%分位数等于乙的成绩的80%分位数D. 甲的成绩的极差大于乙的成绩的极差12345678910111213141516解析: 由题图可得, = =6, = =6,A项错误;甲的成绩的中位数为6,乙的成绩的中位数为5,B项正确;甲的成绩的80%分位数为 =7.5,乙的成绩的80%分位数为 =7.5,所以二者相等,所以C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项不正确.123456789101112131415167. 某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是 分.解析:由题意得,该校数学建模兴趣班的平均成绩是=85(分).85 123456789101112131415168. 某校的男生、女生人数之比为2∶3,按照男女比例通过分层随机抽样的方法抽到一个样本,样本中男生和女生每天运动时间的平均数分别为100 min和80 min,则估计该校全体学生每天运动时间的平均数为 min.解析:由题意,不妨设男生人数为2 x ,女生人数为3 x ,估计该校全体学生每天运动时间的平均数为 =88(min).88 123456789101112131415169. 为调查高一年级学生期中考试数学成绩的情况,从(1)班抽取了12名学生的成绩,他们的平均分为91分,方差为3,从(2)班抽取了8名学生的成绩,他们的平均分为89分,方差为5,则合在一起后的样本均值为 ,样本方差为 .解析:样本均值 = =90.2,样本方差 s2==4.76.90.2 4.76 1234567891011121314151610. 为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂各随机选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:分别求甲、乙两厂样本轮胎宽度的10%分位数与90%分位数.12345678910111213141516解:甲厂轮胎宽度的数据从小到大排列,得193,193,194,194,195,195,196,196,197,197.又10×10%=1,10×90%=9,所以10%分位数为第1项与第2项数据的平均数,即193 mm;90%分位数为第9项与第10项数据的平均数,即197 mm.乙厂轮胎宽度的数据从小到大排列,得193,193,194,194,195,196,196,196,196,197,所以10%分位数为193 mm,90%分位数为196.5 mm.1234567891011121314151611. “幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取10位某地市民,他们的幸福感指数为3,4,5,5,6,7,7,8,9,10.则这组数据的75%分位数是( )A. 7 B. 7.5C. 8 D. 8.512345678910111213141516解析: 由题意,这10个人的幸福指数已经从小到大排列,因为75%×10=7.5,所以这10个人的75%分位数是从小到大排列后第8个人的幸福指数,即8.故选C.1234567891011121314151612. 某地区想实行阶梯电价,经调查发现,该地区居民用电量信息如下:分位数 50%分位数 70%分位数 80%分位数 90%分位数用电量/(kW·h) 160 176 215 230如果要求约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,可确定第二阶梯电价的用电量/(kW·h)范围为( )A. (160,176] B. (176,215]C. (176,230] D. (230,+∞)12345678910111213141516解析: ∵约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,∴由表中数据可得,第二阶梯电价的用电量/(kW·h)范围为(176,230].故选C.1234567891011121314151613. (多选)某班有50名学生,其中有30名男生和20名女生,随机询问了该班6名男生和4名女生在某次数学测验中的成绩,6名男生的成绩分别为86分,94分,88分,92分,90分,90分,4名女生的成绩分别为90分,93分,93分,88分,则下列说法正确的是( )A. 这种抽样方法是分层随机抽样B. 该班男生成绩的平均数小于该班女生成绩的平均数C. 这6名男生成绩的方差大于这4名女生成绩的方差D. 被抽取的10名学生成绩的平均数和方差分别为90.4分和6.0412345678910111213141516解析: 因为该班有30名男生和20名女生且抽取的男生和女生的比为3∶2,所以这种抽样方法是分层随机抽样,A正确;抽取的6名男生成绩的平均数 = =90(分),抽取的4名女生成绩的平均数 = =91(分),虽然< ,但并不一定能说明该班男生成绩的平均数小于该班女生成绩的平均数,B不一定正确;12345678910111213141516这6名男生成绩的方差 = ×[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2+(90-90)2]= ,这4名女生成绩的方差 = ×[(90-91)2+(93-91)2+(93-91)2+(88-91)2]= ,因为 > ,所以C正确; 被抽取的10名学生成绩的平均数 = ×90+ ×91=90.4(分),被抽取的10名学生成绩的方差 s2= ×[ +(90-90.4)2]+ ×[ +(91-90.4)2]=6.04,D正确.故选A、C、D.1234567891011121314151614. 一汽车厂生产 A , B , C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车 A 轿车 B 轿车 C舒适型(单位:辆) 100 150 z售价(单位:万元) 12 16 18标准型(单位:辆) 300 450 600售价(单位:万元) 16 18 2012345678910111213141516按类型用分层随机抽样的方法在这个月生产的轿车中抽取50辆,其中有 A 类轿车10辆,其中 z 的值由于表格污损而不可知,则该汽车厂在该月生产的所有轿车的平均售价为 万元.解析:由已知 = ,解得 z =400,所以该汽车厂在该月生产的汽车总数为100+300+150+450+400+600=2 000(辆),该汽车厂在该月生产的所有轿车的平均售价为 = ×12+ ×16+ ×16+ ×18+ ×18+ ×20=17.85(万元).17.85 1234567891011121314151615. 某网络营销部门随机抽查了某市200名网友在2023年11月11日的网购金额,所得数据如下表:网购金额(单位:千元) 人数 频率[0,1) 16 0.08[1,2) 24 0.12[2,3) x p[3,4) y q[4,5) 16 0.08[5,6] 14 0.07合计 200 1.00已知网购金额不超过3千元与超过3千元的人数比恰为3∶2.12345678910111213141516(1)试确定 x , y , p , q 的值,并补全频率分布直方图(如图);12345678910111213141516解:根据题意有解得所以 p =0.4, q =0.25.补全频率分布直方图如图所示.12345678910111213141516(2)估计网购金额的25%分位数(结果保留3位有效数字).解:由(1)可知,网购金额不高于2千元的频率为0.08+0.12=0.2,网购金额不高于3千元的频率为0.2+0.4=0.6,所以网购金额的25%分位数在[2,3)内,则网购金额的25%分位数为2+ ×1≈2.13(千元).1234567891011121314151616. 某学校统计教师职称及年龄,中级职称教师的人数为50,其平均年龄为38岁,方差是2,高级职称的教师中有3人58岁,5人40岁,2人38岁,求该校中级职称和高级职称教师年龄的平均数和方差.解:由已知条件可知高级职称教师的平均年龄为= =45(岁),年龄的方差为 = ×[3×(58-45)2+5×(40-45)2+2×(38-45)2]=73,所以该校中级职称和高级职称教师的平均年龄为12345678910111213141516= ×38+ ×45≈39.2(岁),该校中级职称和高级职称教师的年龄的方差是s2= ×[2+(38-39.2)2]+ ×[73+(45-39.2)2]=20.64.12345678910111213141516谢 谢 观 看! 展开更多...... 收起↑ 资源列表 4.2 分层随机抽样的均值与方差 4.3 百分位数(练习,含解析).docx 4.2 分层随机抽样的均值与方差 4.3 百分位数.docx 4.2 分层随机抽样的均值与方差 4.3 百分位数.pptx