资源简介 (共42张PPT)§4 用样本估计总体的数字特征4.1 样本的数字特征第六章 统计情境导学·探新知NO.1最多从小到大中间平均数最大值最小值平均数合作探究·释疑难NO.2类型1 平均数、中位数和众数的计算类型2 根据频率分布直方图求平均数、中位数和众数类型3 极差、方差、标准差的计算及应用当堂达标·夯基础NO.312345123451234512345123451234551234频率组距0.0400.0300.015-0.0100.00505060708090100分数(分)样本的数字特征学 习 目 标 核 心 素 养1.会求样本的众数、中位数、平均数、方差、标准差.(重点)2.能用样本的数字特征估计总体的数字特征,并作出合理解释和决策.(难点) 1.通过对数据特征数的计算,培养数学运算素养.2.通过利用数据的特征数估计总体分布,培养数据分析素养.1.平均数、中位数、众数的概念是什么?如何求解?有何意义?2.极差、方差、标准差的概念是什么?如何求解?有何意义?1.众数、中位数、平均数定义(1)众数:一组数据中出现次数最多的数.(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数称为这组数据的中位数.(3)平均数:如果n个数x1,x2,…,xn,那么=(x1+x2+…+xn)称为这n个数的平均数.2.极差:数据中最大值和最小值的差.3.方差(1)公式:s2=.(2)意义:方差刻画的是数据偏离平均数的离散程度.4.标准差s==. (1)众数、中位数和平均数各有什么优点和缺点?(2)标准差、方差的意义是什么?[提示] (1)三种数字特征的优缺点比较:名称 优点 缺点众数 ①体现了样本数据的最大集中点;②容易计算 ①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体的特征中位数 ①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;②容易计算,便于利用中间数据的信息 对极端值不敏感平均数 代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.1.下列结论正确的是________(填序号).①平均数反映了一组数据的平均水平,任何一个样本数据的改变都会引起平均数的变化.②一组数据中,有一半的数据不大于中位数,而另一半则不小于中位数,中位数反映了一组数据的中心的情况.中位数不受极端值的影响.③一组数据的众数的大小只与这组数据中的部分数据有关.[答案] ①②③2.在某次考试中,10名同学的得分如下:84,77,84,83,68,78,70,85,79,95.则这一组数据的众数和中位数分别为( )A.84,68 B.84,78C.84,81 D.78,81C [将所给数据按从小到大排列得68,70,77,78,79,83,84,84,85,95,显然众数为84,而本组数据共10个,中间两位是79,83,它们的平均数为81,即中位数为81.]3.某校一名篮球运动员在五场比赛中所得分数分别为8,9,10,13,15,则该运动员在这五场比赛中得分的平均值为________,方差为________,标准差为________.11 6.8 [依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为=11.由方差公式得s2=[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=(9+4+1+4+16)=6.8.s==.]类型1 平均数、中位数和众数的计算【例1】 已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有( )A.a>b>c B.a>c>bC.c>a>b D.c>b>aD [由题意得a=(16+18+15+11+16+18+18+17+15+13)==15.7.将数据从小到大排列为11,13,15,15,16,16,17,18,18,18,则其中位数为16,众数为18,则b=16,c=18,∴c>b>a.]1.求样本数据的中位数和众数时,把数据按照从小到大的顺序排列后,按照其求法进行.2.求样本数据的平均数的难点在于计算的准确性.1.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均数、众数、中位数分别是( )A.85分、85分、85分 B.87分、85分、86分C.87分、85分、85分 D.87分、85分、90分C [由题意知,该学习小组共有10人,因此众数和中位数都是85,平均数为=87.]2.已知样本数据x1,x2,…,xn的平均值=5,则样本数据2x1+1,2x2+1,…,2xn+1的平均值为________.11 [由条件知==5,则所求平均值0===2+1=2×5+1=11.]类型2 根据频率分布直方图求平均数、中位数和众数【例2】 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数.[解] (1)由题干图知众数为=75.(2)由题干图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.1.(变设问)若本例的条件不变,求数学成绩的平均分.[解] 由题干图知这次数学成绩的平均分为:×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.2.(变设问)若本例条件不变,求80分以下的学生人数.[解] [40,80)分的频率为:(0.005+0.015+0.020+0.030)×10=0.7,所以80分以下的学生人数为80×0.7=56.众数、中位数、平均数与频率分布直方图的联系(1)众数:众数在样本数据的频率分布直方图中,就是最高矩形的底边中点的横坐标.(2)中位数:在样本中,有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.(3)平均数:用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘以每个小矩形底边中点的横坐标之和.3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生成绩的众数、中位数;(2)高一参赛学生的平均成绩.[解] (1)用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得众数为65,又∵第一个小矩形的面积为0.3,设第二个小矩形底边的一部分长为x,则x×0.04=0.2,得x=5,∴中位数为60+5=65.(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,所以平均成绩约为67分.类型3 极差、方差、标准差的计算及应用【例3】 某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩如下(单位:分):甲组:60,90,85,75,65,70,80,90,95,80;乙组:85,95,75,70,85,80,85,65,90,85.(1)试分别计算两组数据的极差、方差和标准差;(2)哪一组的成绩较稳定?[解] (1)甲组:最高分为95分,最低分为60分,极差为95-60=35(分),平均分为甲=×(60+90+85+75+65+70+80+90+95+80)=79(分),方差为s=×[(60-79)2+(90-79)2+(85-79)2+(75-79)2+(65-79)2+(70-79)2+(80-79)2+(90-79)2+(95-79)2+(80-79)2]=119,标准差为s甲==≈10.91(分).乙组:最高分为95分,最低分为65分,极差为95-65=30(分),平均分为乙=×(85+95+75+70+85+80+85+65+90+85)=81.5(分),方差为s=×[(85-81.5)2+(95-81.5)2+(75-81.5)2+(70-81.5)2+(85-81.5)2+(80-81.5)2+(85-81.5)2+(65-81.5)2+(90-81.5)2+(85-81.5)2]=75.25.标准差为s乙==≈8.67(分).(2)由于乙组的方差(标准差)小于甲组的方差(标准差),因此乙组的成绩较稳定.从(1)中得到的极差也可得到乙组的成绩比较稳定.计算标准差的5步骤(1)求出样本数据的平均数.(2)求出每个样本数据与样本平均数的差xi-(i=1,2,…,n).(3)求出xi-(i=1,2,…,n)的平方值.(4)求出上一步中n个平方值的平均数,即为样本方差.(5)求出上一步中平均数的算术平方根,即为样本标准差.4.设n个数据x1,x2,…,xn的平均数为,则其方差s2=[(x1-)2+(x2-)2+…+(xn-)2].若数据a1,a2,a3,a4的方差为3,则数据2a1+1,2a2+1,2a3+1,2a4+1的方差是( )A.6 B.8C.10 D.12[答案] D5.已知一组数据6,7,8,8,9,10,则该组数据的方差是______. [这组数据的平均数为=8,故方差为s2=×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=.]1.思考辨析(正确的画“√”,错误的画“×”)(1)一个样本的众数、平均数和中位数都是唯一的.( )(2)样本的平均数是频率分布直方图中最高长方形的中点对应的数据.( )(3)若改变一组数据中其中的一个数,则这组数据的平均数、中位数、众数都会发生改变.( )[提示] (1)错误.一个样本的平均数和中位数是唯一的.若数据中有两个或两个以上出现得最多,且出现次数一样多,则这些数据都叫众数,若一组数据中每个数据出现的次数一样多,则没有众数,可见一个样本的众数可能多个,也可能没有.(2)错误.样本的平均数等于每个小矩形的面积乘小矩形底边中点的横坐标之和.(3)错误.若改变一组数据中的一个数,则这组数据的平均数一定会改变,而中位数与众数可能不变.[答案] (1)× (2)× (3)×2.下列说法不正确的是( )A.方差是标准差的平方B.标准差的大小不会超过极差C.若一组数据的值大小相等,没有波动变化,则标准差为0D.标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散D [标准差越大,表明各个样本数据在样本平均数周围越分散;标准差越小,表明各个样本数据在样本平均数周围越集中.]3.篮球运动员甲在某赛季前15场比赛的得分如表:得分 8 13 18 22 28 33 37频数 1 3 4 1 3 1 2则这15场得分的中位数和众数分别为( )A.22,18 B.18,18C.22,22 D.20,18B [根据表中数据可知,得分频率最高的为18,故众数为18,将得分按从小到大顺序排序,得8,13,13,13,18,18,18,18,22,28,28,28,33,37,37,排在中间位置的为18,故中位数为18.]4.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.6 [=6.]5.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:吨/公顷).第1年 第2年 第3年 第4年 第5年甲 9.8 9.9 10.1 10 10.2乙 9.4 10.3 10.8 9.7 9.8则甲、乙两种水稻产量的极差分别为________,________.0.4 1.4 [甲种水稻产量的极差为10.2-9.8=0.4,乙种水稻产量的极差为10.8-9.4=1.4.]PAGE7(共45张PPT)4.2 分层随机抽样的均值与方差4.3 百分位数第六章 统计情境导学·探新知NO.1小于或等于25%50%75%5%90%95%99%从小到大第j项数据(i+1)平均数合作探究·释疑难NO.2类型1 分层随机抽样的均值与方差类型2 百分位数的计算类型3 百分位数的综合应用当堂达标·夯基础NO.31234512345123451234512345123451234551234频率组距0.00300.00100.0005--010020030400500600月用电量/瓦时频率/组距0.070.060.050.040.030.020.010202530354045年龄/岁分层随机抽样的均值与方差 百分位数学 习 目 标 核 心 素 养1.结合具体实例,掌握分层随机抽样的样本均值和样本方差.(难点、重点)2.结合实例,能用样本估计百分位数,理解百分位数的统计含义.(难点、重点) 1.通过计算分层随机抽样的样本的均值和方差,培养数学运算素养.2.通过学习分层随机抽样的样本均值和样本方差的意义,培养数据分析素养.1.分层随机抽样的均值和方差的计算公式是什么?2.百分位数的概念是什么?如何求解?有何意义?3.什么是四分位数?1.分层随机抽样的均值设样本中不同层的平均数和相应权重分别为1,2,…,和 w1,w2, …,wn,则这个样本的平均数为w11+w22+…+wn.为了简化表示,引进求和符号,记作w11+w22+…+wnn=wii.2.分层随机抽样的方差设样本中不同层的平均数分别为1,2,…,n,方差分别为s,s,…,s,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=wi[s+(-)2] ,其中为样本平均数.3.百分位数(1)定义:一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p.(2)常用的百分位数:①四分位数:25%,50%,75%,②其它常用的百分位数:1%,5%,10%,90%,95%,99%.(3)计算一组n个数据的p分位数的一般步骤如下:第1步,按照从小到大排列原始数据;第2步,计算i=np;第3步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.(1)甲班和乙班各有学生20人、40人,甲班的数学成绩的平均数为80分,方差为2,乙班的数学成绩的平均数为82分,方差为4,那么甲班和乙班这60人的数学成绩的平均分是=81分吗?方差是=3吗?为什么?(2)“这次数学测试成绩的70%分位数是85分”这句话是什么意思?[提示] (1)不是,因为甲班和乙班在这60人中的权重是不同的.(2)有70%的同学数学测试成绩小于或等于85分.1.下列一组数据的25%分位数是( )2.1, 3.0, 3.2, 3.8, 3.4, 4.0, 4.2, 4.4, 5.3, 5.6.A.3.2 B.3.0C.4.4 D.2.5A [把该组数据按照由小到大排列,可得:2.1, 3.0, 3.2, 3.4, 3.8, 4.0, 4.2, 4.4, 5.3, 5.6.由i=10×25%=2.5,不是整数,则第3个数据3.2是25%分位数.]2.某单位共有员工100人,其中年轻人有20人,平均年薪为5万元,中年人有80人,平均年薪为8万元,则该单位员工的平均年薪为( )A.5万元 B.8万元C.6.5万元 D.7.4万元D [由题意可知=×5+×8=7.4(万元).]类型1 分层随机抽样的均值与方差【例1】 工厂为了解每个工人对某零件的日加工量,统计员分别从两车间抽取了甲、乙两人日加工量的两个样本.抽到甲的一个样本容量为10,样本平均数为5,方差为1;乙的一个样本容量为12,样本平均数为6,方差为2.现将这两组样本合在一起,求合在一起后的样本的平均数与方差.[解] 设抽到甲的一个样本数据为x1,x2,…,x10;乙的一个样本数据为y1,y2,…,y12,由题意知=x i=5,方差s2=(xi-5)2=1,=yi=6,方差t2=(yi-6)2=2,则合在一起后的样本容量为22,w甲=,w乙=样本平均数为=w甲+w乙=×5+×6≈5.55,样本方差为b2=w甲[s2+(-)2]+w乙[t2+(-)2]=[1+(5-5.55)2]+[2+(6-5.55)2]≈1.79.求分层随机抽样背景下的样本平均数、方差设样本中不同分层的平均数、方差和相应权重分别为1,2,…,n、s,s,…,s和w1,w2,…,wn,则样本平均数=w11+w22+…+wnn=ii.样本方差s2=i[s+(i-)2].1.在某学校为了调查高一年级学生每周的锻炼时间(单位:h)时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,求合在一起后的样本均值与样本方差.[解] 由题意知,甲同学抽取的样本容量m=10,样本平均值为=5,样本方差为s2=9;乙同学抽取的样本容量n=8,样本平均值为=6,样本方差t2=16.故合在一起后的样本平均值为w甲+w乙=×5+×6≈5.44.样本方差为w甲[s2+(5-5.44)2]+w乙[t2+(6-5.44)2]=[9+0.442]+[16+0.562]≈12.36.类型2 百分位数的计算【例2】 从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的25%,75%,95%分位数.(2)请你找出珍珠质量较小的前15%的珍珠质量.(3)若用25%,50%,95%分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.[解] (1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,则25%分位数是=8.15,75%分位数是=8.75,95%分位数是第12个数据为9.9.(2)因为共有12个数据,所以12×15%=1.8,则15%分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的25%分位数是8.15 g,50%分位数为8.5 g,95%分位数是9.9,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于等于9.9的珍珠为优等品,质量大于9.9 g的珍珠为特优品.百分位数的计算问题,先理解清楚百分位数的概念,再利用百分位数求解步骤逐步计算即可.2.在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:成绩(单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90人数 2 3 2 3 4 1 1 1分别求这些运动员成绩的中位数,25%分位数和75%分位数.[解] 这组数据有17个数,17×25%=4.25,17×75%=12.75,这组数据的中位数是x9=1.70,25%分位数是x5=1.60,75%分位数是x13=1.75.类型3 百分位数的综合应用【例3】 某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式.(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值.(3)根据(2)中求得的数据计算用电量的75%分位数.[解] (1)当0≤x≤200时,y=0.5x;当200当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.所以y与x之间的函数解析式为y=(2)由(1)可知,当y=260时,x=400,即用电量不超过400千瓦时的占80%,结合频率分布直方图可知解得a=0.001 5,b=0.002 0.(3)设75%分位数为m,因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,用电量不超过400千瓦时的占80%,所以75%分位数为m在[300,400)内,所以0.6+(m-300)×0.002=0.75,解得m=375千瓦时,即用电量的75%分位数为375千瓦时.(变设问)根据本例(2)中求得的数据计算用电量的15%分位数.[解] 设15%分位数为x,因为用电量低于100千瓦时的所占比例为0.001×100=10%,用电量不超过200千瓦时的占30%,所以15%分位数为x在[100,200)内,所以0.1+(x-100)×0.002=0.15,解得x=125千瓦时,即用电量的15%分位数为125千瓦时.根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用方程的思想方法,设出百分位数,解方程可得.3.某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人.(1)求x;(2)求抽取的x人的年龄的50%分位数(结果保留整数);(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“中国梦”的伟大构想的认知程度,并谈谈你的感想.[解] (1)第一组频率为0.01×5=0.05,所以x==100.(2)由题图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的x人的年龄的50%分位数在[30,35)内,由30+5×=≈32,所以抽取的x人的年龄的50%分位数为32.(3)把参赛的10人的成绩按从小到大的顺序排列:88,90,92,92,95,96,96,97,98,99,计算10×20%=2,所以这10人成绩的20%分位数为=91,这10人成绩的平均数为(88+90+92+92+95+96+96+97+98+99)=94.3.评价:从百分位数和平均数来看,参赛人员的认知程度很高.感想:结合本题和实际,符合社会主义核心价值观即可.1.思考辨析(正确的画“√”,错误的画“×”)(1)若一组样本数据各不相等,则75%分位数大于25%分位数.( )(2)计算分层随机抽样的均值与方差时,必须已知各层的权重.( )(3)若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.( )[提示] (1)正确.(2)正确.(3)错误.若一组样本数据的10%分位数是23,则在这组数据中有10%的数据小于或等于23.[答案] (1)√ (2)√ (3)×2.临近学期结束,某中学要对本校高中部一线任课教师进行“评教评学”调査,经调査,高一年级80名一线任课教师好评率为90%,高二年级75名一线任课教师好评率为92%,高三年级80名一线任课教师好评率为95%.依此估计该中学高中部一线任课教师的好评率约为( )A.92% B.93%C.94% D.95%A [由题意,知该校高中部共有一线任课教师N=80+75+80=235(名),×+×+×≈,依此估计该中学高中部一线任课教师的好评率约为92%.]3.以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的80%分位数是( )A.90 B.90.5C.91 D.91.5B [把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的80%分位数是=90.5.]4.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的30%分位数是________.8.4 [因为8×30%=2.4,故30%分位数是第三项数据8.4.]5.已知甲、乙两地人口之比为2∶3,其中甲地人均年收入为8万元,乙地人均年收入为10万元,则甲、乙两地的人均年收入为________万元.9.2 [=×8+×10=9.2(万元).]PAGE7 展开更多...... 收起↑ 资源列表 2021_2022学年新教材高中数学第6章统计44.1样本的数字特征学案北师大版必修第一册.doc 2021_2022学年新教材高中数学第6章统计44.1样本的数字特征课件北师大版必修第一册.ppt 2021_2022学年新教材高中数学第6章统计44.2分层随机抽样的均值与方差4.3百分位数学案北师大版必修第一册.doc 2021_2022学年新教材高中数学第6章统计44.2分层随机抽样的均值与方差4.3百分位数课件北师大版必修第一册.ppt