资源简介 6.4.2 用样本估计总体的离散程度【学习目标】1.结合实例,能理解用样本估计总体的离散程度参数(标准差、方差、极差).(数据分析)2.理解离散程度参数的统计含义,能用方差、标准差解决实际问题.(数学运算、数据分析)【自主预习】预学忆思1.什么是极差,它的统计意义是什么 【答案】最大值与最小值之差称为极差.它粗略地刻画了一组数据的离散程度.2.样本方差能估计总体方差吗 它们的公式形式相同吗 【答案】能,相同.3.样本标准差的计算公式是什么 【答案】给定数据x1,x2,…,xn和均值.样本标准差s的计算公式如下:s=.自学检测1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)(1)计算分层抽样的均值与方差时,必须已知各层的权重. ( )(2)若一组数据的值大小相等,没有波动变化,则标准差为0. ( )(3)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散. ( )【答案】(1)√ (2)√ (3)×2.已知一组数据为a,1,2,3,4,其平均数是2,则其方差是 . 【答案】2【解析】∵=2,∴a=0,∴方差s2=×[(0-2)2+(1-2)2+(2-2)2+(3-2)2+(4-2)2]=2.3.某学员在一次射击测试中射靶10次,命中环数分别为7,8,7,9,5,4,9,10,7,4.求:(1)平均命中环数;(2)命中环数的标准差.【解析】(1)平均命中环数==7.(2)由题意知,方差s2=×[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴标准差s=2.4.某中学在高一年级400名学生(其中男生220人,女生180人)中随机抽取22名男生与18名女生,统计他们的生活费支出,得到下面的结果:男生:=520元,=250;女生:=500元,=280.试根据以上数据估计该校高一学生生活费支出的总体均值、总体方差.【解析】总体均值约为×520+×500=511(元),总体方差约为×[250+(520-511)2]+×[280+(500-511)2]=362.5.【合作探究】探究1:极差情境设置问题1:在绘制频率分布直方图时,第一步计算什么 【答案】计算极差.问题2:什么是极差 【答案】最大值与最小值的差.问题3:极差反映了数据的什么变化 【答案】极差反映了数据变化的幅度.新知生成1.极值将一组数据中的最大值与最小值统称为极值.2.极差将最大值与最小值之差称为极差,也称全距,用R表示.极差反映了数据变化的幅度,是描述数据离散程度的最简单的代表值,计算简单又易于理解,但它容易受极端值的影响.新知运用例1 (多选题)空气质量指数大小分为五级,指数越大说明污染的情况越严重,对人体危害越大,指数范围在[0,50],[51,100],[101,200],[201,300],[301,500]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级.下面是某市连续14天的空气质量指数变化趋势图,下列说法中正确的是( ).A.从2日到5日空气质量越来越好B.这14天中,空气质量指数的极差为195C.这14天中,空气质量指数的中位数是103.5D.这14天中,空气质量指数为“良”的频率为【答案】BC【解析】从2日到5日空气质量指数越来越高,故空气质量越来越差,故A错误;这14天中,空气质量指数的极差为220-25=195,故B正确;这14天空气质量指数由小到大排列,中间的两个数为86,121,故中位数为=103.5,故C正确;这14天中有1日,3日,12日,13日空气质量指数为“良”,共4天,所以空气质量指数为“良”的频率为=,故D错误.故选BC.【方法总结】计算极差一般根据极差公式计算.巩固训练(多选题)现有两组数据,第一组:3,11,5,13,7,2,6,8,9;第二组:12,20,14,22,16,11,15,17,18.则这两组数据的( ). A.平均数相等 B.中位数相等C.极差相等 D.方差相等【答案】CD【解析】由题意可得,第二组的每个数据都是第一组对应数据加上9得到的,因此可以判断第二组的平均数和中位数都比第一组多9,而极差和方差不变.探究2:方差情境设置 甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别如下:甲:8,6,7,8,6,5,9,10,4,7.乙:6,7,7,8,6,7,8,7,9,5.问题1:甲、乙两名战士命中环数的平均数,各是多少 【答案】=7,=7.问题2:由,能否判断两人的射击水平 【答案】因为==7,所以不能判断.问题3:观察上述两组数据,你认为哪个人的射击水平更稳定 【答案】从数字分布来看,甲命中的环数较分散,乙命中的环数较集中.故乙的射击水平更稳定.新知生成1.总体方差常采用方差来刻画一组数据波动大小,若设y1,y2,…,yN是总体的全部个体,μ是总体均值,则称σ2=为总体方差或方差.2.样本方差若从总体中随机抽样,获得n个观测数据x1,x2,…,xn,用表示这n个数据的均值,则称s2=为这n个数据的样本方差,也简称为方差.新知运用例2 某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg):甲:102,101,99,98,103,98,99.乙:110,115,90,85,75,115,110.试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间的产品比较稳定.方法指导 分别计算甲、乙车间的平均数和方差即可得到答案.【解析】甲的平均数==100,甲的方差=×[(102-100)2+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99-100)2]=.乙的平均数==100,乙的方差=×[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110-100)2]=.因为=,<,所以甲车间的产品比较稳定.【方法总结】计算方差的四个步骤:(1)算出样本数据的平均数;(2)算出每个样本数据与样本数据平均数的差:xi-(i=1,2,3,…,n);(3)算出(2)中xi-(i=1,2,3,…,n)的平方;(4)算出(3)中n个平方数的平均数,即为样本方差.巩固训练 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据如下(单位:cm):甲:99,100,98,100,100,103.乙:99,100,102,99,100,100.(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定.【解析】(1)=×(99+100+98+100+100+103)=100,=×(99+100+102+99+100+100)=100.=×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,=×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)因为两台机床所加工零件的直径的平均数相同,>,所以乙机床加工零件的质量更稳定.探究3:分层抽样的均值与方差情境设置问题1:在分层抽样中各层抽查的个数不一样,如何求样本的平均数呢 【答案】求分层抽样的平均数,可以先分层求平均数,再求样本的平均数.问题2:在分层抽样中各层抽查的个数不一样,如何求样本的方差呢 【答案】可以先分层求平均数、方差,再求样本的方差.新知生成1.在分层抽样时,如果将总体分为2层,各层抽取的样本量、样本平均数和样本方差分别表示为n1,n2,,,,,那么全部样本的样本容量n、样本均值和样本方差s2分别为n=n1+n2,=·+·,s2={n1[+(-)2]+n2[+(-)2]}.2.在分层抽样时,如果将总体分为k层,第j层抽取的样本量为nj,样本平均数为,样本方差为,j=1,2,…,k,记n=nj,那么全部样本的均值=(nj),全部样本的方差为s2={nj[+(-)2]}.新知运用例3 某学校统计了教师职称及年龄:中级职称教师的人数为50,平均年龄为38岁,方差是2;高级职称的教师中有3人58岁,5人40岁,2人38岁.求该校中级职称和高级职称教师年龄的平均数和方差.【解析】由已知条件可知,高级职称教师的平均年龄为==45(岁),年龄的方差为=×[3×(58-45)2+5×(40-45)2+2×(38-45)2]=73,所以该校中级职称和高级职称教师的平均年龄为=×38+×45≈39.2(岁),该校中级职称和高级职称教师的年龄的方差是s2=×[2+(38-39.2)2]+×[73+(45-39.2)2]=20.64.【方法总结】计算分层抽样的方差s2的步骤(1)确定,,,;(2)确定;(3)应用公式s2=[+(-)2]+[+(-)2]计算s2.巩固训练已知某省二、三、四线城市房屋数量之比为1∶3∶6,2022年8月份调查得知该省二、三、四线城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市房价的方差为 . 【答案】118.52【解析】设二线城市房价的方差为s2,由题意可知,20=[s2+(1.2-2.4)2]+[10+(1.2-1.8)2]+[8+(1.2-0.8)2],解得s2=118.52,即二线城市房价的方差为118.52.探究4:标准差情境设置问题1:方差充分利用所有数据,并且仅用一个数值来刻画一组数据的离散程度,试问方差有局限性吗 局限性是什么 【答案】方差有局限性,如方差的单位是观测数据的单位的平方,而刻画离散程度的一种理想度量应当具有与观测数据相同的单位.问题2:解决问题1的局限性的方法是什么 【答案】引入标准差.新知生成标准差解决方差局限性的方法就是引入标准差.标准差是方差的算术平方根.若σ2是总体方差,则称σ=是总体标准差;若s2是样本方差,则称s=是样本标准差.给定数据x1,x2,…,xn和均值.由方差计算公式知道,样本标准差s可以用下面的公式计算s=.新知运用例4 机床生产一批参考尺寸为6.0 mm±0.3 mm的零件,从中随机抽取10个,量得其尺寸如下表(单位:mm):序号 1 2 3 4 5 6 7 8 9 10尺寸 6.3 5.8 6.2 5.9 6.2 6.0 5.8 5.8 5.9 6.1 (1)求样本零件尺寸的平均值与标准差s;(2)估计这批零件尺寸位于(-s,+s)的百分比.参考数据:取=1.79.方法指导 (1)由平均数和标准差计算公式可直接计算求得结果;(2)由(1)可求得区间为(5.821,6.179),利用样本估计总体的思想可直接计算得到结果.【解析】(1)由表格数据得=(6.3+3×5.8+2×5.9+2×6.2+6.1+6.0)÷10=6,s2=[(6.3-6)2+(5.8-6)2+(6.2-6)2+(5.9-6)2+(6.2-6)2+(6-6)2+(5.8-6)2+(5.8-6)2+(5.9-6)2+(6.1-6)2]÷10=0.032,所以s===0.179.(2)由(1)可知-s=5.821,+s=6.179.这10件样本中,尺寸在(5.821,6.179)内的共有4件,以样本估计总体,则这批零件尺寸位于(5.821,6.179)内的百分比约为×100%=40%.【随堂检测】1.已知样本数据x1,x2,x3,x4,x5,该样本平均数为4,方差为2,现加入一个数4,得到新样本的平均数为,方差为s2,则下列说法正确的是( ). A.>4,s2>2 B.=4,s2>2C.<4,s2<2 D.=4,s2<2【答案】D【解析】因为x1,x2,x3,x4,x5的平均数为4,方差为2,所以加入一个数4,得到新样本的平均数=×(4×5+4)=4,方差s2=×[5×2+(4-4)2]=<2.2.为了调查公司员工的健康状况,用分层抽样的方法抽取样本.已知所抽取的所有员工的平均体重为60 kg,标准差为60;男员工的平均体重为70 kg,标准差为50;女员工的平均体重为50 kg,标准差为60.若样本中有20名男员工,则女员工的人数为( ).A.160 B.180 C.200 D.210【答案】C【解析】设男,女员工的权重分别为w男,w女,由题意可知s2=w男[+(-)2]+w女[+(-)2],即w男[502+(70-60)2]+(1-w男)[602+(50-60)2]=602,解得w男=,w女=.因为样本中有20名男员工,所以样本中女员工的人数为200.3.若某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2= . 【答案】【解析】该组数据的平均数为=7,方差s2=×[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=.4.已知样本9,10,11,x,y的平均数是10,标准差是,则xy= . 【答案】96【解析】由平均数为10,得9+10+11+x+y=50,所以x+y=20.又由(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2=()2×5=10,得x2+y2-20(x+y)=-192,即(x+y)2-2xy-20(x+y)=-192,解得xy=96.26.4.2 用样本估计总体的离散程度【学习目标】1.结合实例,能理解用样本估计总体的离散程度参数(标准差、方差、极差).(数据分析)2.理解离散程度参数的统计含义,能用方差、标准差解决实际问题.(数学运算、数据分析)【自主预习】预学忆思1.什么是极差,它的统计意义是什么 2.样本方差能估计总体方差吗 它们的公式形式相同吗 3.样本标准差的计算公式是什么 自学检测1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)(1)计算分层抽样的均值与方差时,必须已知各层的权重. ( )(2)若一组数据的值大小相等,没有波动变化,则标准差为0. ( )(3)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散. ( )2.已知一组数据为a,1,2,3,4,其平均数是2,则其方差是 . 3.某学员在一次射击测试中射靶10次,命中环数分别为7,8,7,9,5,4,9,10,7,4.求:(1)平均命中环数;(2)命中环数的标准差.4.某中学在高一年级400名学生(其中男生220人,女生180人)中随机抽取22名男生与18名女生,统计他们的生活费支出,得到下面的结果:男生:=520元,=250;女生:=500元,=280.试根据以上数据估计该校高一学生生活费支出的总体均值、总体方差.【合作探究】探究1:极差情境设置问题1:在绘制频率分布直方图时,第一步计算什么 问题2:什么是极差 问题3:极差反映了数据的什么变化 新知生成1.极值将一组数据中的最大值与最小值统称为极值.2.极差将最大值与最小值之差称为极差,也称全距,用R表示.极差反映了数据变化的幅度,是描述数据离散程度的最简单的代表值,计算简单又易于理解,但它容易受极端值的影响.新知运用例1 (多选题)空气质量指数大小分为五级,指数越大说明污染的情况越严重,对人体危害越大,指数范围在[0,50],[51,100],[101,200],[201,300],[301,500]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级.下面是某市连续14天的空气质量指数变化趋势图,下列说法中正确的是( ).A.从2日到5日空气质量越来越好B.这14天中,空气质量指数的极差为195C.这14天中,空气质量指数的中位数是103.5D.这14天中,空气质量指数为“良”的频率为【方法总结】计算极差一般根据极差公式计算.巩固训练(多选题)现有两组数据,第一组:3,11,5,13,7,2,6,8,9;第二组:12,20,14,22,16,11,15,17,18.则这两组数据的( ). A.平均数相等 B.中位数相等C.极差相等 D.方差相等探究2:方差情境设置 甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别如下:甲:8,6,7,8,6,5,9,10,4,7.乙:6,7,7,8,6,7,8,7,9,5.问题1:甲、乙两名战士命中环数的平均数,各是多少 问题2:由,能否判断两人的射击水平 问题3:观察上述两组数据,你认为哪个人的射击水平更稳定 新知生成1.总体方差常采用方差来刻画一组数据波动大小,若设y1,y2,…,yN是总体的全部个体,μ是总体均值,则称σ2=为总体方差或方差.2.样本方差若从总体中随机抽样,获得n个观测数据x1,x2,…,xn,用表示这n个数据的均值,则称s2=为这n个数据的样本方差,也简称为方差.新知运用例2 某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg):甲:102,101,99,98,103,98,99.乙:110,115,90,85,75,115,110.试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间的产品比较稳定.方法指导 分别计算甲、乙车间的平均数和方差即可得到答案.【方法总结】计算方差的四个步骤:(1)算出样本数据的平均数;(2)算出每个样本数据与样本数据平均数的差:xi-(i=1,2,3,…,n);(3)算出(2)中xi-(i=1,2,3,…,n)的平方;(4)算出(3)中n个平方数的平均数,即为样本方差.巩固训练 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据如下(单位:cm):甲:99,100,98,100,100,103.乙:99,100,102,99,100,100.(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定.探究3:分层抽样的均值与方差情境设置问题1:在分层抽样中各层抽查的个数不一样,如何求样本的平均数呢 问题2:在分层抽样中各层抽查的个数不一样,如何求样本的方差呢 新知生成1.在分层抽样时,如果将总体分为2层,各层抽取的样本量、样本平均数和样本方差分别表示为n1,n2,,,,,那么全部样本的样本容量n、样本均值和样本方差s2分别为n=n1+n2,=·+·,s2={n1[+(-)2]+n2[+(-)2]}.2.在分层抽样时,如果将总体分为k层,第j层抽取的样本量为nj,样本平均数为,样本方差为,j=1,2,…,k,记n=nj,那么全部样本的均值=(nj),全部样本的方差为s2={nj[+(-)2]}.新知运用例3 某学校统计了教师职称及年龄:中级职称教师的人数为50,平均年龄为38岁,方差是2;高级职称的教师中有3人58岁,5人40岁,2人38岁.求该校中级职称和高级职称教师年龄的平均数和方差.【方法总结】计算分层抽样的方差s2的步骤(1)确定,,,;(2)确定;(3)应用公式s2=[+(-)2]+[+(-)2]计算s2.巩固训练已知某省二、三、四线城市房屋数量之比为1∶3∶6,2022年8月份调查得知该省二、三、四线城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市房价的方差为 . 探究4:标准差情境设置问题1:方差充分利用所有数据,并且仅用一个数值来刻画一组数据的离散程度,试问方差有局限性吗 局限性是什么 问题2:解决问题1的局限性的方法是什么 新知生成标准差解决方差局限性的方法就是引入标准差.标准差是方差的算术平方根.若σ2是总体方差,则称σ=是总体标准差;若s2是样本方差,则称s=是样本标准差.给定数据x1,x2,…,xn和均值.由方差计算公式知道,样本标准差s可以用下面的公式计算s=.新知运用例4 机床生产一批参考尺寸为6.0 mm±0.3 mm的零件,从中随机抽取10个,量得其尺寸如下表(单位:mm):序号 1 2 3 4 5 6 7 8 9 10尺寸 6.3 5.8 6.2 5.9 6.2 6.0 5.8 5.8 5.9 6.1 (1)求样本零件尺寸的平均值与标准差s;(2)估计这批零件尺寸位于(-s,+s)的百分比.参考数据:取=1.79.方法指导 (1)由平均数和标准差计算公式可直接计算求得结果;(2)由(1)可求得区间为(5.821,6.179),利用样本估计总体的思想可直接计算得到结果.【随堂检测】1.已知样本数据x1,x2,x3,x4,x5,该样本平均数为4,方差为2,现加入一个数4,得到新样本的平均数为,方差为s2,则下列说法正确的是( ). A.>4,s2>2 B.=4,s2>2C.<4,s2<2 D.=4,s2<22.为了调查公司员工的健康状况,用分层抽样的方法抽取样本.已知所抽取的所有员工的平均体重为60 kg,标准差为60;男员工的平均体重为70 kg,标准差为50;女员工的平均体重为50 kg,标准差为60.若样本中有20名男员工,则女员工的人数为( ).A.160 B.180 C.200 D.2103.若某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2= . 4.已知样本9,10,11,x,y的平均数是10,标准差是,则xy= . 2 展开更多...... 收起↑ 资源列表 6.4.2 用样本估计总体的离散程度 - 副本.docx 6.4.2 用样本估计总体的离散程度.docx