6.4.2 用样本估计总体的离散程度 学案(原卷版+解析版) 2023-2024学年高一数学湘教版(2019)必修第一册

资源下载
  1. 二一教育资源

6.4.2 用样本估计总体的离散程度 学案(原卷版+解析版) 2023-2024学年高一数学湘教版(2019)必修第一册

资源简介

6.4.2 用样本估计总体的离散程度
【学习目标】
1.结合实例,能理解用样本估计总体的离散程度参数(标准差、方差、极差).(数据分析)
2.理解离散程度参数的统计含义,能用方差、标准差解决实际问题.(数学运算、数据分析)
【自主预习】
预学忆思
1.什么是极差,它的统计意义是什么
【答案】最大值与最小值之差称为极差.它粗略地刻画了一组数据的离散程度.
2.样本方差能估计总体方差吗 它们的公式形式相同吗
【答案】能,相同.
3.样本标准差的计算公式是什么
【答案】给定数据x1,x2,…,xn和均值.样本标准差s的计算公式如下:
s=.
自学检测
1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)
(1)计算分层抽样的均值与方差时,必须已知各层的权重. (  )
(2)若一组数据的值大小相等,没有波动变化,则标准差为0. (  )
(3)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散. (  )
【答案】(1)√ (2)√ (3)×
2.已知一组数据为a,1,2,3,4,其平均数是2,则其方差是    .
【答案】2
【解析】∵=2,∴a=0,
∴方差s2=×[(0-2)2+(1-2)2+(2-2)2+(3-2)2+(4-2)2]=2.
3.某学员在一次射击测试中射靶10次,命中环数分别为7,8,7,9,5,4,9,10,7,4.
求:(1)平均命中环数;
(2)命中环数的标准差.
【解析】(1)平均命中环数
==7.
(2)由题意知,方差s2=×[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴标准差s=2.
4.某中学在高一年级400名学生(其中男生220人,女生180人)中随机抽取22名男生与18名女生,统计他们的生活费支出,得到下面的结果:
男生:=520元,=250;女生:=500元,=280.
试根据以上数据估计该校高一学生生活费支出的总体均值、总体方差.
【解析】总体均值约为×520+×500=511(元),
总体方差约为×[250+(520-511)2]+×[280+(500-511)2]=362.5.
【合作探究】
探究1:极差
情境设置
问题1:在绘制频率分布直方图时,第一步计算什么
【答案】计算极差.
问题2:什么是极差
【答案】最大值与最小值的差.
问题3:极差反映了数据的什么变化
【答案】极差反映了数据变化的幅度.
新知生成
1.极值
将一组数据中的最大值与最小值统称为极值.
2.极差
将最大值与最小值之差称为极差,也称全距,用R表示.
极差反映了数据变化的幅度,是描述数据离散程度的最简单的代表值,计算简单又易于理解,但它容易受极端值的影响.
新知运用
例1 (多选题)空气质量指数大小分为五级,指数越大说明污染的情况越严重,对人体危害越大,指数范围在[0,50],[51,100],[101,200],[201,300],[301,500]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级.下面是某市连续14天的空气质量指数变化趋势图,下列说法中正确的是(  ).
A.从2日到5日空气质量越来越好
B.这14天中,空气质量指数的极差为195
C.这14天中,空气质量指数的中位数是103.5
D.这14天中,空气质量指数为“良”的频率为
【答案】BC
【解析】从2日到5日空气质量指数越来越高,故空气质量越来越差,故A错误;这14天中,空气质量指数的极差为220-25=195,故B正确;这14天空气质量指数由小到大排列,中间的两个数为86,121,故中位数为=103.5,故C正确;这14天中有1日,3日,12日,13日空气质量指数为“良”,共4天,所以空气质量指数为“良”的频率为=,故D错误.故选BC.
【方法总结】计算极差一般根据极差公式计算.
巩固训练
(多选题)现有两组数据,第一组:3,11,5,13,7,2,6,8,9;第二组:12,20,14,22,16,11,15,17,18.则这两组数据的(  ).                  
A.平均数相等 B.中位数相等
C.极差相等 D.方差相等
【答案】CD
【解析】由题意可得,第二组的每个数据都是第一组对应数据加上9得到的,因此可以判断第二组的平均数和中位数都比第一组多9,而极差和方差不变.
探究2:方差
情境设置
  甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别如下:
甲:8,6,7,8,6,5,9,10,4,7.
乙:6,7,7,8,6,7,8,7,9,5.
问题1:甲、乙两名战士命中环数的平均数,各是多少
【答案】=7,=7.
问题2:由,能否判断两人的射击水平
【答案】因为==7,所以不能判断.
问题3:观察上述两组数据,你认为哪个人的射击水平更稳定
【答案】从数字分布来看,甲命中的环数较分散,乙命中的环数较集中.故乙的射击水平更稳定.
新知生成
1.总体方差
常采用方差来刻画一组数据波动大小,若设y1,y2,…,yN是总体的全部个体,μ是总体均值,则称σ2=为总体方差或方差.
2.样本方差
若从总体中随机抽样,获得n个观测数据x1,x2,…,xn,用表示这n个数据的均值,则称s2=为这n个数据的样本方差,也简称为方差.
新知运用
例2 某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg):
甲:102,101,99,98,103,98,99.
乙:110,115,90,85,75,115,110.
试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间的产品比较稳定.
方法指导 分别计算甲、乙车间的平均数和方差即可得到答案.
【解析】甲的平均数
==100,
甲的方差=×[(102-100)2+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99-100)2]=.
乙的平均数==100,
乙的方差=×[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110-100)2]=.
因为=,<,所以甲车间的产品比较稳定.
【方法总结】计算方差的四个步骤:(1)算出样本数据的平均数;(2)算出每个样本数据与样本数据平均数的差:xi-(i=1,2,3,…,n);(3)算出(2)中xi-(i=1,2,3,…,n)的平方;(4)算出(3)中n个平方数的平均数,即为样本方差.
巩固训练
  甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据如下(单位:cm):
甲:99,100,98,100,100,103.
乙:99,100,102,99,100,100.
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
【解析】(1)=×(99+100+98+100+100+103)=100,
=×(99+100+102+99+100+100)=100.
=×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
=×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)因为两台机床所加工零件的直径的平均数相同,>,所以乙机床加工零件的质量更稳定.
探究3:分层抽样的均值与方差
情境设置
问题1:在分层抽样中各层抽查的个数不一样,如何求样本的平均数呢
【答案】求分层抽样的平均数,可以先分层求平均数,再求样本的平均数.
问题2:在分层抽样中各层抽查的个数不一样,如何求样本的方差呢
【答案】可以先分层求平均数、方差,再求样本的方差.
新知生成
1.在分层抽样时,如果将总体分为2层,各层抽取的样本量、样本平均数和样本方差分别表示为n1,n2,,,,,那么全部样本的样本容量n、样本均值和样本方差s2分别为n=n1+n2,=·+·,s2={n1[+(-)2]+n2[+(-)2]}.
2.在分层抽样时,如果将总体分为k层,第j层抽取的样本量为nj,样本平均数为,样本方差为,j=1,2,…,k,记n=nj,那么全部样本的均值=(nj),全部样本的方差为s2={nj[+(-)2]}.
新知运用
例3 某学校统计了教师职称及年龄:中级职称教师的人数为50,平均年龄为38岁,方差是2;高级职称的教师中有3人58岁,5人40岁,2人38岁.求该校中级职称和高级职称教师年龄的平均数和方差.
【解析】由已知条件可知,高级职称教师的平均年龄为==45(岁),
年龄的方差为=×[3×(58-45)2+5×(40-45)2+2×(38-45)2]=73,
所以该校中级职称和高级职称教师的平均年龄为=×38+×45≈39.2(岁),
该校中级职称和高级职称教师的年龄的方差是s2=×[2+(38-39.2)2]+×[73+(45-39.2)2]=20.64.
【方法总结】计算分层抽样的方差s2的步骤
(1)确定,,,;
(2)确定;
(3)应用公式s2=[+(-)2]+[+(-)2]计算s2.
巩固训练
已知某省二、三、四线城市房屋数量之比为1∶3∶6,2022年8月份调查得知该省二、三、四线城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市房价的方差为    .
【答案】118.52
【解析】设二线城市房价的方差为s2,由题意可知,20=[s2+(1.2-2.4)2]+[10+(1.2-1.8)2]+[8+(1.2-0.8)2],解得s2=118.52,即二线城市房价的方差为118.52.
探究4:标准差
情境设置
问题1:方差充分利用所有数据,并且仅用一个数值来刻画一组数据的离散程度,试问方差有局限性吗 局限性是什么
【答案】方差有局限性,如方差的单位是观测数据的单位的平方,而刻画离散程度的一种理想度量应当具有与观测数据相同的单位.
问题2:解决问题1的局限性的方法是什么
【答案】引入标准差.
新知生成
标准差
解决方差局限性的方法就是引入标准差.标准差是方差的算术平方根.
若σ2是总体方差,则称σ=是总体标准差;
若s2是样本方差,则称s=是样本标准差.
给定数据x1,x2,…,xn和均值.由方差计算公式知道,样本标准差s可以用下面的公式计算s=.
新知运用
例4 机床生产一批参考尺寸为6.0 mm±0.3 mm的零件,从中随机抽取10个,量得其尺寸如下表(单位:mm):
序号 1 2 3 4 5 6 7 8 9 10
尺寸 6.3 5.8 6.2 5.9 6.2 6.0 5.8 5.8 5.9 6.1
  (1)求样本零件尺寸的平均值与标准差s;
(2)估计这批零件尺寸位于(-s,+s)的百分比.
参考数据:取=1.79.
方法指导 (1)由平均数和标准差计算公式可直接计算求得结果;(2)由(1)可求得区间为(5.821,6.179),利用样本估计总体的思想可直接计算得到结果.
【解析】(1)由表格数据得=(6.3+3×5.8+2×5.9+2×6.2+6.1+6.0)÷10=6,s2=[(6.3-6)2+(5.8-6)2+(6.2-6)2+(5.9-6)2+(6.2-6)2+(6-6)2+(5.8-6)2+(5.8-6)2+(5.9-6)2+(6.1-6)2]÷10=0.032,所以s===0.179.
(2)由(1)可知-s=5.821,+s=6.179.
这10件样本中,尺寸在(5.821,6.179)内的共有4件,
以样本估计总体,则这批零件尺寸位于(5.821,6.179)内的百分比约为×100%=40%.
【随堂检测】
1.已知样本数据x1,x2,x3,x4,x5,该样本平均数为4,方差为2,现加入一个数4,得到新样本的平均数为,方差为s2,则下列说法正确的是(  ).
                  
A.>4,s2>2 B.=4,s2>2
C.<4,s2<2 D.=4,s2<2
【答案】D
【解析】因为x1,x2,x3,x4,x5的平均数为4,方差为2,所以加入一个数4,得到新样本的平均数=×(4×5+4)=4,方差s2=×[5×2+(4-4)2]=<2.
2.为了调查公司员工的健康状况,用分层抽样的方法抽取样本.已知所抽取的所有员工的平均体重为60 kg,标准差为60;男员工的平均体重为70 kg,标准差为50;女员工的平均体重为50 kg,标准差为60.若样本中有20名男员工,则女员工的人数为(  ).
A.160 B.180 C.200 D.210
【答案】C
【解析】设男,女员工的权重分别为w男,w女,
由题意可知s2=w男[+(-)2]+w女[+(-)2],即w男[502+(70-60)2]+(1-w男)[602+(50-60)2]=602,解得w男=,w女=.
因为样本中有20名男员工,所以样本中女员工的人数为200.
3.若某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=    .
【答案】
【解析】该组数据的平均数为=7,
方差s2=×[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=.
4.已知样本9,10,11,x,y的平均数是10,标准差是,则xy=    .
【答案】96
【解析】由平均数为10,得9+10+11+x+y=50,所以x+y=20.又由(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2=()2×5=10,得x2+y2-20(x+y)=-192,即(x+y)2-2xy-20(x+y)=-192,解得xy=96.
26.4.2 用样本估计总体的离散程度
【学习目标】
1.结合实例,能理解用样本估计总体的离散程度参数(标准差、方差、极差).(数据分析)
2.理解离散程度参数的统计含义,能用方差、标准差解决实际问题.(数学运算、数据分析)
【自主预习】
预学忆思
1.什么是极差,它的统计意义是什么
2.样本方差能估计总体方差吗 它们的公式形式相同吗
3.样本标准差的计算公式是什么
自学检测
1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)
(1)计算分层抽样的均值与方差时,必须已知各层的权重. (  )
(2)若一组数据的值大小相等,没有波动变化,则标准差为0. (  )
(3)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散. (  )
2.已知一组数据为a,1,2,3,4,其平均数是2,则其方差是    .
3.某学员在一次射击测试中射靶10次,命中环数分别为7,8,7,9,5,4,9,10,7,4.
求:(1)平均命中环数;
(2)命中环数的标准差.
4.某中学在高一年级400名学生(其中男生220人,女生180人)中随机抽取22名男生与18名女生,统计他们的生活费支出,得到下面的结果:
男生:=520元,=250;女生:=500元,=280.
试根据以上数据估计该校高一学生生活费支出的总体均值、总体方差.
【合作探究】
探究1:极差
情境设置
问题1:在绘制频率分布直方图时,第一步计算什么
问题2:什么是极差
问题3:极差反映了数据的什么变化
新知生成
1.极值
将一组数据中的最大值与最小值统称为极值.
2.极差
将最大值与最小值之差称为极差,也称全距,用R表示.
极差反映了数据变化的幅度,是描述数据离散程度的最简单的代表值,计算简单又易于理解,但它容易受极端值的影响.
新知运用
例1 (多选题)空气质量指数大小分为五级,指数越大说明污染的情况越严重,对人体危害越大,指数范围在[0,50],[51,100],[101,200],[201,300],[301,500]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级.下面是某市连续14天的空气质量指数变化趋势图,下列说法中正确的是(  ).
A.从2日到5日空气质量越来越好
B.这14天中,空气质量指数的极差为195
C.这14天中,空气质量指数的中位数是103.5
D.这14天中,空气质量指数为“良”的频率为
【方法总结】计算极差一般根据极差公式计算.
巩固训练
(多选题)现有两组数据,第一组:3,11,5,13,7,2,6,8,9;第二组:12,20,14,22,16,11,15,17,18.则这两组数据的(  ).                  
A.平均数相等 B.中位数相等
C.极差相等 D.方差相等
探究2:方差
情境设置
  甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别如下:
甲:8,6,7,8,6,5,9,10,4,7.
乙:6,7,7,8,6,7,8,7,9,5.
问题1:甲、乙两名战士命中环数的平均数,各是多少
问题2:由,能否判断两人的射击水平
问题3:观察上述两组数据,你认为哪个人的射击水平更稳定
新知生成
1.总体方差
常采用方差来刻画一组数据波动大小,若设y1,y2,…,yN是总体的全部个体,μ是总体均值,则称σ2=为总体方差或方差.
2.样本方差
若从总体中随机抽样,获得n个观测数据x1,x2,…,xn,用表示这n个数据的均值,则称s2=为这n个数据的样本方差,也简称为方差.
新知运用
例2 某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg):
甲:102,101,99,98,103,98,99.
乙:110,115,90,85,75,115,110.
试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间的产品比较稳定.
方法指导 分别计算甲、乙车间的平均数和方差即可得到答案.
【方法总结】计算方差的四个步骤:(1)算出样本数据的平均数;(2)算出每个样本数据与样本数据平均数的差:xi-(i=1,2,3,…,n);(3)算出(2)中xi-(i=1,2,3,…,n)的平方;(4)算出(3)中n个平方数的平均数,即为样本方差.
巩固训练
  甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据如下(单位:cm):
甲:99,100,98,100,100,103.
乙:99,100,102,99,100,100.
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
探究3:分层抽样的均值与方差
情境设置
问题1:在分层抽样中各层抽查的个数不一样,如何求样本的平均数呢
问题2:在分层抽样中各层抽查的个数不一样,如何求样本的方差呢
新知生成
1.在分层抽样时,如果将总体分为2层,各层抽取的样本量、样本平均数和样本方差分别表示为n1,n2,,,,,那么全部样本的样本容量n、样本均值和样本方差s2分别为n=n1+n2,=·+·,s2={n1[+(-)2]+n2[+(-)2]}.
2.在分层抽样时,如果将总体分为k层,第j层抽取的样本量为nj,样本平均数为,样本方差为,j=1,2,…,k,记n=nj,那么全部样本的均值=(nj),全部样本的方差为s2={nj[+(-)2]}.
新知运用
例3 某学校统计了教师职称及年龄:中级职称教师的人数为50,平均年龄为38岁,方差是2;高级职称的教师中有3人58岁,5人40岁,2人38岁.求该校中级职称和高级职称教师年龄的平均数和方差.
【方法总结】计算分层抽样的方差s2的步骤
(1)确定,,,;
(2)确定;
(3)应用公式s2=[+(-)2]+[+(-)2]计算s2.
巩固训练
已知某省二、三、四线城市房屋数量之比为1∶3∶6,2022年8月份调查得知该省二、三、四线城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市房价的方差为    .
探究4:标准差
情境设置
问题1:方差充分利用所有数据,并且仅用一个数值来刻画一组数据的离散程度,试问方差有局限性吗 局限性是什么
问题2:解决问题1的局限性的方法是什么
新知生成
标准差
解决方差局限性的方法就是引入标准差.标准差是方差的算术平方根.
若σ2是总体方差,则称σ=是总体标准差;
若s2是样本方差,则称s=是样本标准差.
给定数据x1,x2,…,xn和均值.由方差计算公式知道,样本标准差s可以用下面的公式计算s=.
新知运用
例4 机床生产一批参考尺寸为6.0 mm±0.3 mm的零件,从中随机抽取10个,量得其尺寸如下表(单位:mm):
序号 1 2 3 4 5 6 7 8 9 10
尺寸 6.3 5.8 6.2 5.9 6.2 6.0 5.8 5.8 5.9 6.1
  (1)求样本零件尺寸的平均值与标准差s;
(2)估计这批零件尺寸位于(-s,+s)的百分比.
参考数据:取=1.79.
方法指导 (1)由平均数和标准差计算公式可直接计算求得结果;(2)由(1)可求得区间为(5.821,6.179),利用样本估计总体的思想可直接计算得到结果.
【随堂检测】
1.已知样本数据x1,x2,x3,x4,x5,该样本平均数为4,方差为2,现加入一个数4,得到新样本的平均数为,方差为s2,则下列说法正确的是(  ).
                  
A.>4,s2>2 B.=4,s2>2
C.<4,s2<2 D.=4,s2<2
2.为了调查公司员工的健康状况,用分层抽样的方法抽取样本.已知所抽取的所有员工的平均体重为60 kg,标准差为60;男员工的平均体重为70 kg,标准差为50;女员工的平均体重为50 kg,标准差为60.若样本中有20名男员工,则女员工的人数为(  ).
A.160 B.180 C.200 D.210
3.若某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=    .
4.已知样本9,10,11,x,y的平均数是10,标准差是,则xy=    .
2

展开更多......

收起↑

资源列表