9.2.4 总体离散程度的估计 (课件+学案 ) 2025-2026学年高一数学人教A版(2019)必修第二册

资源下载
  1. 二一教育资源

9.2.4 总体离散程度的估计 (课件+学案 ) 2025-2026学年高一数学人教A版(2019)必修第二册

资源简介

9.2.4 总体离散程度的估计
【课程标准要求】 1.理解方差、标准差的含义,会计算方差和标准差.2.掌握求分层随机抽样总样本的平均数及方差的方法.
知识点 平均距离、方差与标准差
1.平均距离
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数.我们用每个数据与平均数的差的绝对值作为“距离”,即|xi-|(i=1,2,…,n)作为xi到的“距离”.可以得到这组数据x1,x2,…,xn到的“平均距离”为|xi-|.
为了避免式中含有绝对值,通常改用平方来代替,即(xi-)2.我们称(xi-)2为这组数据的方差.有时为了计算方差的方便,我们还把方差写成以下形式:-.方差的单位是原始数据的单位的平方.称为这组数据的标准差.
2.总体方差与总体标准差
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=(Yi-)2为总体方差,S=为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=fi(Yi-)2.
3.样本方差与样本标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称s2=(yi-)2为样本方差,s=为样本标准差.
知识拓展
平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
基础自测
1.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为(  )
[A] 3 [B] 2 [C] [D]
2.从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为(  )
分数 5 4 3 2 1
人数 20 10 30 30 10
[A] [B] [C] 3 [D]
所以s2=×[20×(5-3)2+10×(4-3)2+30×(3-3)2+30×(2-3)2+10×(1-3)2]==,所以s=.
故选B.
3.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是    .
s=
=
==2.
4.(人教A版必修第二册P215练习T5改编)某校采用分层随机抽样的方法采集了高一、高二、高三年级学生的身高信息,部分调查数据如下表:
项目 样本量 样本平均数 样本方差
高一 100 167 120
高二 100 170 150
高三 100 173 150
则总的样本方差s2=    .
所以总的样本方差为
s2=×[120+(167-170)2]+×[150+(170-170)2]+×[150+(173-170)2]
=×(120+9)+×150+×(150+9)
=146.
题型一 方差和标准差的概念
[例1] 甲、乙两名学生6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为,,标准差分别为s甲,s乙,则(  )
[A] <,s甲s乙
[C] >,s甲,s甲>s乙
方差和标准差反映的是一组数据的集中与离散程度.一般地,标准差和方差越小说明数据越集中、越稳定,反之越离散、越不稳定.
[变式训练] 下列说法正确的个数为(  )
①数据的极差越小,样本数据分布越集中、稳定;
②数据的平均数越小,样本数据分布越集中、稳定;
③数据的标准差越小,样本数据分布越集中、稳定;
④数据的方差越小,样本数据分布越集中、稳定.
[A] 1 [B] 2 [C] 3 [D] 4
题型二 频率分布直方图中的方差计算
[例2] 某快捷超市计划通过停车收费推动快速购物进而提升顾客流量,在制定停车收费方案时,需要考虑顾客停车时间的长短.现随机采集了100个停车时长的数据(单位:min),按(0,20],(20,40],(40,60],(60,80],(80,100]分成 5组,其频率分布直方图如图.
(1)如果该超市计划奖励35%的快速购物顾客不收取其停车费,那么应该允许免费停车多长时间
(2)记t0=+s,其中为样本平均数,s为样本标准差.如果该超市计划对停车时长超过t0的客户征收更高的停车费,求t0(精确到个位).(注:假设频率分布直方图中每组数据在组内均匀分布,同一组中的数据用该组区间的中点值作代表,参考数据:≈5.9)
(0.005+a+0.017 5+0.007 5+0.007 5)×20=1,解得a=0.012 5,因为前两组的频率和为0.005×20+0.012 5×20=0.35,
所以应该允许车辆免费停车40 min.
(2)车辆平均停车时长为
=0.005×20×10+0.012 5×20×30+0.017 5×20×50+0.007 5×20×70+0.007 5×20×90=50,
s2=(10-50)2×0.1+(30-50)2×0.25+(50-50)2×0.35+(70-50)2×0.15+(90-50)2×0.15=560,
所以s==4≈24,
所以t0=+s≈50+24=74.
根据频率分布直方图估计一组数据的方差的方法
先利用每组的组中值乘该组的频率(即每组矩形的面积)求和得的估计值,再将每组的组中值减去平均数平方后乘该组的频率求和.
[变式训练] 某学校为了了解高二年级学生数学运算能力,对高二年级的200名学生进行了一次测试.已知参加此次测试的学生的分数xi(i=1,2,3,…,200)全部在45分到95分之间,该校将所有分数分成5组:[45,55),[55,65),…,[85,95],整理得到如图所示的频率分布直方图(同一组中的数据用该组区间的中点值作代表).
(1)求m的值,并估计此次校内测试分数的平均值;
(2)试估计这200名学生的分数xi(i=1,2,3,…,200)的方差s2,并判断此次得分为52分和94分的两名学生的成绩是否进入[-2s,+2s]范围内 (参考数据:≈11.4)
所以m=0.024.
此次校内测试分数的平均值估计为=0.06×50+0.14×60+0.24×70+0.36×80+0.20×90=75.
(2)s2=0.06×(50-75)2+0.14×(60-75)2+0.24×(70-75)2+0.36×(80-75)2+0.20×(90-75)2=129,
所以s=≈11.4,
所以-2s≈52.2,+2s≈97.8,
所以得分为52分的学生的成绩没有进入[52.2,97.8]内,
得分为94分的学生的成绩进入[52.2,97.8]内.
题型三 分层随机抽样的方差
[例3] 某校高一年级有学生1 000人,其中男生600人,女生400人.为了获得该校全体高一学生的身高信息,采用按比例分配的分层随机抽样的方法,抽取一个容量为50的样本.
(1)求抽取男生、女生的人数;
(2)观测样本的指标值(单位:cm),计算得到男生样本的均值为170,方差为14,女生样本的均值为160,方差为34,求总样本的方差,并估计高一年级全体学生身高的方差.
(2)记男生身高为x1,x2,…,x30,其均值记为,方差记为;女生身高为y1,y2,…,y20,其均值记为,方差记为,把总样本的均值记为,方差记为s2,
所以总样本的均值为
=+==166,
总样本的方差为s2=·{30×[+]+20×[+]}
=×{30×[14+(170-166)2]+20×[34+(160-166)2]}=46,
所以总样本的方差为46,据此估计高一年级全体学生身高的方差为46.
若一个总体划分为2层,通过比例分配的分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为m,,;n,,.记总样本平均数为,总样本方差为s2,则
①=+;
②s2={m[+(-)2]+n[+(-)2]}.
[变式训练] 某地有农村居民320户,城镇居民180户.为了获得该地居民的户月均用水量的信息,从中抽取若干户居民得到样本A,并观测A的指标值(单位:t),计算得农村居民样本的均值为8.3,方差为10.86,城镇居民样本的均值为14.1,方差为34.62.
(1)若采用分层随机抽样的方法,能否求出A的均值和方差 说明你的理由;
(2)如果A中农村居民、城镇居民户数的样本量都是25,求A的均值和方差;
(3)能否用(2)的结论估计该地居民的户月均用水量的均值和方差 若能,请说明理由;若不能,请给出一个可以用来估计该地居民的户月均用水量的均值和方差的样本.
设农村居民均值为=8.3,方差为=10.86,城镇居民均值为=14.1,方差为=34.62.
因为=,所以可知样本A的户数为25k,
k∈N*,1≤k≤20,
其中农村居民的户数为16k,城镇居民的户数为9k.
所以样本A的均值为==10.388,
方差s2={16k[+(-)2]+9k[+(-)2]}={16k[10.86+(8.3-10.388)2]+9k[34.62+
(14.1-10.388)2]}=27.164 256≈27.16.
(2)样本A的均值为==11.2,
样本方差={25[+(-)2]+25[+(-)2]}=×{25×[10.86+(8.3-11.2)2]+25×[34.62+
(14.1-11.2)2]}=31.15.
(3)不能,因为没有按分层随机抽样抽取样本,样本数据不能客观反映总体.
根据分层随机抽样抽取人数为25k=50,所以k=2,所以应从农村居民中抽取户数为16k=32,从城镇居民中抽取户数为9k=18.
题型四 利用方差、标准差对实际问题进行决策
[例4] 一台机床生产一种直径为40 mm的零件,在正常生产时,零件的直径的标准差不应超过0.1,如果超过0.1,则机床应检修调整.下表是某日8:30—9:30及10:00—11:00两个时段中各随机抽取10个零件量出的直径的数值(单位:mm):
8:30—9:30 40 39.8 40.1 40.2 39.8
10:00—11:00 40 40 39.9 40 39.9
8:30—9:30 40.1 40.2 40.2 39.8 39.8
10:00—11:00 40.2 40 40.1 40 39.9
试判断在这两个时段内机床生产是否正常.
s甲≈0.173,s乙≈0.089.
从样本均值看,两个时段生产的零件尺寸差异性不大;从样本标准差看,s甲>0.1,s乙<0.1,这说明甲时段(8:30—9:30)机床生产不正常,而经过调试,机床在乙时段(10:00—11:00)生产正常:生产的零件稳定程度高,且在质量控制范围内.
(1)在实际问题中,仅靠平均数不能完全反映问题,还要研究偏离平均数的离散程度(即方差与标准差).
(2)方差(标准差)刻画一组数据离平均数波动的幅度大小.方差(标准差)越大,数据的离散程度越大;方差(标准差)越小,数据的离散程度越小.
[变式训练] 从甲、乙两名学生中选拔一人参加射箭比赛,为此需要对他们的射箭水平进行测试.现这两名学生在相同条件下各射箭10次,命中的环数如下:
甲 8 9 7 9 7 6 10 10 8 6
乙 10 9 8 6 8 7 9 7 8 8
(1)计算甲、乙两人射箭命中环数的平均数和标准差;
(2)比较两人的成绩,然后决定选择哪名学生参加射箭比赛.
=×(8+9+7+9+7+6+10+10+8+6)=8,
乙命中环数的平均数为
=×(10+9+8+6+8+7+9+7+8+8)=8,
甲命中环数的标准差为
s甲==,
乙命中环数的标准差为
s乙==,
故甲的平均数为8,标准差为,乙的平均数为8,标准差为.
(2)因为=,且s甲>s乙,所以甲、乙的平均成绩相同且乙的成绩较为稳定,故选择乙参加射箭
比赛.
(分值:75分)                  
单选每题5分,多选每题6分.
1.一组数据为50,49,51,48,52,则该组数据的平均数和方差分别为(  )
[A] 50,2 [B] 50,10
[C] 51,2 [D] 51,1
方差为×[(50-50)2+(49-50)2+(51-50)2+(48-50)2+(52-50)2]=2.故选A.
2.已知10个互不相同的样本数据:x1,x2,…,x10的平均数为,则关于新样本数据:x1,x2,…,x10,,下列说法正确的是(  )
[A] 极差变大 [B] 平均数变大
[C] 方差变小 [D] 中位数变小
3.已知甲、乙两名同学在一次射击练习中各射靶10次,射中环数频率分布如图所示,
令,分别表示甲、乙射中环数的均值;,分别表示甲、乙射中环数的方差,则(  )
[A] <,> [B] >,<
[C] =,> [D] =,<
=(7-8)2×0.3+(8-8)2×0.4+(9-8)2×0.3=0.6,=(7-8)2×0.4+(8-8)2×0.2+(9-8)2×0.4=0.8,
所以=,<.故选D.
4.已知某人收集一个样本容量为50的一组数据,并求得其平均数为70,方差为75,现发现在收集这些数据时,其中两个数据记录有误,一个错将80记录为60,另一个错将70记录为90,在对错误数据进行更正后,重新求得样本的平均数为,方差为s2,则(  )
[A] <70,s2<75 [B] >70,s2>75
[C] =70,s2<75 [D] =70,s2>75
设其他48个数据依次为a1,a2,…,a48,
因此(a1-70)2+(a2-70)2+…+(a48-70)2+(60-70)2+(90-70)2=50×75,
(a1-70)2+(a2-70)2+…+(a48-70)2+(80-70)2+(70-70)2=50×s2,
50(s2-75)=100-400-100=-400<0,所以s2<75.故选C.
5.(多选题)甲、乙两支田径队队员的体重(单位:kg)信息如下:甲队体重的平均数为60,方差为200,乙队体重的平均数为68,方差为300,又已知甲、乙两队的队员人数之比为1∶3,则关于甲、乙两队全部队员的体重的平均数和方差的说法正确的是(  )
[A] 平均数为67 [B] 平均数为66
[C] 方差为296 [D] 方差为287
故选BD.
6.(5分)已知样本数据x1,x2,x3的平均数为2,方差为1,则,,的平均数为    .
由=1,
得++=15,
所以=5.
7.(5分)某校为了解学生每个月在图书馆借阅书籍的数量,图书管理员甲抽取了一个容量为100的样本,并算得样本的平均数为5,方差为9;图书管理员乙也抽取了一个容量为100的样本,并算得样本的平均数为7,方差为16.若将这两个样本合在一起组成一个容量为200的新样本,则新样本数据的平均数为    ,方差为    .
所以两个样本合在一起的新样本数据的平均数为6,方差为13.5.
8.(13分)为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100只日光灯在必须换掉前的使用天数如表所示,试估计这种日光灯的平均使用寿命和标准差.(参考数据:≈461)
使用天数 日光灯数
451~480 1
481~510 11
511~540 18
541~570 20
571~600 25
601~630 16
631~660 7
661~690 2
675.5×2%=568.4≈568(天).
这些组中值的方差为×[1×(465.5-568.4)2+11×(495.5-568.4)2+18×(525.5-568.4)2+20×
(555.5-568.4)2+25×(585.5-568.4)2+16×(615.5-568.4)2+7×(645.5-568.4)2+2×(675.5-568.4)2]=
2 128.59(天2).
故所求的标准差为≈46(天).
所以估计这种日光灯的平均使用寿命约为568天,标准差约为46天.
9.一数学学习小组有5名同学,他们的历次数学考试成绩都比较稳定,且每次测试5人成绩的方差均为6左右.某次数学测试他们中的甲同学因故没能参加考试,其余4名同学的数学成绩分别为111分,114分,117分,118分.如果甲同学参加这次考试,利用以往的经验(方差为6)估计其成绩为(  )
[A] 112分 [B] 113分
[C] 115分 [D] 119分
则这5名同学本次考试成绩的平均数为×(111+114+117+118+110+5a)=114+a,
所以这5名同学本次考试成绩的方差为
[(111-114-a)2+(114-114-a)2+(117-114-a)2+(118-114-a)2+(110+5a-114-a)2]=6,解得a=1,
所以甲的分数估计为110+5a=115(分).故选C.
10.(5分)甲、乙两地10月1日至7日每天最低气温(单位:℃)如下:
项目 1日 2日 3日 4日 5日 6日 7日
甲地 10 14 16 15 11 13 12
乙地 18 19 15 16 17 14 a
==,
7=(10-13)2+(14-13)2+(16-13)2+(15-13)2+(11-13)2+(13-13)2+(12-13)2=28,
则7=(18-)2+(19-)2+(15-)2+(16-)2+(17-)2+(14-)2+(a-)2=28,
化简得(a-20)(a-13)=0,
解得a=20或a=13,
故a的值可以为20或13.
11.(16分)某市为了了解人们对党史的认知程度,对不同年龄和不同职业的人举办了一次党史知识竞赛,满分100分(90分及以上为认知程度高).现从参赛者中抽取x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x;
(2)估计抽取的x人的年龄的中位数(结果保留整数)(同一组中的数据用该组区间中点值作
代表);
(3)从该市教师、军人、医务人员、工人、个体劳动者中用分层随机抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和这5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
①分别求5个年龄组和5个职业组成绩的平均数和方差;
②以上述数据为依据,评价5个年龄组和5个职业组对党史的认知程度.
所以=0.05,
所以x=120.
(2)设中位数为a,
因为0.01×5+0.07×5=0.4<0.5,
0.01×5+0.07×5+0.06×5=0.7>0.5,
所以中位数在第三组,
则0.01×5+0.07×5+(a-30)×0.06=0.5,
所以a=≈32,
所以抽取的x人的年龄的中位数估计值为32.
(3)①5个年龄组的平均数为×(93+96+97+94+90)=94,
方差为×[(-1)2+22+32+02+(-4)2]=6;
5个职业组的平均数为×(93+98+94+95+90)=94,
方差为×[(-1)2+42+02+12+(-4)2]=6.8.
②评价:从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更好.(共43张PPT)
9.2.4 总体离散程度的估计
1.理解方差、标准差的含义,会计算方差和标准差.2.掌握求分层随机抽样总样本的平均数及方差的方法.
【课程标准要求】
必备知识·归纳落实
知识点 平均距离、方差与标准差
1.平均距离
2.总体方差与总体标准差
3.样本方差与样本标准差
『知识拓展』
平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
基础自测
C
2.从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为(  )
B
分数 5 4 3 2 1
人数 20 10 30 30 10
3.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是    .
2
4.(人教A版必修第二册P215练习T5改编)某校采用分层随机抽样的方法采集了高一、高二、高三年级学生的身高信息,部分调查数据如下表:
项目 样本量 样本平均数 样本方差
高一 100 167 120
高二 100 170 150
高三 100 173 150
则总的样本方差s2=    .
146
关键能力·素养培优
题型一 方差和标准差的概念
C
·解题策略·
方差和标准差反映的是一组数据的集中与离散程度.一般地,标准差和方差越小说明数据越集中、越稳定,反之越离散、越不稳定.
[变式训练] 下列说法正确的个数为(  )
①数据的极差越小,样本数据分布越集中、稳定;
②数据的平均数越小,样本数据分布越集中、稳定;
③数据的标准差越小,样本数据分布越集中、稳定;
④数据的方差越小,样本数据分布越集中、稳定.
[A] 1 [B] 2
[C] 3 [D] 4
C
【解析】 由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数据的平均数则与之无关,故②不正确,①③④正确.故选C.
[例2] 某快捷超市计划通过停车收费推动快速购物进而提升顾客流量,在制定停车收费方案时,需要考虑顾客停车时间的长短.现随机采集了100个停车时长的数据(单位:min),按(0,20],(20,40],(40,60],(60,80],(80,100]分成 5组,其频率分布直方图如图.
题型二 频率分布直方图中的方差计算
(1)如果该超市计划奖励35%的快速购物顾客不收取其停车费,那么应该允许免费停车多长时间
【解】 (1)根据频率分布直方图中小长方形的面积之和等于1,则
(0.005+a+0.017 5+0.007 5+0.007 5)×20=1,解得a=0.012 5,
因为前两组的频率和为0.005×20+0.012 5×20=0.35,
所以应该允许车辆免费停车40 min.
·解题策略·
根据频率分布直方图估计一组数据的方差的方法
[变式训练] 某学校为了了解高二年级学生数学运算能力,对高二年级的200名学生进行了一次测试.已知参加此次测试的学生的分数xi(i=1,2,3,…,200)全部在45分到95分之间,该校将所有分数分成5组:[45,55),[55,65),…,
[85,95],整理得到如图所示的频率分布直方图(同一组中的数据用该组区间的中点值作代表).
[例3] 某校高一年级有学生1 000人,其中男生600人,女生400人.为了获得该校全体高一学生的身高信息,采用按比例分配的分层随机抽样的方法,抽取一个容量为50的样本.
(1)求抽取男生、女生的人数;
题型三 分层随机抽样的方差
(2)观测样本的指标值(单位:cm),计算得到男生样本的均值为170,方差为14,女生样本的均值为160,方差为34,求总样本的方差,并估计高一年级全体学生身高的方差.
·解题策略·
[变式训练] 某地有农村居民320户,城镇居民180户.为了获得该地居民的户月均用水量的信息,从中抽取若干户居民得到样本A,并观测A的指标值(单位:t),计算得农村居民样本的均值为8.3,方差为10.86,城镇居民样本的均值为14.1,方差为34.62.
(1)若采用分层随机抽样的方法,能否求出A的均值和方差 说明你的理由;
(2)如果A中农村居民、城镇居民户数的样本量都是25,求A的均值和方差;
(3)能否用(2)的结论估计该地居民的户月均用水量的均值和方差 若能,请说明理由;若不能,请给出一个可以用来估计该地居民的户月均用水量的均值和方差的样本.
【解】(3)不能,因为没有按分层随机抽样抽取样本,样本数据不能客观反映总体.
根据分层随机抽样抽取人数为25k=50,所以k=2,所以应从农村居民中抽取户数为16k=32,从城镇居民中抽取户数为9k=18.
[例4] 一台机床生产一种直径为40 mm的零件,在正常生产时,零件的直径的标准差不应超过0.1,如果超过0.1,则机床应检修调整.下表是某日8:30—9:30及10:00—11:00两个时段中各随机抽取10个零件量出的直径的数值(单位:mm):
题型四 利用方差、标准差对实际问题进行决策
8:30—9:30 40 39.8 40.1 40.2 39.8
10:00—11:00 40 40 39.9 40 39.9
8:30—9:30 40.1 40.2 40.2 39.8 39.8
10:00—11:00 40.2 40 40.1 40 39.9
试判断在这两个时段内机床生产是否正常.
·解题策略·
(1)在实际问题中,仅靠平均数不能完全反映问题,还要研究偏离平均数的离散程度(即方差与标准差).
(2)方差(标准差)刻画一组数据离平均数波动的幅度大小.方差(标准差)越大,数据的离散程度越大;方差(标准差)越小,数据的离散程度越小.
[变式训练] 从甲、乙两名学生中选拔一人参加射箭比赛,为此需要对他们的射箭水平进行测试.现这两名学生在相同条件下各射箭10次,命中的环数如下:
甲 8 9 7 9 7 6 10 10 8 6
乙 10 9 8 6 8 7 9 7 8 8
(1)计算甲、乙两人射箭命中环数的平均数和标准差;
(2)比较两人的成绩,然后决定选择哪名学生参加射箭比赛.
感谢观看9.2.4 总体离散程度的估计
【课程标准要求】 1.理解方差、标准差的含义,会计算方差和标准差.2.掌握求分层随机抽样总样本的平均数及方差的方法.
知识点 平均距离、方差与标准差
1.平均距离
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数.我们用每个数据与平均数的差的绝对值作为“距离”,即|xi-|(i=1,2,…,n)作为xi到的“距离”.可以得到这组数据x1,x2,…,xn到的“平均距离”为|xi-|.
为了避免式中含有绝对值,通常改用平方来代替,即(xi-)2.我们称(xi-)2为这组数据的方差.有时为了计算方差的方便,我们还把方差写成以下形式:-.方差的单位是原始数据的单位的平方.称为这组数据的标准差.
2.总体方差与总体标准差
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=(Yi-)2为总体方差,S=为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=fi(Yi-)2.
3.样本方差与样本标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称s2=(yi-)2为样本方差,s=为样本标准差.
知识拓展
平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
基础自测
1.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为(  )
[A] 3 [B] 2 [C] [D]
【答案】 C
【解析】 因为=×(1+2+3+4+5)=3,所以s2=×[(-2)2+(-1)2+02+12+22]=2,所以s=.故选C.
2.从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为(  )
分数 5 4 3 2 1
人数 20 10 30 30 10
[A] [B] [C] 3 [D]
【答案】 B
【解析】 因为===3,
所以s2=×[20×(5-3)2+10×(4-3)2+30×(3-3)2+30×(2-3)2+10×(1-3)2]==,所以s=.
故选B.
3.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是    .
【答案】 2
【解析】 由题意知=4,++…+=200,
s=
=
==2.
4.(人教A版必修第二册P215练习T5改编)某校采用分层随机抽样的方法采集了高一、高二、高三年级学生的身高信息,部分调查数据如下表:
项目 样本量 样本平均数 样本方差
高一 100 167 120
高二 100 170 150
高三 100 173 150
则总的样本方差s2=    .
【答案】 146
【解析】 由题意知,总的样本平均数为=×167+×170+×173=170,
所以总的样本方差为
s2=×[120+(167-170)2]+×[150+(170-170)2]+×[150+(173-170)2]
=×(120+9)+×150+×(150+9)
=146.
题型一 方差和标准差的概念
[例1] 甲、乙两名学生6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为,,标准差分别为s甲,s乙,则(  )
[A] <,s甲s乙
[C] >,s甲,s甲>s乙
【答案】 C
【解析】 由统计图知,甲学生的总体成绩要好于乙学生的成绩,且乙学生的成绩波动较大,甲学生成绩较稳定,所以>,且s甲方差和标准差反映的是一组数据的集中与离散程度.一般地,标准差和方差越小说明数据越集中、越稳定,反之越离散、越不稳定.
[变式训练] 下列说法正确的个数为(  )
①数据的极差越小,样本数据分布越集中、稳定;
②数据的平均数越小,样本数据分布越集中、稳定;
③数据的标准差越小,样本数据分布越集中、稳定;
④数据的方差越小,样本数据分布越集中、稳定.
[A] 1 [B] 2 [C] 3 [D] 4
【答案】 C
【解析】 由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数据的平均数则与之无关,故②不正确,①③④正确.故选C.
题型二 频率分布直方图中的方差计算
[例2] 某快捷超市计划通过停车收费推动快速购物进而提升顾客流量,在制定停车收费方案时,需要考虑顾客停车时间的长短.现随机采集了100个停车时长的数据(单位:min),按(0,20],(20,40],(40,60],(60,80],(80,100]分成 5组,其频率分布直方图如图.
(1)如果该超市计划奖励35%的快速购物顾客不收取其停车费,那么应该允许免费停车多长时间
(2)记t0=+s,其中为样本平均数,s为样本标准差.如果该超市计划对停车时长超过t0的客户征收更高的停车费,求t0(精确到个位).(注:假设频率分布直方图中每组数据在组内均匀分布,同一组中的数据用该组区间的中点值作代表,参考数据:≈5.9)
【解】 (1)根据频率分布直方图中小长方形的面积之和等于1,则
(0.005+a+0.017 5+0.007 5+0.007 5)×20=1,解得a=0.012 5,因为前两组的频率和为0.005×20+0.012 5×20=0.35,
所以应该允许车辆免费停车40 min.
(2)车辆平均停车时长为
=0.005×20×10+0.012 5×20×30+0.017 5×20×50+0.007 5×20×70+0.007 5×20×90=50,
s2=(10-50)2×0.1+(30-50)2×0.25+(50-50)2×0.35+(70-50)2×0.15+(90-50)2×0.15=560,
所以s==4≈24,
所以t0=+s≈50+24=74.
根据频率分布直方图估计一组数据的方差的方法
先利用每组的组中值乘该组的频率(即每组矩形的面积)求和得的估计值,再将每组的组中值减去平均数平方后乘该组的频率求和.
[变式训练] 某学校为了了解高二年级学生数学运算能力,对高二年级的200名学生进行了一次测试.已知参加此次测试的学生的分数xi(i=1,2,3,…,200)全部在45分到95分之间,该校将所有分数分成5组:[45,55),[55,65),…,[85,95],整理得到如图所示的频率分布直方图(同一组中的数据用该组区间的中点值作代表).
(1)求m的值,并估计此次校内测试分数的平均值;
(2)试估计这200名学生的分数xi(i=1,2,3,…,200)的方差s2,并判断此次得分为52分和94分的两名学生的成绩是否进入[-2s,+2s]范围内 (参考数据:≈11.4)
【解】 (1)因为0.006×10+0.014×10+10m+0.036×10+0.020×10=1,
所以m=0.024.
此次校内测试分数的平均值估计为=0.06×50+0.14×60+0.24×70+0.36×80+0.20×90=75.
(2)s2=0.06×(50-75)2+0.14×(60-75)2+0.24×(70-75)2+0.36×(80-75)2+0.20×(90-75)2=129,
所以s=≈11.4,
所以-2s≈52.2,+2s≈97.8,
所以得分为52分的学生的成绩没有进入[52.2,97.8]内,
得分为94分的学生的成绩进入[52.2,97.8]内.
题型三 分层随机抽样的方差
[例3] 某校高一年级有学生1 000人,其中男生600人,女生400人.为了获得该校全体高一学生的身高信息,采用按比例分配的分层随机抽样的方法,抽取一个容量为50的样本.
(1)求抽取男生、女生的人数;
(2)观测样本的指标值(单位:cm),计算得到男生样本的均值为170,方差为14,女生样本的均值为160,方差为34,求总样本的方差,并估计高一年级全体学生身高的方差.
【解】 (1)由题意,可知抽取男生人数为×50=30,女生人数为×50=20.
(2)记男生身高为x1,x2,…,x30,其均值记为,方差记为;女生身高为y1,y2,…,y20,其均值记为,方差记为,把总样本的均值记为,方差记为s2,
所以总样本的均值为
=+==166,
总样本的方差为s2=·{30×[+]+20×[+]}
=×{30×[14+(170-166)2]+20×[34+(160-166)2]}=46,
所以总样本的方差为46,据此估计高一年级全体学生身高的方差为46.
若一个总体划分为2层,通过比例分配的分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为m,,;n,,.记总样本平均数为,总样本方差为s2,则
①=+;
②s2={m[+(-)2]+n[+(-)2]}.
[变式训练] 某地有农村居民320户,城镇居民180户.为了获得该地居民的户月均用水量的信息,从中抽取若干户居民得到样本A,并观测A的指标值(单位:t),计算得农村居民样本的均值为8.3,方差为10.86,城镇居民样本的均值为14.1,方差为34.62.
(1)若采用分层随机抽样的方法,能否求出A的均值和方差 说明你的理由;
(2)如果A中农村居民、城镇居民户数的样本量都是25,求A的均值和方差;
(3)能否用(2)的结论估计该地居民的户月均用水量的均值和方差 若能,请说明理由;若不能,请给出一个可以用来估计该地居民的户月均用水量的均值和方差的样本.
【解】 (1)能,理由如下:
设农村居民均值为=8.3,方差为=10.86,城镇居民均值为=14.1,方差为=34.62.
因为=,所以可知样本A的户数为25k,
k∈N*,1≤k≤20,
其中农村居民的户数为16k,城镇居民的户数为9k.
所以样本A的均值为==10.388,
方差s2={16k[+(-)2]+9k[+(-)2]}={16k[10.86+(8.3-10.388)2]+9k[34.62+
(14.1-10.388)2]}=27.164 256≈27.16.
(2)样本A的均值为==11.2,
样本方差={25[+(-)2]+25[+(-)2]}=×{25×[10.86+(8.3-11.2)2]+25×[34.62+
(14.1-11.2)2]}=31.15.
(3)不能,因为没有按分层随机抽样抽取样本,样本数据不能客观反映总体.
根据分层随机抽样抽取人数为25k=50,所以k=2,所以应从农村居民中抽取户数为16k=32,从城镇居民中抽取户数为9k=18.
题型四 利用方差、标准差对实际问题进行决策
[例4] 一台机床生产一种直径为40 mm的零件,在正常生产时,零件的直径的标准差不应超过0.1,如果超过0.1,则机床应检修调整.下表是某日8:30—9:30及10:00—11:00两个时段中各随机抽取10个零件量出的直径的数值(单位:mm):
8:30—9:30 40 39.8 40.1 40.2 39.8
10:00—11:00 40 40 39.9 40 39.9
8:30—9:30 40.1 40.2 40.2 39.8 39.8
10:00—11:00 40.2 40 40.1 40 39.9
试判断在这两个时段内机床生产是否正常.
【解】 设8:30—9:30为甲时段,10:00—11:00为乙时段.用计算器计算可得=40,=40,
s甲≈0.173,s乙≈0.089.
从样本均值看,两个时段生产的零件尺寸差异性不大;从样本标准差看,s甲>0.1,s乙<0.1,这说明甲时段(8:30—9:30)机床生产不正常,而经过调试,机床在乙时段(10:00—11:00)生产正常:生产的零件稳定程度高,且在质量控制范围内.
(1)在实际问题中,仅靠平均数不能完全反映问题,还要研究偏离平均数的离散程度(即方差与标准差).
(2)方差(标准差)刻画一组数据离平均数波动的幅度大小.方差(标准差)越大,数据的离散程度越大;方差(标准差)越小,数据的离散程度越小.
[变式训练] 从甲、乙两名学生中选拔一人参加射箭比赛,为此需要对他们的射箭水平进行测试.现这两名学生在相同条件下各射箭10次,命中的环数如下:
甲 8 9 7 9 7 6 10 10 8 6
乙 10 9 8 6 8 7 9 7 8 8
(1)计算甲、乙两人射箭命中环数的平均数和标准差;
(2)比较两人的成绩,然后决定选择哪名学生参加射箭比赛.
【解】 (1)根据题中所给数据,可得甲命中环数的平均数为
=×(8+9+7+9+7+6+10+10+8+6)=8,
乙命中环数的平均数为
=×(10+9+8+6+8+7+9+7+8+8)=8,
甲命中环数的标准差为
s甲==,
乙命中环数的标准差为
s乙==,
故甲的平均数为8,标准差为,乙的平均数为8,标准差为.
(2)因为=,且s甲>s乙,所以甲、乙的平均成绩相同且乙的成绩较为稳定,故选择乙参加射箭
比赛.
(分值:75分)                  
单选每题5分,多选每题6分.
1.一组数据为50,49,51,48,52,则该组数据的平均数和方差分别为(  )
[A] 50,2 [B] 50,10
[C] 51,2 [D] 51,1
【答案】 A
【解析】 由题意可得该组数据的平均数为=50,
方差为×[(50-50)2+(49-50)2+(51-50)2+(48-50)2+(52-50)2]=2.故选A.
2.已知10个互不相同的样本数据:x1,x2,…,x10的平均数为,则关于新样本数据:x1,x2,…,x10,,下列说法正确的是(  )
[A] 极差变大 [B] 平均数变大
[C] 方差变小 [D] 中位数变小
【答案】 C
【解析】 因为极差是数据中最大值与最小值的差值,新样本数据x1,x2,…,x10,的最大值和最小值与原样本数据x1,x2,…,x10的最大值和最小值相同,所以极差不变,故A错误;因为x1,x2,…,x10的平均数为,所以新样本数据x1,x2,…,x10,的平均数为==,故B错误;设x1,x2,…,x10的方差为s2,则新样本数据的方差为[10s2+(-)2]=s2,所以方差变小,故C正确;根据中位数的概念可知,中位数可能变小,也可能不变或变大,故D错误.故选C.
3.已知甲、乙两名同学在一次射击练习中各射靶10次,射中环数频率分布如图所示,
令,分别表示甲、乙射中环数的均值;,分别表示甲、乙射中环数的方差,则(  )
[A] <,> [B] >,<
[C] =,> [D] =,<
【答案】 D
【解析】 由题图可知,=7×0.3+8×0.4+9×0.3=8,=7×0.4+8×0.2+9×0.4=8,
=(7-8)2×0.3+(8-8)2×0.4+(9-8)2×0.3=0.6,=(7-8)2×0.4+(8-8)2×0.2+(9-8)2×0.4=0.8,
所以=,<.故选D.
4.已知某人收集一个样本容量为50的一组数据,并求得其平均数为70,方差为75,现发现在收集这些数据时,其中两个数据记录有误,一个错将80记录为60,另一个错将70记录为90,在对错误数据进行更正后,重新求得样本的平均数为,方差为s2,则(  )
[A] <70,s2<75 [B] >70,s2>75
[C] =70,s2<75 [D] =70,s2>75
【答案】 C
【解析】 因为80+70=60+90,因此平均数不变,即=70,
设其他48个数据依次为a1,a2,…,a48,
因此(a1-70)2+(a2-70)2+…+(a48-70)2+(60-70)2+(90-70)2=50×75,
(a1-70)2+(a2-70)2+…+(a48-70)2+(80-70)2+(70-70)2=50×s2,
50(s2-75)=100-400-100=-400<0,所以s2<75.故选C.
5.(多选题)甲、乙两支田径队队员的体重(单位:kg)信息如下:甲队体重的平均数为60,方差为200,乙队体重的平均数为68,方差为300,又已知甲、乙两队的队员人数之比为1∶3,则关于甲、乙两队全部队员的体重的平均数和方差的说法正确的是(  )
[A] 平均数为67 [B] 平均数为66
[C] 方差为296 [D] 方差为287
【答案】 BD
【解析】 依题意,甲队体重的平均数为60,乙队体重的平均数为68,而甲、乙两队的队员人数之比为1∶3,所以甲队队员在所有队员中所占比重为,乙队队员在所有队员中所占比重为.故甲、乙两队全部队员的体重的平均数为=60×+68×=66.甲、乙两队全部队员的体重的方差为s2=×[200+(60-66)2]+×[300+(68-66)2]=59+228=287.
故选BD.
6.(5分)已知样本数据x1,x2,x3的平均数为2,方差为1,则,,的平均数为    .
【答案】 5
【解析】 由题意知,=2,所以x1+x2+x3=6,
由=1,
得++=15,
所以=5.
7.(5分)某校为了解学生每个月在图书馆借阅书籍的数量,图书管理员甲抽取了一个容量为100的样本,并算得样本的平均数为5,方差为9;图书管理员乙也抽取了一个容量为100的样本,并算得样本的平均数为7,方差为16.若将这两个样本合在一起组成一个容量为200的新样本,则新样本数据的平均数为    ,方差为    .
【答案】 6 13.5
【解析】 因为=×5+×7=6,s2=×[9+(5-6)2]+×[16+(7-6)2]=13.5,
所以两个样本合在一起的新样本数据的平均数为6,方差为13.5.
8.(13分)为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100只日光灯在必须换掉前的使用天数如表所示,试估计这种日光灯的平均使用寿命和标准差.(参考数据:≈461)
使用天数 日光灯数
451~480 1
481~510 11
511~540 18
541~570 20
571~600 25
601~630 16
631~660 7
661~690 2
【解】 各区间的组中值分别为465.5,495.5,525.5,555.5,585.5,615.5,645.5,675.5,由此算得平均数约为465.5×1%+495.5×11%+525.5×18%+555.5×20%+585.5×25%+615.5×16%+645.5×7%+
675.5×2%=568.4≈568(天).
这些组中值的方差为×[1×(465.5-568.4)2+11×(495.5-568.4)2+18×(525.5-568.4)2+20×
(555.5-568.4)2+25×(585.5-568.4)2+16×(615.5-568.4)2+7×(645.5-568.4)2+2×(675.5-568.4)2]=
2 128.59(天2).
故所求的标准差为≈46(天).
所以估计这种日光灯的平均使用寿命约为568天,标准差约为46天.
9.一数学学习小组有5名同学,他们的历次数学考试成绩都比较稳定,且每次测试5人成绩的方差均为6左右.某次数学测试他们中的甲同学因故没能参加考试,其余4名同学的数学成绩分别为111分,114分,117分,118分.如果甲同学参加这次考试,利用以往的经验(方差为6)估计其成绩为(  )
[A] 112分 [B] 113分
[C] 115分 [D] 119分
【答案】 C
【解析】 设甲的分数为110+5a,
则这5名同学本次考试成绩的平均数为×(111+114+117+118+110+5a)=114+a,
所以这5名同学本次考试成绩的方差为
[(111-114-a)2+(114-114-a)2+(117-114-a)2+(118-114-a)2+(110+5a-114-a)2]=6,解得a=1,
所以甲的分数估计为110+5a=115(分).故选C.
10.(5分)甲、乙两地10月1日至7日每天最低气温(单位:℃)如下:
项目 1日 2日 3日 4日 5日 6日 7日
甲地 10 14 16 15 11 13 12
乙地 18 19 15 16 17 14 a
记这7天甲地每天最低气温的标准差为s1,乙地每天最低气温的标准差为s2.根据上述信息,若s1=s2,则a的值可以为    .(写出一个符合题意答案即可)
【答案】 20(答案不唯一)
【解析】 ==13,
==,
7=(10-13)2+(14-13)2+(16-13)2+(15-13)2+(11-13)2+(13-13)2+(12-13)2=28,
则7=(18-)2+(19-)2+(15-)2+(16-)2+(17-)2+(14-)2+(a-)2=28,
化简得(a-20)(a-13)=0,
解得a=20或a=13,
故a的值可以为20或13.
11.(16分)某市为了了解人们对党史的认知程度,对不同年龄和不同职业的人举办了一次党史知识竞赛,满分100分(90分及以上为认知程度高).现从参赛者中抽取x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x;
(2)估计抽取的x人的年龄的中位数(结果保留整数)(同一组中的数据用该组区间中点值作
代表);
(3)从该市教师、军人、医务人员、工人、个体劳动者中用分层随机抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和这5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
①分别求5个年龄组和5个职业组成绩的平均数和方差;
②以上述数据为依据,评价5个年龄组和5个职业组对党史的认知程度.
【解】 (1)根据题中频率分布直方图可得第一组的频率为0.01×5=0.05,
所以=0.05,
所以x=120.
(2)设中位数为a,
因为0.01×5+0.07×5=0.4<0.5,
0.01×5+0.07×5+0.06×5=0.7>0.5,
所以中位数在第三组,
则0.01×5+0.07×5+(a-30)×0.06=0.5,
所以a=≈32,
所以抽取的x人的年龄的中位数估计值为32.
(3)①5个年龄组的平均数为×(93+96+97+94+90)=94,
方差为×[(-1)2+22+32+02+(-4)2]=6;
5个职业组的平均数为×(93+98+94+95+90)=94,
方差为×[(-1)2+42+02+12+(-4)2]=6.8.
②评价:从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更好.

展开更多......

收起↑

资源列表