14.4.2 用样本估计总体的离散程度参数(课件 学案 练习)高中数学苏教版(2019)必修 第二册

资源下载
  1. 二一教育资源

14.4.2 用样本估计总体的离散程度参数(课件 学案 练习)高中数学苏教版(2019)必修 第二册

资源简介

(共58张PPT)
14.4 用样本估计总体
14.4.2 用样本估计总体的
离散程度参数
探究点一 方差、标准差的计算
探究点二 方差、标准差的性质
探究点三 标准差、方差的应用
探究点四 分层抽样数据的方差计算
【学习目标】
1.结合具体实例,经历用样本估计总体的离散程度参数(标准差、方
差、极差)的过程,理解离散程度参数的统计含义.
2.经历分层抽样的样本平均数和方差的推导过程,会求具体问题的样
本平均数和样本方差,并能解释它们在实际问题中的意义.
知识点一 极差、方差、标准差
1.极差
我们把一组数据的最大值与最小值的____称为极差.

2.方差
设一组样本数据,, ,,其平均数为 ,则称
_ __________________为这个样本的方差,简称__________.
样本方差
3.标准差
方差的算术平方根_ _________________为样本的标准差,简称_____
_______.
样本标准差
4.离散型方差公式
一般地,若取值为,, ,的频率分别为,, , ,则其平均
数为_ __________,其方差为__________________.
5.极差、方差、标准差都是刻画数据离散程度的度量值,标准差刻画
了数据离平均数波动的幅度大小.
【诊断分析】
1.判断正误.(正确的打“√”,错误的打“×”)
(1)标准差、方差越小,数据的离散程度越小.( )

(2)若样本数据都相等,则 .( )

(3)标准差的大小不会超过极差.( )

(4)若样本数据都相等,则表明数据没有波动幅度,数据没有离散性,
标准差为0.( )

2.样本数据2,4,6,8,10的标准差为_____.
[解析] ,则标准差为
.
知识点二 分层抽样数据的方差
一般地,如果总体分为层,第层抽取的样本为,, ,,第
层的样本量为,样本平均数为,样本方差为,,2, , ,
记,那么,所有数据的样本方差为
____________________ _ ____________________.
探究点一 方差、标准差的计算
例1(1)下面的数据是某男运动员跳高的跳跃高度(单位: ),则
这组数据的方差和标准差分别为______和_____(精确到小数点后两
位).
16.39
4.05
[解析] 根据题意,平均数
,
方差 ,
标准差 .
(2)[2024·浙江温州期末] 已知样本数据,, , 的平均数为9,
方差为12,现这组样本数据增加一个数据 ,此时新样本数据的平
均数为10,则新样本数据的方差为_____.
19.8
[解析] 由题可知, ,
可得, ,且,解得 ,
所以新样本数据的方差为
.
变式(1)[2024·邯郸期末]有三组数据 ,5,5,6,6,6,7,7,
7;,4,5,5,6,7,7,8,8; ,3,3,3,6,9,9,9,9.
设它们的方差依次为,, ,则( )
A. B.
C. D.

[解析] 数据①5,5,5,6,6,6,7,7,7的平均数和方差分别为
, ;
数据②4,4,5,5,6,7,7,8,8的平均数和方差分别为


数据 ,3,3,3,6,9,9,9,9的平均数和方差分别为
,.
所以 .故选D.
(2)[2024·南京金陵中学期末] 已知数据3,7, ,6的平均数是4,
则这组数据的标准差为( )
A. B. C. D.
[解析] 由题意得,解得 ,
则这组数据的方差为,
所以这组数据的标准差为 .故选C.

[素养小结]
标准差、方差的意义
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、
方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度
越小.标准差的大小不会超过极差.
(2)标准差、方差的取值范围是 .标准差、方差为0时,样本
中的各数据相等,说明数据没有波动幅度,数据没有离散性.
探究点二 方差、标准差的性质
例2(1) 若,,, ,的标准差为2,那么 ,
, , 的标准差为( )
A.18 B.14 C.6 D.3
[解析] 设,,, ,的方差为, ,
, ,的方差为,
,,, ,的标准差为2,,
则 ,,, ,
的标准差为 .故选C.

(2)(多选题)[2024·福州期中] 已知样本数据,, 的平均数为
2,方差为1,则下列说法正确的是( )
A.数据, 的平均数为6
B.数据,, 的方差为9
C.数据,, ,2的方差为1
D.数据,, 的平均数为5


[解析] 对于A,数据,, 的平均数为,
故A错误;
对于B,数据,, 的方差为 ,故B正确;
对于C,因为 ,
,所以数据,, ,2的平均数为,所以数据,, ,
2的方差为 ,故C错误;
对于D,由, ,
得,可得 ,
所以数据,,的平均数为,故D正确.故选 .
变式(1) 已知数据,, ,的方差为,数据 ,
, ,的方差为,则 ( )
A.1 B.2 C. D.
[解析] 因为数据,, ,的方差为,所以数据 ,
, ,的方差为,所以,则 .故选C.

(2)(多选题)有两组样本数据:,, ,;,, , ,
其中 .则这两组样本数据的( )
A.平均数相同 B.中位数相同
C.方差相同 D.极差相同


[解析] 根据题意,对于数据,, , ,假设,设其平均数为,中位数为,方差为 ,极差为,
则, ,
,.
对于数据, ,,设其平均数为,中位数为,方差为 ,极差为,因为,所以 ,


方差 ,
故这两组样本数据的方差和极差相同,平均数和中位数不同.故选 .
[素养小结]
(1)一组数据中的每一个数都加上或减去同一个常数,所得的一组新
数据的方差不变,标准差也不变.
(2)若把一组数据中的每一个数都变为原来的 倍并加上或减去常
数,则所得的一组新数据的标准差变为原来的倍,方差变为原来的
倍,而与 的大小无关.
探究点三 标准差、方差的应用
例3 甲、乙两台机床同时加工直径为 的零件,为检验质量,从中
各抽取10个零件测量其直径,所得数据如下:
甲机床:99,100,98,100,100,103,97,103,98,102;
乙机床:99,100,102,99,100,100,99,101,99,101.
(1)分别计算两组数据的平均数,及方差, ;
解: ,
.
,
.
(2)分别计算两组数据中,位于 ,
之间的数据的个数以及所占的百分比;
解:由(1)知, .
对于甲组数据, ,
有7个数据在内,占 .
对于乙组数据, ,
有9个数据在内,占 .
(3)根据(1)的结果判断哪台机床加工零件的质量更稳定.
解:两台机床所加工零件的直径的平均值相同,
又 ,所以乙机床加工零件的质量更稳定.
变式 为了监控某种零件的一条生产线的生产过程,检验员每天从该
生产线上随机抽取16个零件,并测量其尺寸(单位: ),结果如下:
10.05 10.03 10.08 10.09 10.02 10.05 10.08 10.00
10.05 10.06 10.06 10.05 10.07 10.06 10.07 9.98
(1)计算该零件抽样尺寸的极差,样本平均数和样本标准差 ;
(参考数据:,计算结果精确到 )
解:该零件抽样尺寸的极差为 ,
样本平均数
,,
样本方差

所以样本标准差 .
(2)将样本平均数作为总体平均数 的估计值,样本标准差 作为
总体标准差 的估计值,根据生产经验,在一天的抽检零件中,如果
出现了数据落在 之外的零件,则认为这条生产线在这
一天的生产过程中可能出现了异常情况,机床应检修调整,试利用
估计值判断是否需对机床进行检修.
解:由(1)得, ,
所以, ,
故 ,
因为 ,所以需对机床进行检修.
[素养小结]
在实际问题中,仅靠平均数不能完全反应问题,还要研究方差,方
差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差
越大,离散程度越大,数据波动性越强,稳定性越差;方差越小,
离散程度越小,数据波动性越弱,稳定性越好.
探究点四 分层抽样数据的方差计算
例4 甲、乙两支田径队队员的体检结果为:甲队队员体重(单位: )
的平均数为60,方差为200,乙队队员体重(单位: )的平均数为70,
方差为300.已知甲、乙两队的队员人数之比为 ,求甲、乙两队全部
队员体重的平均数和方差.
解:由题可知,甲队人数占所有队员人数的, ,
乙队人数占所有队员人数的 ,
则甲、乙两队全部队员体重的平均数 ,
甲、乙两队全部队员体重的方差
.
变式 [2024·江苏南通海安高级中学高一月考] 为获得某中学高一学
生的身高(单位: )信息,采用随机抽样方法抽取了样本量为50
的样本,其中男、女生的样本量均为25,计算得到男生样本的平均
数为176,标准差为10,女生样本的平均数为166,标准差为20,则
总样本的方差为_____.
275
[解析] 记男生样本为,, ,,平均数为,方差为 ,女生样本为
,, ,,平均数为,方差为,总样本的平均数为,方差为 ,
则,, ,


则 .
[素养小结]
计算分层抽样的方差 的步骤:
(1)确定,,, ;
(2)确定 ;
(3)应用公式 ,计算
.
拓展 2023年10月22日,汉江生态城2023襄阳
马拉松在湖北省襄阳市成功举行,志愿者的
服务工作是马拉松成功举办的重要保障,襄
阳市新时代文明实践中心承办了志愿者选拔
的面试工作.现随机抽取了100名候选者的面试
成绩,并分成五组:第一组,第二组,第三组 ,
第四组,第五组 ,绘制成如图所示的频率分布直方图.已
知第一、二组的频率之和为 ,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数;
解:由题意可知
解得
可知每组的频率依次为,,,, ,
所以这100名候选者面试成绩的平均数为
.
(2)现从以上各组中用分层抽样的方法选取
20人担任本市的宣传者,若本市宣传者中第
二组面试者的面试成绩的平均数和方差分别
为62和40,第四组面试者的面试成绩的平均
数和方差分别为80和70,据此估计这次第二
组和第四组面试者所有人面试成绩的方差.
解:因为第二组和第四组的频率之比为
,所以估计这次第二组和第四组面试
者所有人面试成绩的平均数

故估计这次第二组和第四组面试者所有人面试成绩的方差
.
1.标准差与方差的统计意义
(1)标准差、方差描述了一组数据围绕平均数波动程度的大小.标准
差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散
程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
(2)标准差的单位与原数据的单位相同,方差的单位是原数据的单位的
平方,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样
本数据的离散程度上是一样的,但在解决实际问题时,一般采用标准差.
(3)标准差(方差)的取值范围为 .若样本数据都相等,表明
数据没有波动幅度,数据没有离散性,则标准差为0.反之,标准差为0的
样本,其中的数据都相等.
2.描述数据离散程度的另一个统计量——极差
(1)一组数据的最大值与最小值的差称为极差.
(2)极差反映了一组数据变化的最大幅度,它对一组数据中的极端值
非常敏感,一般情况下,极差大,则数据较分散,数据的波动性大;极差小,
则数据相对集中,数据的波动性小.极差的计算非常简单,但极差只考虑
了两个极端值,而没有考虑中间的数据,因此很多时候极差作为数据的
离散程度的统计量可靠性较差.
(3)极差的取值范围也是 .标准差的大小不会超过极差.
3.计算标准差的步骤如下:
(1)求样本数据的平均数 ;
(2)求 ;
(3)求 ;
(4)求 ;
(5)求, 即为标准差.
1.平均数、方差、标准差的计算及应用
例1(1) 已知样本数据,,,, ,
的平均数为16,方差为9,则另一组数据,,,,, ,12的方
差为( )
A. B. C. D.7

[解析] 设数据,,,,,的平均数为,方差为 ,由题意得
,,所以, ,
则,,,,,,12的平均数为,方差为 .故选C.
(2)若一个容量为8的样本的平均数为5,方差为2,现样本中又加
入一个新数据5,此时样本容量为9,平均数为,方差为 ,则
( )
A., B.,
C., D.,
[解析] 由题意知, .故选B.

2.分层抽样中样本平均数和方差的计算
例2 从甲队60人、乙队40人中,按照分层抽样的方法共抽取10人,
进行一轮答题.相关统计情况如下:甲队答对题数的平均数为1,方差
为1;乙队答对题数的平均数为 ,方差为0.25.则这10人答对题数
的方差为( )
A.0.8 B.0.675 C.0.74 D.0.76

[解析] 从甲队60人、 乙队40人中,按照分层抽样的方法共抽取10人,
则从甲队中抽取(人),从乙队中抽取 (人),
由题意知这10人答对题数的平均数为 ,
所以这10人答对题数的方差为
.故选D.
例3 [2024·福建厦门双十中学月考]
某高校为了提升学校餐厅的服务水平,
组织4000名师生对学校餐厅满意度进
行评分调查,按照分层抽样的方法,
抽取200名师生的评分作为样本,绘
制成如图所示的频率分布直方图.
(1)求图中 的值;
解:由频率分布直方图的性质,可得
,解得
.
(2)设在样本中,学生、教师的人
数分别为, ,记
所有学生的评分为,, , ,
其平均数为,方差为 ,所有教师
的评分为,, , ,其平均数
为,方差为,总样本的平均数为 ,
方差为,若, ,求
的最小值.
解:由,可得 ,
所以 ,
.
令,则 ,可得 ,
当且仅当 时,等号成立,
又因为 ,所以

则 ,
解得或 ,
因为且 ,
所以 ,即实数 的最小值为160.14.4.2  用样本估计总体的离散程度参数
1.B [解析] 由方差、标准差、极差的定义可知,方差、标准差、极差能度量样本离散程度,由中位数和平均数的定义可知,中位数和平均数能度量样本的集中趋势.故选B.
2.B [解析] 这个样本的平均数=×(1+2+3+4+5)=3,标准差s==
.故选B.
3.D [解析] 因为样本数据x1,x2,…,x10的方差为3,所以2x1-1,2x2-1,…,2x10-1的方差为22×3=12.故选D.
4.D [解析] ==160,==161,所以=×[(169-160)2+(162-160)2+(150-160)2+(160-160)2+(159-160)2]=37.2,=×[(180-
161)2+(160-161)2+(150-161)2+(150-161)2+(165-161)2]=124,所以<,<.故选D.
5.B [解析] 设总进球数的平均数为,方差为s2,男教师占教师总人数的ω1,进球的平均数为,方差为,女教师占教师总人数的ω2,进球的平均数为,方差为,则由=ω1+ω2,得13=14ω1+12ω2,又由ω1+ω2=1,解得ω1=ω2=.由s2=ω1[+(-)2]+ω2[+(-)2],得13=×[8+(14-13)2]+×[+(12-13)2],解得=16.故选B.
6.A [解析] 记原5个数据依次为x1,x2,x3,x4,x5,则新数据的平均数为=5,由原数据的方差为1,得(++++)-42=1,则++++=85,所以这组新数据的方差为(+++++102)-52=.故选A.
7.A [解析] 对于B,4月,5月,6月这三个月增速的平均数为=4.5,4月,5月,6月,7月这四个月增速的平均数为=4.3,故B错误;对于A,4月,5月,6月这三个月增速的方差为=0.74,4月,5月,6月,7月这四个月增速的方差为=0.675,故A正确;对于D,9月,10月,11月这三个月增速的平均数为=,10月,11月,12月这三个月增速的平均数为=6,故D错误;对于C,9月,10月,11月这三个月增速的方差为×=,10月,11月,12月这三个月增速的方差为=,故C错误.故选A.
8.AD [解析] 去掉一个最低评分和一个最高分后剩下评分的平均数有可能变小、不变或变大,故A中说法错误;剩下评分的极差一定会变小,故B中说法正确;剩下评分的波动性变小,则方差变小,故C中说法正确;剩下评分的中位数不变,故D中说法错误.故选AD.
9.ABD [解析] 对于A,==580,==580,所以=,故A正确;对于B,=×[(560-580)2+(580-580)2+(570-580)2+(590-580)2+(600-580)2]=200,=×[(550-
580)2+(600-580)2+(580-580)2+(580-580)2+(590-580)2]=280,所以<,故B正确;对于C,甲种水稻产量的极差为600-560=40,乙种水稻产量的极差为600-550=50,所以甲种水稻产量的极差小于乙种水稻产量的极差,故C错误;对于D,s2=2,所以(-s2,+s2)为(580-2,580+2),因为16<2<18,所以562<580-2<564,596<580+2<598,所以乙种水稻的产量有三年位于(-s2,+s2)之间,故D正确.故选ABD.
10.1 [解析] 这组数据的平均数为=4,所以这组数据的方差为
==3.6,得a2+a-2=0,解得a=-2(舍去)或a=1.
11.9.5 28.5 [解析] 根据题意得=×(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5,则s2=×[(2.5-9.5)2×4+(7.5-9.5)2×8+(12.5-9.5)2×5+(17.5-9.5)2×2+(22.5-9.5)2×1]=28.5.
12.16 [解析] 由题意,数据的中位数为16,可得=16,所以m+n=32,所以这6周的周慢走里程的平均数为=17.要使这6周的周慢走里程的标准差最小,需要(m-17)2+(n-17)2最小,又由(m-17)2+(n-17)2=(m-17)2+(32-m-17)2=2m2-64m+172+152,要使这6周的周慢走里程的标准差最小,则m=-=16.
13.解:(1)A系列的打分结果从小到大排列为76,79,81,84,86,86,88,92,93,95,
所以A系列综合打分的中位数为=86.
B系列的打分结果从小到大排列为75,80,80,83,85,87,90,92,93,95,
所以B系列综合打分的中位数为=86.
(2)A系列综合打分的平均数=
=86,
方差=×[(-10)2+(-7)2+(-5)2+(-2)2+02+02+22+62+72+92]=34.8.
B系列综合打分的平均数=
=86,
方差=×[(-11)2+(-6)2+(-6)2+(-3)2+(-1)2+12+42+62+72+92]=38.6.
因为A,B两个系列综合打分的中位数相等,平均数相等,方差满足<,所以推广A系列种植更合适.
14.解:(1)由题可知=×[200+(165-180)2]+×[210+(195-180)2]=430.14.4.2  用样本估计总体的离散程度参数
一、选择题
1.[2024·武汉期末] 下列统计量中,都能度量样本x1,x2,…,xn的集中趋势的是 (  )                 
A.样本x1,x2,…,xn的标准差与极差
B.样本x1,x2,…,xn的中位数与平均数
C.样本x1,x2,…,xn的极差与众数
D.样本x1,x2,…,xn的方差与平均数
2.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为 (  )
A.1 B.
C. D.2
3.[2024·江苏无锡一中期末] 若样本数据x1,x2,…,x10的方差为3,则2x1-1,2x2-1,…,2x10-1的方差为 (  )
A.3 B.5
C.6 D.12
4.[2024·江苏宿迁期末] 从两个班级各随机抽取5名学生测量身高(单位:cm),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生身高的平均数,及方差,的关系为 (  )
A.>,>
B.>,<
C.<,>
D.<,<
5.[2024·湖北武汉期末] 某次趣味运动会,设置了教师足球射门比赛:教师射门,学生守门.已知参与射门比赛的教师有60名,进球数的平均数和方差都是13,其中男教师进球数的平均数和方差分别是14和8,女教师进球数的平均数为12,则女教师进球数的方差为 (  )
A.15 B.16
C.17 D.18
6.[2024·大同一中期末] 已知由5个数据组成的一组数据的平均数为4,方差为1,现再加入一个数据10,组成一组新的数据,则这组新数据的方差为 (  )
A. B.
C. D.7
7.[2024·北京朝阳区期末] 近年来,我国国民经济运行总体稳定,延续回升向好态势.如图是我国某年4月到该年12月规模以上工业增加值同比增长速度(以下简称增速)统计图.
注:规模以上工业指年主营业务收入2000万元及以上的工业企业.
下列说法正确的是 (  )
A.4月,5月,6月这三个月增速的方差比4月,5月,6月,7月这四个月增速的方差大
B.4月,5月,6月这三个月增速的平均数比4月,5月,6月,7月这四个月增速的平均数小
C.连续三个月增速的方差最大的是9月,10月,11月这三个月
D.连续三个月增速的平均数最大的是9月,10月,11月这三个月
8.(多选题)[2024·江苏无锡天一中学高一期末] 在学校组织的《爱我中华》主题演讲比赛中,有10位评委对每位选手进行评分(评分互不相同),将选手的得分去掉一个最低评分和一个最高评分,则下列说法错误的是 (  )
A.剩下评分的平均数变大
B.剩下评分的极差变小
C.剩下评分的方差变小
D.剩下评分的中位数变大
9.(多选题)[2024·福建龙岩期末] 某农场种植的甲、乙两种水稻,在面积相等的两块稻田中连续5年的产量如下:
品种 第1年 第2年 第3年 第4年 第5年
甲/kg 560 580 570 590 600
乙/kg 550 600 580 580 590
若,分别表示甲、乙两种水稻产量的平均数,,分别表示甲、乙两种水稻产量的方差,则下列说法正确的是 (  )
A.=
B.<
C.甲种水稻产量的极差与乙种水稻产量的极差相等
D.乙种水稻的产量有三年位于(-s2,+s2)之间
二、填空题
10.已知a>0,一组数据4,2,3-a,4+a,7的方差为3.6,则a=    .
11.[2024·山东聊城二中月考] 某医院急救中心随机抽取20位病人等待急诊的时间记录如表:
等待时间/分 [0,5) [5,10) [10,15) [15,20) [20,25]
频数 4 8 5 2 1
用上述分组资料估计病人等待时间的平均数=    ,病人等待时间的方差s2=    .(同一组数据以该组区间的中点值为代表)
12.[2024·浙江宁波期中] 慢走是一种简单又优良的锻炼方式,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.小温按从小到大的顺序记录了近6周的周慢走里程(单位:公里):11,12,m,n,20,27,其中这6周的周慢走里程的中位数为16,若要使这6周的周慢走里程的标准差最小,则m=    .
三、解答题
13.某杨梅种植户从购买客户中随机抽取20位客户做质量随访调查,其中购买A系列(大棚种植)的有10位客户,购买B系列(自然种植)的有10位客户,从杨梅的大小、口感、水分、甜度进行综合打分(满分为100分),打分结果记录如下:
A系列(大棚种植):84,81,79,76,95,88,93,86,86,92
B系列(自然种植):92,95,80,75,83,87,90,80,85,93
(1)分别求出这两个系列综合打分的中位数.
(2)分别求出这两个系列综合打分的平均数与方差,通过上述数据结果进行分析,你认为推广哪种系列种植更合适
14.某社区工作人员采用分层抽样的方法分别在甲、乙两个小区各抽取了8户家庭,统计了每户家庭近7天用于垃圾分类的总时间(单位:分钟),其中甲小区的统计表如下:
住户序号 1 2 3 4 5 6 7 8
所需时间/分 200 220 200 180 200 a b 220
设xi,yi分别为甲、乙小区抽取的第i户家庭近7天用于垃圾分类的总时间(单位:分钟),,分别为甲、乙小区所抽取样本的的平均数,,分别为甲、
(1)若a≤b,求a和b的值.
(2)甲小区物业为提高垃圾分类效率,优先试行新措施,每天由部分物业员工协助垃圾分类工作,经统计,甲小区住户每户每天用于垃圾分类的时间减少了5分钟.利用样本估计总体,计算甲小区试行新措施之后,甲、乙两个小区的所有住户近7天用于垃圾分类的总时间的平均数和方差.
参考公式:若总体划为2层,通过分层抽样,各层抽取的样本容量、样本平均数和样本方差分别为m,,;n,,.总的样本平均数为,样本方差为s2,则s2=[+(-)2]+[+(-)2].14.4.2 用样本估计总体的离散程度参数
【课前预习】
知识点一
1.差
2.
3.
4.
诊断分析
1.(1)√ (2)√ (3)√ (4)√
2.2 [解析] =×(2+4+6+8+10)=6,则标准差为=2.
知识点二
【课中探究】
探究点一
例1 (1)16.39 4.05 (2)19.8 [解析] (1)根据题意,平均数=×(190.0+190.3+190.5+193.0+193.5+198.1+194.1+197.1+202.9)=190+×(0.3+0.5+3+3.5+8.1+4.1+7.1+12.9)≈194.39,方差s2=×[(190.0-)2+(190.3-)2+…+(202.9-)2]≈16.39,标准差s≈≈4.05.
(2)由题可知
变式 (1)D (2)C [解析] (1)数据①5,5,5,6,6,6,7,7,7的平均数和方差分别为==6,==;数据②4,4,5,5,6,7,7,8,8的平均数和方差分别为==6,==;数据③3,3,3,3,6,9,9,9,9的平均数和方差分别为==6,==8.所以<<.故选D.
(2)由题意得=4,解得a=0,则这组数据的方差为=,所以这组数据的方差为=.故选C.
探究点二
例2 (1)C (2)BD [解析] (1)设x1,x2,x3,…,x314的方差为D(X),3(x1+5),3(x2+5),…,3(x314+5)的方差为D(Y),∵x1,x2,x3,…,x314的标准差为2,∴D(X)=4,则D(Y)=32D(X)=9×4=36,∴3(x1+5),3(x2+5),…,3(x314+5)的标准差为=6.故选C.
(2)对于A,数据3x1-1,3x2-1,3x3-1的平均数为3×2-1=5,故A错误;对于B,数据3x1-1,3x2-1,3x3-1的方差为32×1=9,故B正确;对于C,因为x1+x2+x3=3×2=6,(x1-2)2+(x2-2)2+(x3-2)2=1×3=3,所以数据x1,x2,x3,2的平均数为=2,所以数据x1,x2,x3,2的方差为[(x1-2)2+(x2-2)2+(x3-2)2+(2-2)2]=,故C错误;对于D,由x1+x2+x3=6,(x1-2)2+(x2-2)2+(x3-2)2=3,得++-4(x1+x2+x3)+12=3,可得++=15,所以数据,,的平均数为=5,故D正确.故选BD.
变式 (1)C (2)CD [解析] (1)因为数据x1,x2,…,xn的方差为s2,所以数据ax1-1,ax2-1,…,axn-1的方差为a2s2,所以a2=4,则a=±2.故选C.
(2)根据题意,对于数据x1,x2,…,x2024,假设x1探究点三
例3 解:(1)=×(99+100+98+100+100+103+97+103+98+102)=100,
=×(99+100+102+99+100+100+99+101+99+101)=100.
=×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2+(97-100)2+(103-100)2+(98-100)2+(102-100)2]=4,=×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2+(99-100)2+(101-100)2+(99-100)2+(101-100)2]=1.
(2)由(1)知s甲=2,s乙=1.
对于甲组数据,[-s甲,+s甲]=[100-2,100+2]=[98,102],有7个数据在[98,102]内,占70%.
对于乙组数据,[-s乙,+s乙]=[100-1,100+1]=[99,101],有9个数据在[99,101]内,占90%.
(3)两台机床所加工零件的直径的平均值相同,
又>,所以乙机床加工零件的质量更稳定.
变式 解:(1)该零件抽样尺寸的极差为10.09-9.98=0.11,
样本平均数=10+×(0.05+0.03+0.08+0.09+0.02+0.05+0.08+0.00+0.05+0.06+0.06+0.05+0.07+0.06+0.07-0.02)=10.05,样本方差s2=×(02+0.022+0.032+0.042+0.032+02+0.032+0.052+02+0.012×2+02+0.022+0.012+
0.022+0.072)==,
所以样本标准差s=≈0.03.
(2)由(1)得μ≈10.05,ζ≈0.03,
所以μ-2ζ≈9.99,μ+2ζ≈10.11,
故[μ-2ζ,μ+2ζ]≈[9.99,10.11],
因为9.98<9.99,所以需对机床进行检修.
探究点四
例4 解:由题可知=60,甲队人数占所有队员人数的=,=70,乙队人数占所有队员人数的=,
则甲、乙两队全部队员体重的平均数=×60+×70=68,甲、乙两队全部队员体重的方差s2=×[200+(60-68)2]+×[300+(70-68)2]=296.
变式 275 [解析] 记男生样本为y1,y2,…,y25,平均数为,方差为,女生样本为z1,z2,…,z25,平均数为,方差为,总样本的平均数为,方差为s2,=×[25×125+10×(25×176-25×176)+25×425+10×(25×166-25×166)]=275.
拓展 解:(1)由题意可知解得
可知每组的频率依次为0.05,0.25,0.45,0.2,0.05,
所以这100名候选者面试成绩的平均数为50×0.05+60×0.25+70×0.45+80×0.2+90×0.05=69.5.
(2)因为第二组和第四组的频率之比为=,所以估计这次第二组和第四组面试者所有人面试成绩的平均数==70,
故估计这次第二组和第四组面试者所有人面试成绩的方差s2=×[40+(62-70)2]+×[70+(80-70)2]=.14.4.2 用样本估计总体的离散程度参数
【学习目标】
  1.结合具体实例,经历用样本估计总体的离散程度参数(标准差、方差、极差)的过程,理解离散程度参数的统计含义.
  2.经历分层抽样的样本平均数和方差的推导过程,会求具体问题的样本平均数和样本方差,并能解释它们在实际问题中的意义.
◆ 知识点一 极差、方差、标准差
1.极差
我们把一组数据的最大值与最小值的    称为极差.
2.方差
设一组样本数据x1,x2,…,xn,其平均数为,则称      为这个样本的方差,简称    .
3.标准差
方差的算术平方根      为样本的标准差,简称      .
4.离散型方差公式
一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为     ,其方差为      .
5.极差、方差、标准差都是刻画数据离散程度的度量值,标准差刻画了数据离平均数波动的幅度大小.
【诊断分析】 1.判断正误.(正确的打“√”,错误的打“×”)
(1)标准差、方差越小,数据的离散程度越小. (  )
(2)若样本数据都相等,则s=0. (  )
(3)标准差的大小不会超过极差. (  )
(4)若样本数据都相等,则表明数据没有波动幅度,数据没有离散性,标准差为0. (  )
2.样本数据2,4,6,8,10的标准差为    .
◆ 知识点二 分层抽样数据的方差
一般地,如果总体分为k层,第j层抽取的样本为xj1,xj2,…,,第j层的样本量为nj,样本平均数为,样本方差为,j=1,2,…,k,记那么,所有数据的样本方差为=       =        .
◆ 探究点一 方差、标准差的计算
例1 (1)下面的数据是某男运动员跳高的跳跃高度(单位:cm),则这组数据的方差和标准差分别为    和     (精确到小数点后两位).
190.0 190.3 190.5 193.0 193.5 198.1
194.1 197.1  202.9
(2)[2024·浙江温州期末] 已知样本数据x1,x2,…,x9的平均数为9,方差为12,现这组样本数据增加一个数据x10,此时新样本数据的平均数为10,则新样本数据的方差为    .
变式 (1)[2024·邯郸期末] 有三组数据①5,5,5,6,6,6,7,7,7;②4,4,5,5,6,7,7,8,8;③3,3,3,3,6,9,9,9,9.设它们的方差依次为,,,则 (  )                  
A.>> B.>>
C.<< D.<<
(2)[2024·南京金陵中学期末] 已知数据3,7,a,6的平均数是4,则这组数据的标准差为 (  )
A. B.
C. D.
[素养小结]
标准差、方差的意义
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.标准差的大小不会超过极差.
(2)标准差、方差的取值范围是[0,+∞).标准差、方差为0时,样本中的各数据相等,说明数据没有波动幅度,数据没有离散性.
◆ 探究点二 方差、标准差的性质
例2 (1)若x1,x2,x3,…,x314的标准差为2,那么3(x1+5),3(x2+5),…,3(x314+5)的标准差为(  )
A.18 B.14
C.6 D.3
(2)(多选题)[2024·福州期中] 已知样本数据x1,x2,x3的平均数为2,方差为1,则下列说法正确的是 (  )
A.数据3x1-1,3x2-1,3x3-1的平均数为6
B.数据3x1-1,3x2-1,3x3-1的方差为9
C.数据x1,x2,x3,2的方差为1
D.数据,,的平均数为5
变式 (1)已知数据x1,x2,…,xn的方差为s2,数据ax1-1,ax2-1,…,axn-1的方差为4s2,则a= (  )
A.1 B.2
C.±2 D.-2
(2)(多选题)有两组样本数据:x1,x2,…,x2024;y1,y2,…,y2024,其中yi=xi+2024(i=1,2,…,2024).则这两组样本数据的 (  )
A.平均数相同
B.中位数相同
C.方差相同
D.极差相同
[素养小结]
(1)一组数据中的每一个数都加上或减去同一个常数,所得的一组新数据的方差不变,标准差也不变.
(2)若把一组数据中的每一个数都变为原来的k倍并加上或减去常数a,则所得的一组新数据的标准差变为原来的k倍,方差变为原来的k2倍,而与a的大小无关.
◆ 探究点三 标准差、方差的应用
例3 甲、乙两台机床同时加工直径为100 cm的零件,为检验质量,从中各抽取10个零件测量其直径,所得数据如下:
甲机床:99,100,98,100,100,103,97,103,98,102;
乙机床:99,100,102,99,100,100,99,101,99,101.
(1)分别计算两组数据的平均数,及方差,;
(2)分别计算两组数据中,位于[-s甲,+s甲],[-s乙,+s乙]之间的数据的个数以及所占的百分比;
(3)根据(1)的结果判断哪台机床加工零件的质量更稳定.
变式 为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm),结果如下:
10.05 10.03 10.08 10.09 10.02 10.05 10.08 10.00
10.05 10.06 10.06 10.05 10.07 10.06 10.07 9.98
(1)计算该零件抽样尺寸的极差,样本平均数和样本标准差s;(参考数据:≈5.74,计算结果精确到0.01)
(2)将样本平均数作为总体平均数μ的估计值,样本标准差s作为总体标准差ζ的估计值,根据生产经验,在一天的抽检零件中,如果出现了数据落在[μ-2ζ,μ+2ζ]之外的零件,则认为这条生产线在这一天的生产过程中可能出现了异常情况,机床应检修调整,试利用估计值判断是否需对机床进行检修.
[素养小结]
在实际问题中,仅靠平均数不能完全反应问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越强,稳定性越差;方差越小,离散程度越小,数据波动性越弱,稳定性越好.
◆ 探究点四 分层抽样数据的方差计算
例4 甲、乙两支田径队队员的体检结果为:甲队队员体重(单位:kg)的平均数为60,方差为200,乙队队员体重(单位:kg)的平均数为70,方差为300.已知甲、乙两队的队员人数之比为1∶4,求甲、乙两队全部队员体重的平均数和方差.
变式 [2024·江苏南通海安高级中学高一月考] 为获得某中学高一学生的身高(单位:cm)信息,采用随机抽样方法抽取了样本量为50的样本,其中男、女生的样本量均为25,计算得到男生样本的平均数为176,标准差为10,女生样本的平均数为166,标准差为20,则总样本的方差为    .
[素养小结]
计算分层抽样的方差s2的步骤:
(1)确定,,,;
(2)确定;
(3)应用公式s2=[+(-)2]+[+(-)2],计算s2.
拓展 2023年10月22日,汉江生态城2023襄阳马拉松在湖北省襄阳市成功举行,志愿者的服务工作是马拉松成功举办的重要保障,襄阳市新时代文明实践中心承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95),绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数;
(2)现从以上各组中用分层抽样的方法选取20人担任本市的宣传者,若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和70,据此估计这次第二组和第四组面试者所有人面试成绩的方差.

展开更多......

收起↑

资源列表