人教A版(2019)> 必修 第二册> 第九章 统计> 9.2 用样本估计总体

资源下载
  1. 二一教育资源

人教A版(2019)> 必修 第二册> 第九章 统计> 9.2 用样本估计总体

资源简介

(共28张PPT)
9.2 用样本估计总体
9.2.1 总体取值规律的估计
第二课时 统计图表的识别

[学习目标] 
1.在问题情境中会用不同的统计图分析样本数据. 
2.能从统计图表中获取有价值的信息,估计总体的分布规律.
统计图表 主要应用
扇形图 直观描述各类数据占总数的________
条形图和 频率分布 直方图 直观描述不同类别或分组数据的______和______
折线图 描述数据随时间的____________
比例 
频数
频率
变化趋势
中学高一(2)班甲、乙两名同学自高中以来每次数学考试成绩情况如下:
甲的得分:95,75,86,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
为了了解这两名同学数学考试成绩的变化情况,下列使用的统计图最方便的是(  )
A.频率分布直方图    B.条形图
C.扇形图 D.折线图
[分析] 根据常见图表反应数据的特点确定.
例1
D
 折线图更易于显示数据的变化趋势.
1.某商业集团董事长想了解集团旗下五个超市的销售情况,通知五个超市经理把最近一周每天的销售金额统计上报,要求既能反映一周内每天销售金额的多少,又能反映一周内每天销售金额的变化情况和趋势,最好选用的统计图表为(  )
A.频率分布直方图 B.折线统计图
C.扇形统计图 D.统计表
跟踪训练
B
折线统计图的一个显著特点就是能反映统计量的变化趋势,所以既能反映一周内每天销售金额的多少,又能反映一周内每天销售金额的变化情况和趋势,则最好选用的统计图表为折线统计图.
角度1:扇形图
(多选)某珍珠商户销售A,B,C,D四款珍珠商品,今年第一季度比去年第一季度营收实现翻番,现统计这四款商品的营收占比,得到如下饼图.同比第一季度,下列说法正确的是(   )
A.今年商品A的营收是去年的4倍
B.今年商品B的营收是去年的2倍
C.今年商品C的营收比去年减少
D.今年商品B,D营收的总和与去年相比占总营收的比例不变
[分析] 由条件,根据扇形图分别计算A,B,C,D四款珍珠商品的营收,由此确定正确选项.
ABD
例2
设去年第一季度营收为a亿元,则今年第一
季度营收为2a亿元,由扇形图可得
A款珍珠商品去年第一季度营收为0.1a亿元,
则今年第一季度营收为0.4a亿元,A正确;
B款珍珠商品去年第一季度营收为0.2a亿元,
则今年第一季度营收为0.4a亿元,B正确;
C款珍珠商品去年第一季度营收为0.5a亿元,则今年第一季度营收为0.8a亿元,C错误;
因为商品B,D今年第一季度营收的总和占总营收的比例为40%,
商品B,D去年第一季度营收的总和占总营收的比例为40%,
所以今年商品B,D营收的总和与去年相比占总营收的比例不变,D正确.

扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.
思维提升
角度2:条形统计图
 某校为了让学生度过一个充实的假期生活,要求每名学生都制定一份假期学习的计划.已知该校高一年级有400人,占全校人数的,高三年级占,为调查学生计划完成情况,用按比例分配的分层随机抽样的方法从全校的学生中抽取10%作为样本,将结果绘制成如图所示统计图,则样本中高三年级完成计划的人数为(  )
A.80 B.90
C.9 D.8
例3
D
=1 200,1 200×10%=120,故样本容量为120,其中高三年级有120×=20人,由图可知,样本中高三年级假期学习计划的完成率为40%,故样本中高三年级完成计划的人数为20×40%=8.

条形图是一种以矩形的长度为变量的统计图,通常用横轴(横轴上的数字)表示样本类别(样本值),用纵轴上的单位长度表示一定的数量.条形图主要用来比较两个或两个以上类别(只有一个变量)的样本,通常用于较小的数据分析.
思维提升
角度3:折线统计图
 (多选)某商店为了解该店铺商品的销售情况,对某产品近三年的产品月销售数据进行统计分析,绘制了折线统计图,如图.下列结论正确的有(  )
A.该产品的年销量逐年增加
B.该产品各年的月销量高峰
期大致都在8月
C.该产品2021年1月至12月的月销量逐月增加
D.该产品各年1月至6月的月销量相对于7月至12月波动性更小、变化更平稳
[分析] 根据折线图逐项判断可得答案.
例4
ABD
对于A,产品销量虽然逐月波动,但总
体上逐年增加,故A正确;
对于B,由折线统计图可知,各年的产
品销量高峰期大致都在8月,故B正确;
对于C,2021年8月至9月该产品月销量呈下降趋势,故C错误;
对于D,由折线统计图可知,该产品各年1月至6月的月销量相对于7月至12月,波动性更小、变化更平稳,故D正确.
1.观察折线图时,要首先确定横轴、纵轴表示的意义,然后观察各结点的数据以及变化情况.
2.在折线统计图中,从折线的上升、下降可分为统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.
思维提升
2.(多选)如图1为某省2024年1~4月份快递业务量统计图,图2为该省2024年1~4月份快递业务收入统计图,对统计图理解正确的是(   )
A.2024年1~4月份快递业务量3月份最高,2月份最低,差值接近2 000万件
B.2024年1~4月份快递业务量同比增长率均超过50%,在3月份最高
C.从两图中看,业务量与业务收入变化保持高度一致
D.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长
跟踪训练
ABC
由题图1可知,快递业务量3月份为4 397万件,2月份为2 411万件,差值为4 397-2 411=1 986万件,故A正确;由题图1可知B也正确;
对于C,由题图易知业务量从高到低变化是3月→4月→1月→2月,业务收入从高到低变化是3月→4月→1月→2月,保持高度一致,所以C正确;
对于D,由题图知业务收入2月比1月减少,4月比3月减少,整体不具备高速增长之说,所以D错误.
〈课堂达标·素养提升〉
1.把过期的药品随意丢弃,会造成对土壤和水体的污染,危害人们的健康.如何处理过期药品,有关机构随机对若干家庭进行调查,调查结果如图,其中对过期药品处理不正确的家庭达到(  )
A.79%         
B.80%
C.18%
D.82%
D
79%+1%+2%=82%.
2.统计某商城一年中各月份的收入、支出(单位:万元)情况,并制作折线图如图所示,则下列说法正确的是(  )
A.利润最高的月份是2月份
B.7月份至9月份的月平均支出为50万元
C.支出的最高值与支出的最低值的比是3∶1
D.2月份至3月份的收入的变化量与11
月份至12月份的收入的变化量相同
D
对于A,由题图可得1~12月份的利润分别为20万元,
20万元,30万元,20万元,20万元,20万元,20万元,10
万元,20万元,30万元,20万元,20万元,所以利润最
高的月份为3月份和10月份,所以A错误;对于B,7月
份至9月份的月平均支出为×(20+40+40)=≠
50(万元),所以B错误;对于C,由题图可知支出最高
的为60万元,最低的为10万元,所以支出的最高值
与支出的最低值的比是6∶1,所以C错误;对于D,由题图可知2月份至3月份的收入的变化量是减少了20万元,11月份至12月份的收入的变化量也是减少了20万元,所以2月份至3月份的收入的变化量与11月份至12月份的收入的变化量相同,所以D正确.
3.(多选)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式.并将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,下列说法正确的是(  )
A.扇形统计图中D的占比最大
B.条形统计图中A和C高度不一样
C.扇形统计图中A的占比大于D的占比
D.估计该校超过一半的学生选择自行乘车或家人接送
CD
由条形统计图知,B—自行乘车上学的有42人,
C—家人接送上学的有30人,
D—其他方式上学的有18人,采用B,C,D三种方式
上学的共90人,
由扇形统计图知,D—其他方式上学的学生占15%,
所以=120人,则A—结伴步行上学的有120-90=30人,
故条形图中A,C一样高,故B错误;
扇形图中A类占比与C一样都为=25%,故扇形
统计图中A的占比大于D的占比,故C正确;
因为样本中选择自行乘车或家人接送的频率
为=60%>50%,
所以估计该校超过一半的学生选择自行乘车或
家人接送,故D正确;
因为D—其他方式上学的人数最少,故扇形统计
图中D的占比最小,故A错误.
4.甲、乙两个城市2023年4月中旬每天的最高气温统计图如图所示,则这9天里,气温比较稳定的是     (填“甲”或“乙”)城市.

从折线统计图可以很清楚地看到乙城市的气温变化较大,而甲城市气温相对来说较稳定,变化基本不大.
感谢观看(共37张PPT)
9.2 用样本估计总体
9.2.1 总体取值规律的估计
第一课时 总体取值规律的估计

[学习目标] 
1.掌握频率分布表的作法以及频率分布直方图的画法. 
2.掌握用频率分布直方图估计总体. 
3.能根据频率分布表和频率分布直方图观测数据的分布规律.
作频率分布直方图的步骤
(1)求极差
极差为一组数据中最大值与最小值的________.

(2)决定组距与组数
将数据分组时,一般取________组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.当样本量不超过100时,常分成5~12组.
(3)将数据分组
按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.
等长
(4)列频率分布表
一般分四列:分组、频数累计、频数、频率.其中频数合计应是样本量,频率合计是1.
各小组的频率=.
高度
 从某校高三学生中抽取50名参加数学竞赛,成绩(单位:分)分组及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
例1
[解] (1)频率分布表如下.
成绩分组 频数累计 频数 频率
[40,50) 2 0.04
[50,60) 3 0.06
[60,70) 正正 10 0.2
[70,80) 正正正 15 0.3
[80,90) 正正 12 0.24
[90,100] 正 8 0.16
合计 50 1.00
(2)画出频率分布直方图;
[解] (2)画出频率分布直方图,如图所示.
(3)估计成绩在[60,90)的学生比例.
[解] (3)学生成绩在[60,90)的频率为0.2+0.3+0.24=0.74=74%,所以估计成绩在[60,90)的学生比例为74%.
在绘制出频率分布表以后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“”所占的比例来定高.
思维提升
1.某家庭记录了50天的日用水量数据(单位:m3),得到频数分布表如下:
50天的日用水量频数分布表
跟踪训练
日用 水量 [0,0.1) [0.1, 0.2) [0.2, 0.3) [0.3, 0.4) [0.4, 0.5) [0.5,
0.6]
频数 1 5 13 10 16 5
(1)作出50天的日用水量数据的频率分布直方图;
解:(1)
(2)估计日用水量小于0.35 m3的频率.
解: (2)由题可知用水量在[0.3,0.4)的频数为10,所以可估计在[0.3,0.35)的频数为5,故用水量小于0.35 m3的频数为1+5+13+5=24,其频率==0.48.
为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示).图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
例2
(1)第二小组的频率是多少 样本容量是多少
[分析] 根据频率分布直方图,求出各小组的频率,然后在计算.
[解] (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本容量==150.
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少
[分析] 根据频率分布直方图,求出各小组的频率,然后在计算.
[解] (2)由频率分布直方图可估计该校高一年级学生的达标率为×100%=88%.
(3)试求样本中不达标的学生人数.
[分析] 根据频率分布直方图,求出各小组的频率,然后在计算.
[解] (3)样本的达标率为88%,样本容量为150,不达标的学生频率为1-0.88=0.12,所以样本中不达标的学生人数为150×0.12=18.
(4)试求次数在130以上(含130次)的学生人数.
[分析] 根据频率分布直方图,求出各小组的频率,然后在计算.
[解] (4)次数在130以上(含130次)的学生人数为
×150=36.
频率分布直方图的性质
1.因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
思维提升
2.=样本容量.
3.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.
2.为了了解某工厂生产的产品情况,从该工厂生产的产品中随机抽取了一个容量为200的样本,测量它们的尺寸(单位:mm),并将数据分为[92,94),[94,96),[96,98),[98,100),[100,102),[102,104),[104,106]七组,其频率分布直方图如图所示.
跟踪训练
(1)求图中的x值.
解:(1)由(0.02+0.04+0.06+0.07+0.09+0.10+x)×2=1,解得x=0.12.
(2)根据频率分布直方图,求200件样本中尺寸在[98,100)内的样本数.
解: (2)200件样本中尺寸在[98,100)内的样本数为200×0.09×2=36.
(3)记产品尺寸在[98,102)内为A等品,每件可获利5元;产品尺寸在[92,94)内为不合格品,每件亏损2元;其余为合格品,每件可获利3元.若该工厂一个月共生产3 000件产品.以样本的频率代替总体在各组的频率,若单月利润未能达到11 000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实施升级改造.
解: (3)由题意可得,这批产品中A等品有3 000×(0.18+0.20)=1 140(件),
这批产品中不合格品有3 000×0.04=120(件),
这批产品中合格品有3 000-1 140-120=1 740(件),
1 140×5+1 740×3-120×2=10 680(元).
所以该工厂生产的产品一个月所获
得的利润为10 680元,
因为10 680<11 000,所以需要对该工
厂设备实施升级改造.
〈课堂达标·素养提升〉
1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是(  )
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
C
用样本频率分布估计总体频率分布时,若总体一定,则样本的容量越大,估计就越精确.
2.如图所示为某企业员工年龄(岁)的频率分布直方图,从左到右依次为第一组、第二组……第五组,若第五组的员工有80人,则第二组的员工人数为(  )

A.140           B.240
C.280 D.320
C
由已知得5(a+0.06+0.04+0.02+0.01)=1,所以
a=0.07,因为第五组的员工人数为80,所以第
二组的员工人数为0.07×=280.
3.在样本频率分布直方图中共有9个小矩形,若其中1个小矩形的面积等于其他8个小矩形面积和的,且样本容量为210,则该组的频数为(  )
A.28 B.40
C.56 D.60
D
设该小矩形的面积为x,9个小矩形的总面积为1,
则其他8个小矩形的面积和为x,所以x+x=1,
所以x=,所以该组的频数为×210=60.
4.为了解今年某校高三毕业班准备报考飞行员的学生的体重(单位:千克)情况,将所得数据整理后,画出频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为1∶2∶3,其中第2小组的频数为12.则该校准备报考飞行员的总人数为     .
48
设该校准备报考飞行员的总人数为n,设第1小组的频率为a,则有a+2a+3a+(0.013+0.037)×5=1,解得a=0.125,所以第2小组的频率为0.25.
又第2小组的频数为12,则有0.25=,解得n=48.
感谢观看(共31张PPT)
9.2 用样本估计总体
9.2.2 总体百分位数的估计

[学习目标] 
1.结合实例,能用样本估计百分位数. 
2.理解百分位数的统计含义.
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有______的数据小于或等于这个值,且至少有______________的数据大于或等于这个值.
p%
(100-p)%
2.计算一组n个数据的第p百分位数的一般步骤
第1步,按__________排列原始数据.
第2步,计算i=__________.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为__________;若i是整数,则第p百分位数为第i项与第________项数据的________.
从小到大 
n×p%
第j项数据 
(i+1)
平均数
3.四分位数
第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组__________排列后的数据分成________,因此称为__________,其中第25百分位数也称为______________或____________,第75百分位数也称为______________或____________.
由小到大 
四等份
四分位数
第一四分位数 
下四分位数
第三四分位数
上四分位数
 下列表述不正确的是(  )
A.50%分位数就是总体的中位数
B.第p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
例1
C
一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,所以C错误.

分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心位置.百分位数提供了有关数据项如何在最小值与最大值之间分布的信息.
思维提升
1.15%分位数的含义是(  )
A.总体中任何一个数小于它的可能性是15%
B.总体中任何一个数小于或等于它的可能性是15%
C.总体中任何一个数大于它的可能性是15%
D.总体中任何一个数大于或等于它的可能性是15%
跟踪训练
B
根据第p百分位数的定义可知B正确.
2.(多选)已知100个数据的第25百分位数是12.5,则下列说法错误的是(   )
A.这100个数据中一定有25个数小于12.5
B.把这100个数据从小到大排列后,12.5是第25个数据
C.把这100个数据从小到大排列后,12.5是第25个数据和第26个数据的平均数
D.把这100个数据从小到大排列后,12.5是第25个数据和第24个数据的平均数
ABD
因为100×25%=25为整数,所以根据百分位数的定义,可知将这100个数据从小到大排列后,12.5是第25个数据和第26个数据的平均数,所以这100个数据中一定有25个数小于或等于12.5,故A,B,D错误,C正确.
 从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,50,95百分位数;
[分析] (1)按照百分位数求解步骤,依次求解第25,50,95百分位数.
例2
[解] (1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,
则第25百分位数是=8.15,第50百分位数是=8.5,
第95百分位数是第12个数据为9.9.
(2)请你找出珍珠质量较小的前15%的珍珠质量;
[分析] (2)先求出第15百分位数,然后再找出比第15百分位数小的数据.
[解] (2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.
(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
[分析] (3)求解第25,50,95百分位数,按照三个数据进行划分.
[解] (3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
3.某人用手机记录了他连续10周每周的走路里程(单位:公里),其数据分别为12,15,9,8,14,11,17,10,7,16,则这组数据的60%分位数是(  )
A.7           B.12
C.13 D.14
跟踪训练
C
将这组数据按从小到大的顺序排列为7,8,9,10,11,12,14,15,16,17.
因为10×60%=6,则这组数据的60%分位数是这组数据中的第6个和第7个数据的平均数,即=13.
4.按从小到大顺序排列的两组数据:甲组:30,31,37,m,42,60;乙组:28,n,33,44,48,70,若这两组数据的第30百分位数,第50百分位数都分别对应相等,则m+n=(  )
A.60 B.65
C.70 D.71
D
由30%×6=1.8,则甲组数据的第30百分位数为31,乙组数据的第30百分位数为n,即n=31,第50百分位数即中位数,则乙组数据的第50百分位数为,甲组数据的第50百分位数为,于是,解得m=40,所以m+n=71.
 某市政府为了节约生活用水,计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准m,使得86%的居民生活用水不超过这个标准.在本市居民中随机抽取了100户家庭,统计其某年的月均用水量(单位:吨),通过数据分析得到如图所示的频率分布直方图.
(1)求a,m的值.
例3
[解] (1)由频率分布直方图得(0.16+0.30+0.40+0.50+0.30+0.16+a+a+a)×0.5=1,解得a=0.06.
由频率分布直方图得月均用水量在[0,3)内的频率为1-(0.16+0.06+0.06)
×0.5=0.86.
∵计划在本市实行居民生活用水定额管理,
即确定一个居民用水量标准m,使得86%的居
民生活用水不超过这个标准.
∴m≈3.
(2)如果我们称m为这组数据的86%分位数,那么这组数据的50%分位数是多少
[解] (2)由频率分布直方图知,数据在[0,2)内的频率为(0.06+0.16+0.30+0.40)×0.5=0.46,在[2,2.5)内的频率为0.50×0.5=0.25,
∴这组数据的50%分位数是2+×0.5=2.08(吨).
[变设问] 根据本例中的频率分布直方图计算月均用水量的15%分位数.
解:由例题中的频率分布直方图可知,月均用水量在[0,1)内的频率为(0.06+0.16)×0.5=0.11,在[1,1.5)内的频率为0.30×0.5=0.15.
∴月均用水量的15%分位数约为1+×0.5≈1.133(吨).
由频率分布直方图求百分位数的方法
1.频率分布直方图中小矩形的面积,就是数据落在该组的频率.
2.通过频率分布直方图计算第p百分位数落在区间[m,n)内(具体由前几个小长方形面积即频率确定,小于m的频率记为fm,小于n的频率记为fn,p∈[fm,fn)).
3.计算百分位数:m+(n-m)·(特殊地,若p=fm也适合上式).
思维提升
5.随机抽取100名男学生,测得他们的身高(单位:cm),按照区间[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示
跟踪训练
(1)求这100名男学生身高在170 cm及以上的学生人数;
解:(1)由频率分布直方图可知5×(0.01+0.07+x+0.04+0.02)=1,解得x=0.06,
身高在170 cm及以上的学生人数100×5×(0.06+0.04+0.02)=60(人).
(2)估计该校100名学生身高的75%分位数.
解: (2)[180,185]的人数占比为5×0.02=10%,[175,180)的人数占比为5×0.04=20%,
所以该校100名学生身高的75%分位数落在[175,180),
设该校100名学生身高的75%分位数为a,则0.04(180-a)+0.1=25%,解得a=176.25,
故该校100名生学身高的75%分位数为176.25.
感谢观看(共31张PPT)
9.2 用样本估计总体
9.2.3 总体集中趋势的估计

[学习目标] 
1.掌握用频率分布直方图估计总体的众数、中位数、平均数. 
2.会用样本的数字特征估计总体的数字特征,并结合实际合理解决问题. 3.体会样本数字特征的随机性,会用样本估计总体的思想解决问题.
1.众数:一组数据中出现________最多的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在________位置的数(或中间两个数的________)叫做这组数据的中位数.
次数
中间 
平均数
 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
分别求出这17名运动员的成绩的众数、中位数与平均数.
[分析] 理解众数、中位数和平均数的定义,利用定义解决问题.
例1
成绩 (单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
[解] 在这17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.题表中的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数是×(1.50×2+1.60×3+1.65×2+1.70×3+1.75×
4+1.80×1+1.85×1+1.90×1)=≈1.69.
故这17名运动员的成绩的众数、中位数、平均数依次为1.75 m,1.70 m,
1.69 m.

平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算中位数时,可先将这组数据按从小到大(或从大到小)的顺序排列,再根据相关数据的总数是奇数还是偶数而定;众数是看出现次数最多的数.
思维提升
1.在某知识竞赛中,共设有10道题目,每题1分,经统计,10位选手的得分情况如下表:
跟踪训练
B
则这10位选手得分的中位数和众数分别为(  )
A.9,8          B.8,8
C.9,8.5 D.8.5,9
得分(X) 6 7 8 9 10
人数 1 2 4 2 1
将这10位选手的得分从小到大排列,6,7,7,8,8,8,8,9,9,10,可知第5个和第6个得分,分别为8,8,所以中位数为=8,且8出现的次数最多,故众数为8.
2.(多选)PM2.5是衡量空气质量的重要指标.如图是某地9月1日到10日的PM2.5日均值(单位:μg/m3)的折线图,则下列说法正确的是(  )
A.这10天中PM2.5日均值的众数为33
B.这10天中PM2.5日均值的中位数是32
C.这10天中PM2.5日均值的中位数大
于平均数
D.这10天中PM2.5日均值前4天的平
均数大于后4天的平均数
AB
由题中折线图得,这10天中PM2.5日均值的
众数为33,中位数为=32,平均数为×(36+26+17+23+33+128+42+31+30+33)=
39.9,中位数小于平均数,故A,B正确,C错误;
前4天的平均数为=25.5,后4天的平均数为=34,故D错误.
 某校举行演讲比赛,10位评委对两位选手的评分如下:
甲 7.5 7.5 7.8 7.8 8.0 8.0 8.2 8.3 8.4 9.9
乙 7.5 7.8 7.8 7.8 8.0 8.0 8.3 8.3 8.5 8.5
选手的最终得分为去掉一个最低分和一个最高分之后,剩下8个评分的平均数,那么,这两位选手的最后得分是多少 若直接用10位评委评分的平均数作为选手的得分,两位选手的排名有变化吗 你认为哪种评分办法更好 为什么
[分析] 首先计算两位选手的平均分,然后作出判断.
例2
[解] 甲选手的最后得分为×(7.5+7.8+7.8+8.0+8.0+8.2+8.3+8.4)=8.
乙选手的最后得分为×(7.8+7.8+7.8+8.0+8.0+8.3+8.3+8.5)=8.062 5.
若直接用10位评委评分的平均数作为选手的得分,
则甲选手的得分为×(7.5+7.5+7.8+7.8+8.0+8.0+8.2+8.3+8.4+9.9)=8.14,
乙选手的得分为×(7.5+7.8+7.8+7.8+8.0+8.0+8.3+8.3+8.5+8.5)=8.05.
去掉最高分与最低分时,甲的得分低于乙的得分,即乙的排名靠前;若直接用10位评委评分的平均数作为得分,则甲的得分高于乙的得分,即甲的排名靠前.两种评分下,甲、乙两位选手的排名变化大,去掉一个最低分和一个最高分之后,剩下8个评分的平均数作为选手的最后得分更好,这是因为平均数对样本数据的极端值比较“敏感”.
众数、中位数、平均数的意义
1.样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
2.当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大或较小时,可用中位数描述其集中趋势.
思维提升
3.某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄(单位:岁)如下:
甲群 13,13,14,15,15,15,15,16,17,17;
乙群 54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁 其中哪个统计量能较好地反映甲群市民的年龄特征
跟踪训练
解:(1)甲群市民年龄的平均数为
=15(岁),中位数为15岁,众数为15岁,平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数、中位数和众数各是多少岁 其中哪个统计量能较好地反映乙群市民的年龄特征
解: (2)乙群市民年龄的平均数为
=15(岁),中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
1.平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边______________与小矩形的______的乘积之和近似代替.
2.中位数:在频率分布直方图中,中位数左边和右边的直方图的______应该相等.
3.众数:众数是最____小矩形底边的____________所对应的数据.
中点的横坐标 
面积
面积

中点的横坐标
 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.

(1)求这次测试数学成绩的众数;
[分析] 利用频率分布直方图中中位数,平均数的公式解决问题.
例3
[解] (1)在频率分布直方图中,高度最高的小矩形的中间值的横坐标即为众数.由频率分布直方图知,这次测试数学成绩的众数为75.
(2)求这次测试数学成绩的中位数;
[分析] 利用频率分布直方图中中位数,平均数的公式解决问题.
[解] (2)∵前三个小矩形的面积和为(0.005+0.015+0.020)×10=0.4,第四个小矩形的面积为0.030×10=0.3,0.4+0.3=0.7>0.5,
∴中位数应位于第四个小矩形中.
设中位数为x,
则0.03(x-70)=0.1,解得x=73,
故成绩的中位数为73.
(3)求这次测试数学成绩的平均数.
[分析] 利用频率分布直方图中中位数,平均数的公式解决问题.
[解] (3)平均数为45×(0.005×10)+55×(0.015×10)+65×(0.020×10)+75×(0.030×10)+85×(0.025×10)+95×(0.005×10)=72.
1.利用频率分布直方图估计数字特征:
(1)众数是最高的矩形的底边中点的横坐标;
(2)中位数左右两侧直方图的面积和相等;
(3)平均数等于每个小矩形的面积乘小矩形底边中点的横坐标之和.
2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.
思维提升
4.某校组织高中学生参加航天知识竞赛,现从中随机抽取100名学生成绩的频率分布直方图如图所示,设这组样本数据的75%分位数为x,众数为y,则(  )
A.x=88,y=90      
B.x=83,y=90
C.x=83,y=85
D.x=88,y=85
跟踪训练
D
由题意得(0.005+0.03+a+0.015)×10=1,解得a=0.05,
因为0.05+0.3=0.35,0.05+0.3+0.5=0.85,则0.35<0.75<0.85,
则样本数据的75%分位数位于[80,90),
则0.35+(x-80)×0.05=0.75,解得x=88,
因为样本数据中位于成绩[80,90)之间最
多,则众数为y==85.
5.(多选)某公司为了解用户对其产品的满意度,从甲、乙两地区分别随机调查了100个用户,根据用户对产品的满意度评分,分别得到甲地区和乙地区用户满意度评分的频率分布直方图,如图所示.若甲地区和乙地区用户满意度评分的中位数分别为m1,m2,平均数分别为s1,s2,则下面正确的是(  )
A.m1>m2
B.m1C.s1D.s1>s2
BC
由题中频率分布直方图得,甲地区[40,60)的频率为(0.015+0.020)×10=0.35,[60,70)的频率为0.025×10
=0.25,所以甲地区用户满意度评分的中位数
m1=60+×10=66,甲地区的平均数s1=45×0.015×10+55×0.020×10+65×0.025×10+
75×0.020×10+85×0.010×10+95×0.010×10=67;
乙地区[50,70)的频率为(0.005+0.020)×10=0.25,
[70,80)的频率为0.035×10=0.35,所以乙地区用户满意
度评分的中位数m2=70+×10≈77.1,乙地区的平均数s2=55×0.005×10+65×0.020×10+75×0.035×10+85×0.025×10+95×0.015×10=77.5,所以m1〈感谢聆听〉(共40张PPT)
9.2 用样本估计总体
9.2.4 总体离散程度的估计

[学习目标] 
1.结合实例,能用样本估计总体的离散程度参数. 
2.理解样本数据的方差与标准差的意义和作用,会计算样本数据的方差与标准差,并给出合理的解释.
1.假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,
则称(xi-)2或为这组数据的方差,称为这组数据的标准差.
2.如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,
则称S2=(Yi-)2为总体方差,S= 为总体标准差.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=fi(Yi-)2.
3.如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,
则称s2=(yi-)2为样本方差,s=为样本标准差.
4.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度________;标准差越小,数据的离散程度________.
越大 
越小
 为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,从两厂各随机选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:

(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值.
[分析] 利用平均数、方差的公式解决问题,再将平均数与方差结合作出决策.
例1
[解] (1)甲厂10个轮胎宽度的平均值:
×(195+194+196+193+194+197+196+195+193+197)=195(mm).
乙厂10个轮胎宽度的平均值:
×(195+196+193+192+195+194+195+192+195+193)=194(mm).
(2)若轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个生产的轮胎相对更好.
[分析] 利用平均数、方差的公式解决问题,再将平均数与方差结合作出决策.
[解] (2)甲厂10个轮胎中宽度在[194,196]内的数据为195,194,196,194,196,195,平均数:×(195+194+196+194+196+195)=195,
方差:×[(195-195)2+(194-195)2+(196-195)2+(194-195)2+(196-195)2+(195-195)2]=.
乙厂10个轮胎中宽度在[194,196]内的数据为195,196,195,194,195,195,
平均数:×(195+196+195+194+195+195)=195,
方差:×[(195-195)2+(196-195)2+(195-195)2+(194-195)2+(195-195)2+(195-195)2]=.
∵两厂标准轮胎宽度的平均数
相等,但乙厂的方差更小,
∴乙厂生产的轮胎相对更好.

实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,离散程度越小,数据越集中,越稳定.
思维提升
1.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
跟踪训练
(1)分别求出甲、乙两名自行车赛手最大速度的平均数和方差;
甲 27 38 30 37 35 31
乙 33 29 38 34 28 36
解:(1)甲的平均数×(27+38+30+37+35+31)=33.
乙的平均数×(33+29+38+34+28+36)=33.
甲的方差×[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]=.
乙的方差×[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]=.
(2)比较两个人的成绩,你认为选谁参加比赛比较合适.
解: (2)由(1)知甲和乙的平均数相等,因为,
所以乙更稳定,乙参加比赛比较合适.
有两组数据x1,x2,x3,…,xn和ax1+b,ax2+b,ax3+b,…,axn+b,它们的平均数分别是,,方差分别是S2,S'2,则+b,S'2=a2S2.
 若样本x1+1,x2+1,…,xn+1的平均数为10,其方差为2,则对于样本2x1+2,2x2+2,…,2xn+2的下列结论正确的是(  )
A.平均数为20,方差为8
B.平均数为20,方差为10
C.平均数为21,方差为8
D.平均数为21,方差为10
[分析] 利用公式解决问题.
例2
A
若样本x1+1,x2+1,…,xn+1的平均数为10,其方差为2,则对于样本2x1+2,2x2+2,…,2xn+2,其平均数=2×10=20,方差s2=22×2=8.
数据x1,x2,…,xn的平均数、标准差和方差分别为,s和s2,若数据y1,y2,…,yn与x1,x2,…,xn之间满足关系式yi=axi+b(i=1,2,…,n),那么数据y1,y2,…,yn的平均数为a+b,方差为a2s2,标准差为|a|s.
注意:在上述条件下,若yi=xi±b(i=1,2,…,n),则y1,y2,…,yn的平均数和方差分别为±b和s2;若yi=kxi(i=1,2,…,n),则y1,y2,…,yn的平均数和方差分别为k和k2s2.
思维提升
2.已知数据x1,x2,…,xn的方差为s2,数据ax1-1,ax2-1,…,axn-1的方差为4s2.则a=(  )
A.1            B.2
C.±2 D.-2
跟踪训练
C
已知样本数据x1,x2,…,xn的平均数为,方差为s2,
记数据ax1+b,ax2+b,…,axn+b的平均数为',方差为s'2,

=+b,
s'2==a2s2,
故ax1-1,ax2-1,…,axn-1的方差为a2s2,所以a2=4,则a=±2.
3.(多选)第一组样本数据x1,x2,…,xn,第二组样本数据y1,y2,…,yn,其中yi=2xi-1(i=1,2,…,n),则(  )
A.第二组样本数据的样本平均数是第一组样本数据的样本平均数的2倍
B.第二组样本数据的中位数是第一组样本数据的中位数的2倍
C.第二组样本数据的样本标准差是第一组样本数据的样本标准差的2倍
D.第二组样本数据的样本极差是第一组样本数据的样本极差的2倍
CD
设样本数据x1,x2,…,xn的样本平均数为,样本中位数为m,样本标准差为s,极差为xmax-xmin,
对于A,C选项:由yi=2xi-1,样本数据y1,y2,…,yn的样本平均数为2-1,故A错误;
样本数据y1,y2,…,yn的样本方差为a2s2=4s2,所以第二组数据的样本标准差为2s,故C正确;
对于B选项:根据中位数的概念可知,样本数据y1,y2,…,yn的中位数为2m-1,故B错误;
对于D选项:根据极差的概念可知, 样本数据y1,y2,…,yn的极差为ymax-ymin=(2xmax-1)-(2xmin-1)=2(xmax-xmin),故D正确.
设样本中不同层的平均数分别为,,…,,方差分别为,,…,,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=wi[+()2](为样本的平均数).
 某校有高一学生1 000人,其中男女生比例为3∶2,为获得该校高一学生的身高(单位:cm)信息,采用分层随机抽样方法抽取了样本量为50的样本,其中男女生样本量均为25,计算得到男生样本的平均数为172,标准差为3,女生样本的平均数为162,标准差为4.
(1)计算总样本平均数,并估计该校高一全体学生的平均身高;
例3
[解] (1)把男生样本记为x1,x2,…,x25,平均数记为=172,方差记为=9;
把女生样本记为y1,y2,…,y25,平均数记为=162,方差记为=16;
把总样本平均数记为,方差记为s2;高一全体学生身高的平均数记为.
根据平均数的定义,总样本平均数为(yj)==167;
估计高一全体学生身高的平均数为=168.
(2)计算总样本方差.
[解] (2)根据方差的定义,总样本方差为
s2=[(xi-)2+(yj-)2]=[(xi-)2+(yj-)2],
由(xi-)==0,可得2(xi-)()=0,
同理,2(yj-)()=0.
因此,s2=[(xi-)2+()2+(yj-)2+()2]
=[25+25()2+25+25()2]
=×[25×9+25×(172-167)2+25×16+25×(162-167)2]=37.5.
所以总样本方差为37.5.
计算分层随机抽样的方差s2的步骤
1.确定,,,.
2.确定.
3.应用公式s2=[+()2]+[+()2],计算s2.
思维提升
4.(多选)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这100名学生中,成绩位于[80,90)内的学生成绩方差为12,成绩位于[90,100)内的学生成绩方差为10.则(   )
参考公式:样本划分为2层,各层的容量、平均数和方差分别为:m,,;n,,,样本方差为
s2,s2=[]+[].
A.a=0.004
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
跟踪训练
BCD
对于A选项,在频率分布直方图中,所有直方图的面积之
和为1,则(2a+3a+7a+6a+2a)×10=200a=1,解得a=0.005,
A错;对于B选项,前两个矩形的面积之和为(2a+3a)×10=
50a=0.25<0.5,前三个矩形的面积之和为(2a+3a+7a)×10=
120a=0.6>0.5,设计该年级学生成绩的中位数为m,则m∈[70,80),根据中位数的定义可得0.25+(m-70)×0.035=0.5,解得m≈77.14,所以,估计该年级学生成绩的中位数约为77.14,B对;对于C选项,估计成绩在80分及以上的同学的成绩的平均数为×95=87.5分,C对;对于D选项,估计该年级成绩在80分及以上的学生成绩的方差为[12+(87.5-85)2]+[10+(87.5-95)2]=30.25,D对.
〈课堂达标·素养提升〉
1.已知一个样本由三个4,三个6和四个5组成,则这个样本的标准差s=(  )
A.
C.
C
由已知样本的平均数=5,
则方差s2=,则标准差s=.
2.某人在“全球购”平台上购买了n件商品,这些商品的价格如果按美元计算,则平均数为A,标准差为s,如果按人民币计算(汇率按1美元=7元人民币),则平均数和方差分别为(  )
A.A,s2 B.7A,21s2
C.7A,14s2 D.7A,49s2
D
由题意知这些商品的价格如果按人民币计算,价格是按美元计算的价格的7倍,故按人民币计算,则平均数和方差分别为7A,72×s2=49s2.
3.某次知识竞赛共有12人参赛,比赛分为红、黄两队,每队由六人组成.其中红队6人答对题目的平均数为3,方差为5,黄队6人答对题目的平均数为5,方差为3,则参加比赛的12人答对题目的方差为(  )
A.5 B.4.5
C.3.5 D.18
A
由题意,这12个人的平均答对题目的个数为(6×3+6×5)=4,
则新数据的方差为s2=[5+(3-4)2]+[3+(5-4)2]=5.
4.张华和李明两名同学参加数学竞赛的预选赛,他们分别同时进行了5次模拟测试,测试成绩如表(单位:分):
张华
张华 100 80 90 90 90
李明 100 100 70 90 90
如果希望在张华、李明两人中选发挥比较稳定的1人入选,则入选的人应是     .
张华成绩的平均分为=90,
方差为=40,李明成绩的平均分为=90,
方差为=120,因为,所以张华、李明两人中发挥比较稳定的是张华,故入选的人应是张华.
感谢观看

展开更多......

收起↑

资源列表