人教A版(2019)> 必修 第二册> 第九章 统计> 9.2 用样本估计总体

资源下载
  1. 二一教育资源

人教A版(2019)> 必修 第二册> 第九章 统计> 9.2 用样本估计总体

资源简介

(共41张PPT)
9. 2.1 总体取值规律的估计
 
学习目标
1.掌握频率分布表的作法以及频率分布直方图的画法. 
2.掌握用频率分布直方图估计总体.
3.在问题情境中会用不同的统计图分析样本数据. 
4.能从统计图表中获取有价值的信息,估计总体分布的规律,培养直观想象及数据分析核心素养.
问题导思
假如通过抽样调查,获得100位居民的月均用水量数据如下(单位:t):
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
问题1.上述100个数据中的最大值和最小值分别是多少?由此说明样本数据的变化范围是什么?
提示:最大值是28.0 t,最小值是1.3 t,样本数据的变化范围为26.7 t.
问题2.样本数据中的最大值和最小值的差称为极差,如果将上述100个数据按组距为3进行分组,那么这些数据共分为多少组?
提示:26.7÷3=8.9.因此可以将数据分为9组.
问题3.以组距为3进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?
提示:[1.2,4.2),[4.2,7.2),…,[25.2,28.2].
新知构建
1.总体取值规律的估计
常选择频率分布表和__________________来整理和表示数据,进而估计总体的分布规律.
频率分布直方图
2.频率分布直方图的画法
最大值与最小值
不小于k的最小整数
左闭右开
分组
频数累计
频数
频率
合计
样本量
各小长方形
的面积
微提醒
频率分布直方图的纵轴表示 ,频数分布直方图的纵轴表示频数.
例1
从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表(含累积频率);
解:频率分布表如下:
成绩分组 频数 频率 累积频率
[40,50) 2 0.04 0.04
[50,60) 3 0.06 0.1
[60,70) 10 0.2 0.3
[70,80) 15 0.3 0.6
[80,90) 12 0.24 0.84
[90,100] 8 0.16 1.00
合计 50 1.00
(2)画出频率分布直方图;
解:频率分布直方图如图所示.
(3)估计成绩在[60,90)分的学生比例.
解:学生成绩在[60,90)分的频率为0.2+0.3+0.24=0.74=74%,所以估计成绩在[60,90)分的学生比例为74%.
规律方法
1.在列频率分布表时,极差、组距、组数的关系
规律方法
2.绘制频率分布直方图的注意点
(1)各组频率的和等于1,因此,各小矩形的面积的和也等于1;  
(2)横轴表示样本数据,纵轴表示 ,这样每一组的频率可以用该组的组距为底、 为高的小矩形的面积表示;
(3)画频率分布直方图的关键是确定矩形的高,一般地,频率分布直方图中两坐标轴上的单位长度不一致.
对点练1.为了了解学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):
分组 [147.5,155.5) [155.5,163.5) [163.5,171.5) [171.5,179.5]
频数 6 21 27 m
频率 a 0.1
(1)求出表中a,m的值;
(2)画出频率分布直方图.
分组 [147.5,155.5) [155.5,163.5) [163.5,171.5) [171.5,179.5]
频数 6 21 27 m
频率 a 0.1
返回
例2
应用一 频率分布直方图的应用
 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
解:频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,
(2)若次数在110以上(含110次)为达标,则该校高一年级全体学生的达标率约是多少?
规律方法
1.频率分布直方图的性质
(1)因为小矩形的面积=组距× =频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小;
(2) =样本容量.
2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.  
对点练2.为了解学生的周末学习时间(单位:
小时),高一年级某班班主任对本班40名学
生某周末的学习时间进行了调查,将所得数
据整理绘制出如图所示的频率分布直方图,
根据直方图所提供的信息:
(1)求出图中a的值;
解:因为频率分布直方图中,小矩形面积和为1,
所以(0.015+a+0.030+0.040+0.045+0.050)×5=1,解得a=0.020.
(2)求该班学生这个周末的学习时间不少于20小时的人数;
解:由图可知,该班学生周末的学习时间不少于20小时的频率为(0.03+0.015)×5=0.225,
则40名学生中周末的学习时间不少于20小时的人数为40×0.225=9.
(3)如果用该班学生周末的学习时间作为样本去推断该校高一年级全体学生周末的学习时间,这样推断是否合理?说明理由.
解:不合理,样本的选取只选在高一某班,不具有代表性.
应用二 其他统计图表及应用
角度1 扇形图及其应用
某公司2024年在各个项目中总投资500万元,如图是几类项目的投资占比情况,已知在1万元以上的项目投资中,少于3万元的项目投资占 ,那么不少于3万元的项目投资共有
A.56万元
B.65万元
C.91万元
D.147万元
例3

规律方法
扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.  
角度2 条形统计图及其应用
为了丰富校园文化生活,某校计划在午间校园广播台播放“百家讲坛”的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查(每人只选一项内容),整理调查结果,绘制统计图如图所示.
例4
请根据统计图提供的信息回答以下问题:
(1)求抽取的学生数;
解:从统计图上可以看出,抽取的学生数为20+10+30+15+30+38+64+42+6+45=300(人).
(2)若该校有3 000名学生,估计喜欢收听易中天《品三国》的学生人数;
(3)估计该校喜欢收听刘心武评《红楼梦》的
女学生人数约占全校学生人数的百分比.
解:该校喜欢收听刘心武评《红楼梦》的女
学生人数约占全校学生人数的比例为 ×
100%=15%.
规律方法
条形图是一种以矩形的长度为变量的统计图,通常用横轴(横轴上的数字)表示样本类别(样本值),用纵轴上的单位长度表示一定的数量.条形图主要用来比较两个或两个以上类别(只有一个变量)的样本,通常用于较小的数据分析.  
角度3 折线统计图及其应用
(多选)PM2.5是空气质量的一个重要指标,我国PM2.5标准采用世卫组织设定的最宽限值,即PM2.5日均值在35 μg/m3以下时空气质量为一级,在35 μg/m3~75 μg/m3时空气质量为二级,在75 μg/m3以上时空气质量为超标.如图是某地11月1日到10日PM2.5日均值(单位:μg/m3)的统计数据,则下列叙述正确的是
A.这10天中有4天空气质量为一级
B.这10天中PM2.5日均值最高的是11月5日
C.从5日到9日,PM2.5日均值逐渐降低
D.这10天的PM2.5日均值最低的是11月4日
例5



由图表可知,选项A,B,C正确;对于选项D,这10天的PM2.5日均值最低是11月9日,故D错误.故选ABC.
规律方法
1.绘制折线统计图的步骤
第一步,确定横轴、纵轴表示的意义;
第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;
第三步,用直线段顺次连接即可.
2.在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.  
对点练3.(1)某校在一个学期的开支如图①所示,在该学期的水、电、交通开支(单位:万元)如图②所示,则该学期的水、电开支占总开支的百分比为
A.12.25% B.16.25%
C.11.25% D.9.25%

(2)(多选)企业的核心竞争力需要大量研发投入和研发活动作为支撑.研发营收比是指企业的研发投入与营业收入的比值,是一个企业研发投入情况的一项重要指标,如图是某公司2018年到2024年的研发投入和研发营收比的情况,则下列结论正确的是
A.该公司的研发投入逐年增加
B.该公司2024年的营业收入超过550亿元
C.2021年该公司的研发营收比最大
D.2021年该公司的营业收入达到最大值


返回
课堂小结
知识 (1)频率分布直方图.
(2)扇形图、条形图和折线图的应用.
方法 图形识别、数据分析.
易错 误区 (1)频率分布直方图中小矩形的高以及小矩形的面积代表的意义理解不清.
(2)对表格中数据代表的意义理解不清.
随堂演练
1.某地区为了解学生课余时间的读书情况,随机抽取了n名学生进行调查,根据调查得到的学生日均课余读书时间绘制成如图所示的频率分布直方图,已知抽取的样本中日均课余读书时间低于10分钟的有10人,则n,p的值分别为
A.200,0.015
B.100,0.010
C.100,0.015
D.1 000,0.010

利用频率之和为1可得,p×10=1-(0.018+0.022+0.025+0.020+0.005)×10=0.1,解得p=0.010,根据频率、频数、样本容量之间的关系可得, =0.1,解得n=100.故选B.
2.(多选)我国第七次人口普查的数据于
2021年公布,将我国历次人口普查的调
查数据整理后得到如图所示的折线图,
则下列说法正确的是
A.从人口普查结果来看,我国人口总
量处于递增状态
B.2000~2020年年均增长率都低于1.5%
C.历次人口普查的年均增长率逐年递减
D.第三次(1982年)人口普查时,人口年均增长率达到历史最高点



由折线统计图可得,所有的增长率均
为正数,所以从人口普查结果来看,
我国人口总量处于递增状态,故A正
确;2000~2020年年均增长率都低于
1.5%,其中2000年最高,增长率为
1.07%,故B正确;历次人口普查中,
年均增长率在1964~1982年是逐年递增,1982~2020年是逐年递减,故C错误;第三次(1982年)人口普查时,人口年均增长率达到历史最高点,故D正确;故选ABD.
3.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形的面积是其余4个小长方形面积之和的 ,且中间一组的频数为10,则样本量是________.
40
4.如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3 000人,根据统计图计算该校学生共捐款________元.
37 770
根据统计图,得高一人数为3 000×32%=960,捐款960×15=14 400(元);高二人数为3 000×33%=990,捐款990×13=12 870(元);高三人数为3 000×35%=1 050,捐款1 050×10=10 500(元).所以该校学生共捐款14 400+12 870+10 500=37 770(元).
返回
感谢观看(共31张PPT)
9.2.2 总体百分位数的估计
 
第九章 9.2 用样本估计总体
学习目标
1.结合实例,能用样本估计百分位数. 
2.理解百分位数的统计含义,培养数据分析核心素养.
问题导思
问题1.“全班有25%的人数学成绩低于83分”这句话是什么意思?
提示:这句话的意思是全班数学成绩小于83分的人数不少于全班人数的25%,大于或等于83分的人数不少于1-25%=75%.
新知构建
1.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有______的数据_____________这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按__________排列原始数据.
第2步,计算i=________.
第3步,若____不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的_________.
p%
小于或等于
从小到大
n×p%
i
平均数
3.四分位数
25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为__________,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.
四分位数
微提醒
中位数是第50百分位数.
例1
  (多选)下列表述正确的是
A.50%分位数就是总体的中位数
B.第p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确



一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,故C错误,ABD均正确.
规律方法
分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心位置.百分位数提供了有关数据项如何在最小值与最大值之间分布的信息.
根据第p百分位数的定义可知B正确.故选B.

对点练1.15%分位数的含义是
A.总体中任何一个数小于它的可能性是15%
B.总体中任何一个数小于或等于它的可能性是15%
C.总体中任何一个数大于它的可能性是15%
D.总体中任何一个数大于或等于它的可能性是15%
返回
例2
应用一 由样本数据求百分位数
考察某校高二年级男生的身高,随机抽取40名高二男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160
168 165 171 169 167 169 151 168
170 160 168 174 165 168 174 159
167 156 157 164 169 180 176 157
162 161 158 164 163 163 167 161
请估计该校高二年级男生身高的第25,50,75百分位数.
解:把这40名男生的身高数据按从小到大排序,可得
151 156 157 157 158 159 160 160
161 161 162 163 163 163 163 164
164 165 165 166 166 167 167 167
168 168 168 168 168 168 169 169
169 170 171 171 174 174 176 180
规律方法
总体百分位数估计需要注意的两个问题
1.总体百分位数估计的基础是样本百分位数的计算,因此计算准确是关键.  
2.由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.
对点练2.某良种培育基地正在培育一种小麦新品种A,将其种植了25亩,所得亩产数据(单位:千克)如下:
421,399,445,359,415,443,367,454,368,
375,392,400,423,405,412,427,414,423,
430,388,430,357,434,445,451
试估计该品种小麦亩产的第80,95百分位数.
解:将25个样本数据按从小到大排序,可得
357,359,367,368,375,388,392,399,400,
405,412,414,415,421,423,423,427,430,
430,434,443,445,445,451,454
由80%×25=20,95%×25=23.75,可知样本数据的第80百分位数为
=438.5,第95百分位数为第24项数据,为451.据此估计该品种小麦亩产的第80,95百分位数分别约为438.5和451.
应用二 由频数(频率)分布表求百分位数
 某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层随机抽样方法(按A类、B类分两层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).
(1)从A类工人中和B类工人中各应抽查多少人?
例3
(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.
表1
表2
先确定x,y的值,再分别计算A类工人和B类工人生产能力的样本数据的60%分位数(保留两位小数).
生产能力分组 [100,110) [110,120) [120,130) [130,140) [140,150]
人数 4 8 x 5 3
生产能力分组 [110,120) [120,130) [130,140) [140,150]
人数 6 y 36 18
解:由题意知4+8+x+5+3=25,得x=5,
6+y+36+18=75,得y=15.
A类工人生产能力频率分布表为
生产能力分组 [100,110) [110,120) [120,130) [130,140) [140,150]
频率 0.16 0.32 0.20 0.20 0.12
由频率分布表可知,A类工人生产能力在120以下的所占比例为16%+32%=48%,
A类工人生产能力在130以下的所占比例为48%+20%=68%.
因此,60%分位数一定位于[120,130)内.
故可以估计A类工人生产能力的样本数据的60%分位数为126.
B类工人生产能力频率分布表为
由频率分布表可知,B类工人生产能力在130以下的所占比例为8%+20%=28%,
B类工人生产能力在140以下的所占比例为28%+48%=76%.
因此,60%分位数一定位于[130,140)内.
故可以估计B类工人生产能力的样本数据的60%分位数约为136.67.
生产能力分组 [110,120) [120,130) [130,140) [140,150]
频率 0.08 0.20 0.48 0.24
规律方法
由频率(频数)分布表求百分位数的方法
1.确定p%分位数所在区间[a,b)(并计算小于a的所有数据的频率fa和小于b的所有数据的频率fb),即p%∈(fa,fb).
2.计算p%分位数为 (其中b-a为组距,fb-fa为数据落在[a,b)内的频率).  
对点练3.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:
排号 分组 频数 频率
1 [0,2) 6 0.06
2 [2,4) 8 0.08
3 [4,6) 17 b
4 [6,8) 22 0.22
5 [8,10) 25 0.25
6 [10,12) 12 0.12
7 [12,14) a 0.06
8 [14,16) 2 0.02
9 [16,18] 2 0.02
合计 100 1
(1)求频率分布表中a,b的值;
(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68小时.
解:阅读时间小于6小时的所占比例是0.06+0.08+0.17=0.31,
阅读时间小于8小时的所占比例是0.06+0.08+0.17+0.22=0.53,
所以50%分位数在[6,8)内,
因为7.73>7.68,
所以估计有50%的学生的阅读时间达到7.68小时.
例4
应用三 由频率分布直方图求百分位数
 某市为了了解人们对“中国梦”的伟大
构想的认知程度,对不同年龄和不同职业的人
举办了一次“一带一路”知识竞赛,满分100
分(90分及以上为认知程度高),现从参赛者中
抽取了x人,按年龄分成5组(第一组:[20,25),
第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人.
(1)求x;
(2)求抽取的x人的年龄的50%分位数(结果保留整数);
解:由题图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的x人的年龄的50%分位数在[30,35)内,由30+5×
,所以抽取的x人的年龄的50%分位数为32.
(3)以下是参赛的10人的成绩:90,96,97,95,
92,92,98,88,96,99,求这10人成绩的20%
分位数和平均数,以这两个数据为依据,评价参
赛人员对“一带一路”的认知程度.
解:把参赛的10人的成绩按从小到大的顺序排列:
88,90,92,92,95,96,96,97,98,99,
评价:从第20百分位数和平均数来看,参赛人员的认知程度很高.
规律方法
由频率分布直方图求百分位数的思路
1.频率分布直方图中p%分位数表示左侧小矩形的面积之和等于p%的分点值.
2.由频率分布直方图求百分位数的方法与由频率分布表求百分位数的方法相同.
3.根据一组数据的直方图来估计这组数据的p%分位数时,直方图的分组越多,组距越小,样本数据的信息损失越少,估计效果越好.  
对点练4.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位: cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?
解:由题意知分别落在各区间上的频数:
在[80,90)上为60×0.15=9,
在[90,100)上为60×0.25=15,
在[100,110)上为60×0.3=18,
在[110,120)上为60×0.2=12,
在[120,130]上为60×0.1=6.
从以上数据可知第50百分位数一定落在区间[100,110)上,
第75百分位数一定落在区间[110,120)上,
综上可知,估计第50百分位数和第75百分位数分别为103.3 cm,112.5 cm.
返回
课堂小结
知识 (1)第p百分位数.
(2)四分位数.
(3)用数据、表格、直方图求百分位数.
方法 数据分析、数形结合.
易错误区 求第p百分位数时,应先将数据从小到大排列.
感谢观看(共22张PPT)
9.2.3 总体集中趋势的估计
 
第九章 9.2 用样本估计总体
学习目标
1.会求样本数据的众数、中位数、平均数. 
2.理解用样本的数字特征、频率分布直方图估计总体的集中趋势,培养数据分析核心素养.
问题导思
问题1.在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势,那么什么是众数、中位数呢?
提示:众数就是在一组数中出现次数最多的数;中位数就是将一组数按照从小到大的顺序排列,位于中间位置的数,如果中间位置有两个,则为这两个数的平均数.
新知构建
众数、中位数和平均数的含义及体现
特征量 含义 在频率分布直方图中的体现
众数 出现次数______的数据 取最高的小长方形底边中点的_________
中位数 将数据按从大到小或从小到大的顺序依次排列,处在_________位置的一个数据(或最中间两个数据的_________) 把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标
平均数 样本数据的算术平均数 每个小长方形的面积乘以小长方形底边中点的横坐标之和
最多
横坐标
最中间
平均数
微提醒
一组数据的平均数、中位数都是唯一的;而众数不一定唯一,可以有一个,也可以有多个.
例1
在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
分别求出这些运动员成绩的众数、中位数与平均数.
成绩(单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
规律方法
平均数、中位数、众数的计算方法
平均数一般是根据公式来计算的;计算中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据相关数据的总数是奇数还是偶数而定;众数是看出现次数最多的数.  

对点练1.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
返回
综合应用
例2
应用一 总体集中趋势的估计
 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群 13,13,14,15,15,15,15,16,17,17;
乙群 54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
规律方法
众数、中位数、平均数的意义
1.样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
2.当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.  
对点练2.某公司为了了解一年内的用水情况,抽取了10天的用水量如表所示:
(1)在这10天中,该公司用水量的平均数是多少?每天用水量的中位数是多少?
用水量/t 22 38 40 41 44 50 95
天数 1 1 1 2 2 1 2
(2)你认为应该用平均数和中位数中的哪一个来描述该公司每天的用水量更合适?
用水量/t 22 38 40 41 44 50 95
天数 1 1 1 2 2 1 2
解:平均数受数据中的极端值(2个95)影响较大,使平均数在估计总体时可靠性降低,10天的用水量有8天都在平均值以下,故用中位数描述每天的用水量更合适.
例3
应用二 利用频率分布直方图估计总体的集中趋势
 某校从参加高一年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数.
解:由题图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03×(x-70),所以x≈73.3,即这80名学生的数学成绩的中位数为73.3分.
变式探究
1.(变设问)若本例的条件不变,求这次测试数学成绩的平均数.
2.(变设问)若本例条件不变,求样本中80分以下的学生人数.
解:分数在[40,80)内的频率为:(0.005+0.015+0.020+0.030)×10=0.7,所以样本中80分以下的学生人数为80×0.7=56.
规律方法
用频率分布直方图估计众数、中位数、平均数
1.众数:取最高小长方形底边中点的横坐标作为众数.
2.中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
3.平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.  
对点练3.(多选)随着生活水平的不断提高,我国居民的平均身高也在增长.某市为了调查本市小学一年级的男生身高情况,从某小学一年级随机抽取了100名男同学进行身高测量,得到频率分布直方图(如图),其中右侧三组小长方形面积满足2S2=S1+S3.则下列说法正确的是
A.身高在[130,140)范围内的频率为0.18
B.身高的众数的估计值为115 cm
C.身高的中位数的估计值为125 cm
D.身高的平均数的估计值为121.8 cm



因为前三组的频率分别为0.04,0.08,0.34,所以后三
组的频率和为1-(0.04+0.08+0.34)=0.54.因为右侧
三组小长方形面积满足2S2=S1+S3,设[130,140)的
频率为x,所以3x=0.54,可得x=0.18,而[140,150]
的频率为0.06,则[120,130)的频率为0.3,故A正确;
由直方图知:频率最高的区间为[110,120),所以身高的众数的估计值为115 cm,故B正确;设中位数为a,因为前三组的频率和为0.46,第四组的频率为0.3,所以中位数a在区间[120,130)内,由0.46+(a-120)×0.03=0.5得a=120+ ≈121.3 cm,故C错误;由题意:身高的平均数为95×0.04+105×0.08+115×0.34+125×0.3+135×0.18+145×0.06=121.8 cm,故D正确.故选ABD.
返回
课堂小结
知识 (1)中位数、众数、平均数的计算.
(2)频率分布直方图中的中位数、众数、平均数.
方法 数据分析统计.
易错误区 求中位数时需先把一组数据按从小到大(或从大到小)的顺序排列,再找中间位置的数或中间两数的平均数.
感谢观看(共25张PPT)
9.2.4 总体离散程度的估计
 
第九章 9.2 用样本估计总体
学习目标
1.理解方差、标准差的含义,会计算方差和标准差. 
2.掌握求分层随机抽样总样本的平均数及方差的方法,培养数学运算及数据分析核心素养.
问题导思
问题1.有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6  7  7
如果你是教练,你应当如何对两位运动员的射击情况作出评价?
提示:通过甲、乙两人射击的平均成绩及方差或标准差的大小进行综合评价.
新知构建
1.总体方差和标准差
(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,
YN,总体平均数为 ,则称S2=______________为总体方差,S=___为总体标准差.
(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则
总体方差为S2=_______________.
2.样本方差和标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为 ,
则称s2=_____________为样本方差,s=___为样本标准差.
3.标准差的意义
标准差刻画了数据的__________或__________,标准差越大,数据的离散程度越___;标准差越小,数据的离散程度越___.
离散程度
波动幅度


微提醒
例1
某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩(单位:分)如下:
甲组 60,90,85,75,65,70,80,90,95,80;
乙组 85,95,75,70,85,80,85,65,90,85.
(1)试分别计算两组数据的极差、方差和标准差;
解:甲组:最高分为95,最低分为60,极差为95-60=35,
乙组:最高分为95,最低分为65,极差为95-65=30,
(2)哪一组的成绩较稳定?
解:由于乙组的方差(标准差)小于甲组的方差(标准差),因此乙组的成绩较稳定.
从(1)中得到的极差也可看出乙组的成绩比较稳定.
规律方法
在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,越稳定.  
对点练1.从甲、乙两种玉米苗中各抽取10株,分别测得它们的株高(单位: cm)如下:
甲 25 41 40 37 22 14 19 39 21 42
乙 27 16 44 27 44 16 40 40 16 40
求:(1)哪种玉米苗长得高?
(2)哪种玉米苗长得齐?
同理可计算得s2乙=128.8,
返回
综合应用
例2
应用一 分层随机抽样的方差
 在对某中学高一学生体重的调查中,采取按样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生30人,其平均数和方差分别为55和15,抽取了女生20人,其平均数和方差分别为45和20.你能由这些数据计算出总样本的平均数和方差吗?若能则求出,否则说明理由.
规律方法
对点练2.某班为了了解学生每周购买零食的支出情况,利用分层随机抽样抽取了一个15人的样本统计如下:
求全班学生每周购买零食的平均费用和方差.
解:全班学生每周购买零食的平均费用
学生数 平均支出(元) 方差
男生 9 40 6
女生 6 35 4
例3
应用二 方差、标准差与统计图表的综合应用
 甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
解:由题图可得,甲、乙两人五次测试的成绩分别为
甲:10,13,12,14,16;
乙:13,14,12,12,14.
(2)根据图形和(1)中的计算结果,对两人的训练成绩作出评价.
解:由s2甲>s2乙可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
规律方法
折线统计图中数字特征的求解技巧
折线统计图研究样本数据的数字特征与横坐标和纵坐标的统计意义有关.一般情况下,整体分布位置较高的平均数大,数据波动性小的方差小.
对点练3.甲、乙、丙三名学生在一项集训中的40次测试分数都在[50,100]内,将他们的测试分数分别绘制成频率分布直方图,如图所示,记甲、乙、丙的分数标准差分别为s1,s2,s3,则它们的大小关系为
A.s1>s2>s3 B.s1>s3>s2
C.s3>s1>s2 D.s3>s2>s1

比较三个频率分布直方图知,甲为“双峰”直方图,两端数据最多,最分散,方差最大;乙为“单峰”直方图,数据最集中,方差最小;丙为“单峰”直方图,但数据分布相对均匀,方差介于甲、乙之间.综上可知s1>s3>s2.故选B.
返回
课堂小结
知识 (1)方差、极差的计算与应用.
(2)分层随机抽样的方差.
方法 数据统计、数据分析.
易错误区 方差、标准差易混淆.
感谢观看

展开更多......

收起↑

资源列表