5.1.4 用样本估计总体(教案+学案)高中数学 人教B版 必修第二册

资源下载
  1. 二一教育资源

5.1.4 用样本估计总体(教案+学案)高中数学 人教B版 必修第二册

资源简介

5.1.4 用样本估计总体
[学习目标] 1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3.会用样本的基本数字特征估计总体的基本数字特征.
导语
同学们,你们想拥有一个健康的体魄吗 拥有健康的体魄是我们学习和生活的基础,为了提高大家的体质健康水平,教育部决定,在全国范围内开展“全国亿万青少年学生阳光体育运动”,使大部分学生能做到每天锻炼一小时,我们在座的同学达到目标了吗 我校的同学达到这个标准了吗
一、用样本的数字特征估计总体的数字特征
知识梳理
1.用样本的数字特征估计总体的数字特征
(1)一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
(2)在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等.
另外,有时候总体的数字特征不可能获得,此时只能用样本的数字特征去估计总体的数字特征.
2.众数、中位数、平均数
众数 在频率分布直方图中,众数是最高小矩形的中点所对应的数据
中位数 (1)在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差 (2)表示样本数据所占频率的等分线
平均数 (1)在频率分布直方图中,平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)平均数是频率分布直方图的重心,是频率分布直方图的平衡点
注意点:
(1)利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息.
(2)一般地,平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”,而标准差则反映了样本的波动程度、离散程度,即均衡性、稳定性、差异性等.因此,我们可以根据问题的需要选择用样本的不同数字特征来分析问题.一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
例1 甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示.
(1)填写下表;
平均数 方差 中位数 命中9环及以上
甲 7 1.2 1
乙 5.4 3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环及以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
解 (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10,所以=×(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示.
平均数 方差 中位数 命中9环及以上
甲 7 1.2 7 1
乙 7 5.4 7.5 3
(2)①甲、乙的平均数相同,均为7,但<,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙的平均数相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.
③甲、乙的平均数相同,而乙命中9环及以上的次数比甲多2次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
反思感悟 在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能反映这组数据特征的一些值,例如上述数据,我们可以从平均数、中位数、百分位数、众数、极差、方差、标准差等角度进行比较.
跟踪训练1 某西餐厅推出了以下线上促销活动.
A套餐(在下列食品中6选2)
西式面点:蔓越莓核桃包、南瓜芝士包、黑列巴、全麦吐司.
中式面点:豆包、桂花糕.
B套餐:酱牛肉、老味烧鸡熟食类组合.
某一周两种套餐的日销售量(单位:份)如表所示.
星期一 星期二 星期三 星期四 星期五 星期六 星期日
A套餐 11 12 14 18 22 19 23
B套餐 6 13 15 15 37 20 41
根据上面一周的销量,分别计算A套餐和B套餐销量的平均数和方差,并根据所得数据评价两种套餐的销售情况.
解 A套餐销量的平均数
=×(11+12+14+18+22+19+23)=17,
方差=×(62+52+32+12+52+22+62)=.
B套餐销量的平均数
=×(6+13+15+15+37+20+41)=21,
方差=×(152+82+62+62+162+12+202)=.
因为<<,
所以该周销量中A套餐比B套餐平均销量低,但A套餐的销量比B套餐相对稳定.
二、分层抽样的平均数、方差
知识梳理
假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2.
如果记样本均值为,样本方差为b2,则==,
b2=
=.
注意点:
在分层抽样时,如果总体分为k层,而且第j层抽取的样本量为nj,样本均值为,样本方差为,j=1,2,…,k.记n=,则所有数据的样本均值和方差分别为=,s2=
例2 (多选)某分层抽样中,有关数据如表所示.
样本量 平均数 方差
第1层 45 4 2
第2层 35 8 1
第3层 10 6 3
则下列叙述正确的是(结果保留两位小数) (  )
A.第1,2层所有数据的均值为5.75
B.第1,2层所有数据的方差为1.50
C.第1,2,3层所有数据的均值约为7.68
D.第1,2,3层所有数据的方差约为5.23
答案 AD
解析 第1,2层所有数据的均值为=×4+×8=5.75,A正确;第1,2层所有数据的方差为=×+×=5.5,B不正确;第1,2,3层所有数据的均值为=×4+×8+×6≈5.78,C不正确;第1,2,3层所有数据的方差约为s2=×+×+×≈5.23,D正确.
反思感悟 运用公式求分层抽样的均值与方差时要注意
(1)清楚公式中各个符号的含义,避免代入数据混乱.
(2)运算要格外仔细,并按要求保留有效小数.
跟踪训练2 某培训机构在假期招收了A,B两个数学补习班,A班10人,B班30人,经过一周的补习后进行了一次测试,在该测试中,A班的平均成绩为130分,方差为115,B班的平均成绩为110分,方差为215.求在这次测试中全体学生的平均成绩和方差.
解 依题意=130,=115,
=110,=215,
∴=×130+×110=115,
∴全体学生的平均分为115分.
全体学生成绩的方差为
s2=[+(-)2]+[+(-)2]
=×(115+225)+×(215+25)
=85+180=265.
三、用样本的分布来估计总体的分布
知识梳理
1.同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,=[(π1-p1)2+(π2-p2)2+…+(πn-pn)2]不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来越大.
2.用样本的分布来估计总体的分布
如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多,特别地,每一组的频率与总体对应的频率相差不会太大.
例3 某校从参加高一年级期末考试的学生中抽出60名,将其物理成绩(均为整数)分成六段[40,50),
[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图中的信息,回答下列问题:
(1)估计这次考试的物理成绩的众数m与中位数n(结果保留一位小数);
(2)估计这次考试的物理成绩的及格率(60分及以上为及格)和平均分.
解 (1)众数是频率分布直方图中最高小矩形底边中点的横坐标,所以众数m=75.0.
前3个小矩形面积之和为0.01×10+0.015×10+0.015×10=0.4<0.5,
前4个小矩形面积之和为0.4+0.03×10=0.7>0.5,
所以中位数n=70+≈73.3.
(2)依题意得,60及60以上的分数在第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)×10=0.75,
所以估计这次考试的物理成绩的及格率是75%.
利用组中值估算抽样学生的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
则估计这次考试物理成绩的平均分是71分.
反思感悟 利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能比较准确地估计其众数、中位数和平均数.
跟踪训练3 某城市一入城交通路段限速60公里/小时,现对某时段通过该交通路段的n辆小汽车车速进行统计,并绘制成频率分布直方图(如图).若这n辆小汽车中,速度在50~60公里/小时之间的车辆有200辆.
(1)求n的值;
(2)估计这n辆小汽车车速的平均数、中位数.
解 (1)由直方图可知,速度在50~60公里/小时之间的频率为0.040×10=0.4,
所以=500,即n=500.
(2)这n辆小汽车车速的平均数的估计值为25×0.06+35×0.1+45×0.3+55×0.4+65×0.1+75×0.04=50.
设这n辆小汽车车速的中位数为x,
则0.006×10+0.010×10+0.030×10+0.040×(x-50)=0.5,
解得x=51.
所以这n辆小汽车车速的平均数为50公里/小时,中位数为51公里/小时.
1.知识清单:
(1)样本的数字特征.
(2)用样本的数字特征估计总体的数字特征.
(3)用样本的分布来估计总体的分布.
2.方法归纳:数据处理.
3.常见误区:样本的数字特征只能估计总体的数字特征,不能替代总体.
1.某校学生的男女人数之比为2∶3,按照男女比例通过分层抽样的方法抽到一个样本,样本中男生每天运动时间的平均数为100分钟、女生为80分钟.结合此数据,估计该校全体学生每天运动时间的平均数为 (  )
A.98分钟 B.88分钟
C.90分钟 D.85分钟
答案 B
解析 由题设,若该校男生人数为2n,则女生人数为3n,
∴该校全体学生每天运动时间的平均数为==88(分钟).
2.如图是某学校的教研处根据调查结果绘制的本校学生每天放学后的自学时间情况的频率分布直方图.根据频率分布直方图,则自学时间的中位数和众数的估计值分别是(精确到0.01) (  )
A.2.20,2.25 B.2.29,2.20
C.2.29,2.25 D.2.25,2.25
答案 C
解析 由频率分布直方图得,自学时间在[0.5,2)的频率为(0.16+0.2+0.34)×0.5=0.35,
自学时间在[2,2.5)的频率为0.52×0.5=0.26,
所以自学时间的中位数为2+×0.5≈2.29,众数为=2.25.
3.某校甲、乙两个班共70人(甲班40人,乙班30人)参加了某知识竞赛,甲班的平均成绩为77分,方差为123,乙班的平均成绩为70分,方差为130,则甲、乙两班全部同学的成绩的方差为 (  )
A.74 B.128 C.138 D.136
答案 C
解析 由总样本方差公式s2=[m+n+(-)2],
可得甲、乙两班全部同学的成绩的方差为×=138.
4.某中学为了解学生数学课程的学习情况,在2 200名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测这2 200名学生在该次数学考试中成绩不低于80分的学生有    人.
答案 616
解析 2 200×(0.020+0.008)×10=616.
课时对点练 [分值:100分]
单选题每小题5分,共40分;多选题每小题6分,共12分
1.在用样本分布估计总体分布的过程中,下列说法中正确的是 (  )
A.样本容量一定时总体容量越大,估计越精确
B.总体容量与估计的精确度无关
C.总体容量一定时样本容量越大,估计越精确
D.总体容量一定时样本容量越小,估计越精确
答案 C
解析 当样本容量越大时,估计总体越精确.
2.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高为1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.由此可估计我国13岁男孩的平均身高为 (  )
A.1.57 m B.1.56 m C.1.55 m D.1.54 m
答案 B
解析 从北方抽取了300个男孩,平均身高为1.60 m,从南方抽取了200个男孩,平均身高为1.50 m,则这500个13岁男孩的平均身高是=1.56(m),据此可估计我国13岁男孩的平均身高为1.56 m.
3.(多选)甲、乙两名同学六次数学测验成绩(百分制)如图所示,下面说法正确的是 (  )
A.甲同学成绩的中位数大于乙同学成绩的中位数
B.甲同学成绩的平均分比乙同学的高
C.甲同学成绩的平均分比乙同学的低
D.甲同学成绩的方差小于乙同学成绩的方差
答案 CD
解析 甲的中位数为81,乙的中位数为87.5,故A错误;甲的平均分=×(76+72+80+82+86+90)=81,乙的平均分'=×(69+78+87+88+92+96)=85,故B错误,C正确;甲的极差为18,乙的极差为27,且甲的成绩比较均衡,故甲的成绩的方差小于乙成绩的方差,D正确.
4.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.估计这次测试数学成绩的平均分为 (  )
A.50 B.60 C.72 D.80
答案 C
解析 学生的平均分约为45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×0.05=72.
5.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)的统计图如图所示,假设得分分值的中位数为me,众数为mo,平均数为,则 (  )
A.me=mo= B.me=mo<
C.me答案 D
解析 由柱形图可知,30名学生的得分依次为2个3分,3个4分,10个5分,6个6分,3个7分,2个8分,2个9分,2个10分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现次数最多,故mo=5.
=
≈5.97.于是得mo6.某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照[11.5,12),[12,12.5),…,[15.5,16)分成9组,制成了如图所示的频率分布直方图.规定成绩低于13秒为优,成绩高于14.8秒为不达标.由频率分布直方图推断,下列选项错误的是 (  )
A.频率分布直方图中a的值为0.40
B.由频率分布直方图估计本校高三男生100米体能测试成绩的众数为13.75秒
C.由频率分布直方图估计本校高三男生100米体能测试成绩为优的人数为54
D.由频率分布直方图估计本校高三男生100米体能测试成绩不达标的人数为18
答案 D
解析 0.5×(0.08+0.16+0.30+a+0.52+0.30+0.12+0.08+0.04)=1,解得a=0.40,A选项正确;众数为=13.75,B选项正确;成绩低于13秒的频率为0.5×(0.08+0.16+0.30)=0.5×0.54=0.27,人数为200×0.27=54,C选项正确;成绩高于14.8秒的频率为(15-14.8)×0.12+0.5×(0.08+0.04)=0.084,人数为200×0.084≈17,D选项错误.
7.(5分)抽样调查某地区120名教师的年龄和学历状况,情况如图所示,则估计该地区35岁以下具有研究生学历的教师所占的百分比为    .
答案 25%
解析 由题可知,35岁以下教师的总人数为50÷62.5%=80,
∴35岁以下具有研究生学历的教师人数为80-50=30,
故估计该地区35岁以下具有研究生学历的教师所占的百分比为×100%=25%.
8.(5分)某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试数学成绩的平均分为    .
答案 71
解析 在频率分布直方图中,所有小长方形的面积和为1,设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,
解得x=0.3,即该组频率为0.3,所以本次考试数学成绩的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
9.(10分)甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从甲、乙生产的零件中分别抽取40件、60件,甲的平均尺寸为10,方差为20,乙的平均尺寸为12,方差为40.那么全部100件产品的平均尺寸和方差分别是多少
解 甲机床生产的零件的平均尺寸、方差分别为
=10,=20,
乙机床生产的零件的平均尺寸、方差分别为
=12,=40,
所以100件产品的平均尺寸
===11.2,
所以100件产品的方差
s2=×[40+60+×(10-12)2]=×[(40×20+60×40)+24×4]=32.96.
10.(11分)某网站从春节期间参与收发网络红包的手机用户中随机抽取2 000名进行调查,将受访用户按年龄分成5组[10,20),[20,30),…,[50,60],并整理得到如图所示的频率分布直方图.
(1)求a的值;(3分)
(2)从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的频率;(4分)
(3)估计春节期间参与收发网络红包的手机用户的平均年龄.(4分)
解 (1)根据频率分布直方图可知10×(a+0.005+0.01+0.02+0.03)=1,解得a=0.035.
(2)根据题意,得样本中年龄低于40岁的频率为10×(0.01+0.035+0.03)=0.75,
所以从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的频率为0.75.
(3)根据题意,得春节期间参与收发网络红包的手机用户的平均年龄约为15×0.1+25×0.35+35×0.3+45×0.2+55×0.05=32.5(岁).
11.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确的结论是 (  )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次的总体平均数与标准值接近程度相同
D.两个批次的总体平均数与标准值接近程度不能确定
答案 A
解析 计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.
12.(多选)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的柱形图,下列结论正确的是 (  )
A.甲地该月14时的平均气温低于乙地该月14时的平均气温
B.甲地该月14时的平均气温高于乙地该月14时的平均气温
C.甲地该月14时的气温的极差大于乙地该月14时的气温的极差
D.甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差
答案 AC
解析 甲地数据为26,28,29,31,31;乙地数据为28,29,30,31,32.
所以==29,==30,甲地气温的极差为31-26=5,乙地气温的极差为32-28=4.因为=×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6,=×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2,所以s甲=,s乙=,所以s甲>s乙.
13.为了了解某校学生的视力情况,随机抽查了该校100名学生的视力,得到如图所示的频率分布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.设最大频率为a,视力在4.5到5.2之间的学生人数为b,则a,b的值分别为 (  )
A.0.27,0.96 B.0.27,96
C.27,0.96 D.27,96
答案 B
解析 由频率分布直方图知组距为0.1,由前4组的频数和为40,后6组的频数和为87,知第4组的频数为40+87-100=27,即视力在4.6到4.7之间的频数最大,为27,故最大频率a=0.27.视力在4.5到5.2之间的频率为1-0.01-0.03=0.96,故视力在4.5到5.2之间的学生人数b=0.96×100=96.
14.(5分)为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则
(1)这20名工人中一天生产该产品的数量在[55,75)内的人数是    ;
(2)这20名工人一天生产该产品的数量的平均数为    .
答案 (1)13 (2)64
解析 (1)一天生产该产品的数量在[55,75)内的人数为(0.040×10+0.025×10)×20=13.
(2)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
15.某公司为了解用户对其产品的满意度,从甲、乙两地区分别随机调查了100名用户,根据用户对产品的满意度评分,分别得到甲地区和乙地区用户满意度评分的频率分布直方图如图所示.
若甲地区和乙地区用户满意度评分的中位数分别为m1,m2,平均数分别为,则下列结论正确的是 (  )
A.m1>m2,> B.m1>m2,<
C.m1
答案 C
解析 由频率分布直方图得,甲地区用户满意度评分在[40,60)内的频率为(0.015+0.020)×10=0.35,在[60,70)内的频率为0.025×10=0.25,所以甲地区用户满意度评分的中位数m1=60+×10=66,平均数=45×0.015×10+55×0.020×10+65×0.025×10+75×0.020×10+85×0.010×10+95×0.010×10=67.
乙地区用户满意度评分在[50,70)内的频率为(0.005+0.020)×10=0.25,在[70,80)内的频率为0.035×10=0.35,
所以乙地区用户满意度评分的中位数m2=70+×10≈77.1,平均数=55×0.005×10+65×0.020×10+75×0.035×10+85×0.025×10+95×0.015×10=77.5.所以m116.(12分)对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出频率分布表和频率分布直方图如图所示:
分组 频数 频率
[10,15) 10 0.25
[15,20) 24 n
[20,25) m p
[25,30] 2 0.05
合计 M 1
(1)求出表中M,p及图中a的值;(4分)
(2)若该校有高三学生240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;(4分)
(3)估计该校高三年级学生参加社区服务次数的平均数.(4分)
解 (1)由分组[10,15)内的频数是10,频率是0.25,知=0.25,所以M=40.
所以10+24+m+2=40,解得m=4,
所以p===0.10,a==0.12.
(2)估计该校高三学生参加社区服务的次数在区间[10,15)内的人数为0.25×240=60.
(3)因为n==0.60,
又12.5×0.25+17.5×0.60+22.5×0.10+27.5×0.05=17.25.
所以估计该校高三年级学生参加社区服务次数的平均数是17.25.5.1.4 用样本估计总体
[学习目标] 1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3.会用样本的基本数字特征估计总体的基本数字特征.
一、用样本的数字特征估计总体的数字特征
知识梳理
1.用样本的数字特征估计总体的数字特征
(1)一般情况下,如果样本的容量     ,抽样方法又     的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
(2)在容许一定误差存在的前提下,可以用     的数字特征去估计总体的数字特征,这样就能节省人力和物力等.
另外,有时候总体的数字特征不可能获得,此时只能用样本的数字特征去估计总体的数字特征.
2.众数、中位数、平均数
众数 在频率分布直方图中,众数是最高小矩形的中点所对应的数据
中位数 (1)在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差 (2)表示样本数据所占频率的等分线
平均数 (1)在频率分布直方图中,平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)平均数是频率分布直方图的重心,是频率分布直方图的平衡点
例1 甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示.
(1)填写下表;
平均数 方差 中位数 命中9环及以上
甲 7 1.2 1
乙 5.4 3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环及以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
跟踪训练1 某西餐厅推出了以下线上促销活动.
A套餐(在下列食品中6选2)
西式面点:蔓越莓核桃包、南瓜芝士包、黑列巴、全麦吐司.
中式面点:豆包、桂花糕.
B套餐:酱牛肉、老味烧鸡熟食类组合.
某一周两种套餐的日销售量(单位:份)如表所示.
星期一 星期二 星期三 星期四 星期五 星期六 星期日
A套餐 11 12 14 18 22 19 23
B套餐 6 13 15 15 37 20 41
根据上面一周的销量,分别计算A套餐和B套餐销量的平均数和方差,并根据所得数据评价两种套餐的销售情况.
二、分层抽样的平均数、方差
知识梳理
假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2.
如果记样本均值为,样本方差为b2,则==,
b2=
=.
例2 (多选)某分层抽样中,有关数据如表所示.
样本量 平均数 方差
第1层 45 4 2
第2层 35 8 1
第3层 10 6 3
则下列叙述正确的是(结果保留两位小数) (  )
A.第1,2层所有数据的均值为5.75
B.第1,2层所有数据的方差为1.50
C.第1,2,3层所有数据的均值约为7.68
D.第1,2,3层所有数据的方差约为5.23
反思感悟 运用公式求分层抽样的均值与方差时要注意
(1)清楚公式中各个符号的含义,避免代入数据混乱.
(2)运算要格外仔细,并按要求保留有效小数.
跟踪训练2 某培训机构在假期招收了A,B两个数学补习班,A班10人,B班30人,经过一周的补习后进行了一次测试,在该测试中,A班的平均成绩为130分,方差为115,B班的平均成绩为110分,方差为215.求在这次测试中全体学生的平均成绩和方差.
三、用样本的分布来估计总体的分布
知识梳理
1.同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,=           不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来    .
2.用样本的分布来估计总体的分布
如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多,特别地,每一组的频率与总体对应的频率相差不会太大.
例3 某校从参加高一年级期末考试的学生中抽出60名,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图中的信息,回答下列问题:
(1)估计这次考试的物理成绩的众数m与中位数n(结果保留一位小数);
(2)估计这次考试的物理成绩的及格率(60分及以上为及格)和平均分.
反思感悟 利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能比较准确地估计其众数、中位数和平均数.
跟踪训练3 某城市一入城交通路段限速60公里/小时,现对某时段通过该交通路段的n辆小汽车车速进行统计,并绘制成频率分布直方图(如图).若这n辆小汽车中,速度在50~60公里/小时之间的车辆有200辆.
(1)求n的值;
(2)估计这n辆小汽车车速的平均数、中位数.
1.知识清单:
(1)样本的数字特征.
(2)用样本的数字特征估计总体的数字特征.
(3)用样本的分布来估计总体的分布.
2.方法归纳:数据处理.
3.常见误区:样本的数字特征只能估计总体的数字特征,不能替代总体.
1.某校学生的男女人数之比为2∶3,按照男女比例通过分层抽样的方法抽到一个样本,样本中男生每天运动时间的平均数为100分钟、女生为80分钟.结合此数据,估计该校全体学生每天运动时间的平均数为 (  )
A.98分钟 B.88分钟
C.90分钟 D.85分钟
2.如图是某学校的教研处根据调查结果绘制的本校学生每天放学后的自学时间情况的频率分布直方图.根据频率分布直方图,则自学时间的中位数和众数的估计值分别是(精确到0.01) (  )
A.2.20,2.25 B.2.29,2.20
C.2.29,2.25 D.2.25,2.25
3.某校甲、乙两个班共70人(甲班40人,乙班30人)参加了某知识竞赛,甲班的平均成绩为77分,方差为123,乙班的平均成绩为70分,方差为130,则甲、乙两班全部同学的成绩的方差为 (  )
A.74 B.128
C.138 D.136
4.某中学为了解学生数学课程的学习情况,在2 200名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测这2 200名学生在该次数学考试中成绩不低于80分的学生有    人.
答案精析
知识梳理
1.(1)恰当 合理 (2)样本
例1 解 (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10,所以=×(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示.
平均数 方差 中位数 命中9环及以上
甲 7 1.2 7 1
乙 7 5.4 7.5 3
(2)①甲、乙的平均数相同,均为7,但<,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙的平均数相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.
③甲、乙的平均数相同,而乙命中9环及以上的次数比甲多2次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
跟踪训练1 解 A套餐销量的平均数
=×(11+12+14+18+22+19+23)=17,
方差=×(62+52+32+12+52+22+62)=.
B套餐销量的平均数
=×(6+13+15+15+37+20+41)=21,
方差=×(152+82+62+62+162+12+202)=.
因为<<,
所以该周销量中A套餐比B套餐平均销量低,但A套餐的销量比B套餐相对稳定.
例2 AD [第1,2层所有数据的均值为=×4+×8=5.75,A正确;第1,2层所有数据的方差为=×+×=5.5,B不正确;第1,2,3层所有数据的均值为=×4+×8+×6≈5.78,C不正确;第1,2,3层所有数据的方差约为s2=×+×+×≈5.23,D正确.]
跟踪训练2 解 依题意=130,=115,
=110,=215,
∴=×130+×110=115,
∴全体学生的平均分为115分.
全体学生成绩的方差为
s2=[+(-)2]+[+(-)2]
=×(115+225)+×(215+25)
=85+180=265.
知识梳理
1.[(π1-p1)2+(π2-p2)2+…+(πn-pn)2] 越大
例3 解 (1)众数是频率分布直方图中最高小矩形底边中点的横坐标,所以众数m=75.0.
前3个小矩形面积之和为0.01×10+0.015×10+0.015×10=0.4<0.5,
前4个小矩形面积之和为0.4+0.03×10=0.7>0.5,
所以中位数n=70+≈73.3.
(2)依题意得,60及60以上的分数在第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)×10=0.75,
所以估计这次考试的物理成绩的及格率是75%.
利用组中值估算抽样学生的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
则估计这次考试物理成绩的平均分是71分.
跟踪训练3 解 (1)由直方图可知,速度在50~60公里/小时之间的频率为0.040×10=0.4,
所以=500,即n=500.
(2)这n辆小汽车车速的平均数的估计值为25×0.06+35×0.1+45×0.3+55×0.4+65×0.1+75×0.04=50.
设这n辆小汽车车速的中位数为x,
则0.006×10+0.010×10+0.030×10+0.040×(x-50)=0.5,
解得x=51.
所以这n辆小汽车车速的平均数为50公里/小时,中位数为51公里/小时.
随堂演练
1.B 2.C 3.C 4.616

展开更多......

收起↑

资源列表