高中数学人教B版必修第二册 5.1.4 用样本估计总体(课件+学案)

资源下载
  1. 二一教育资源

高中数学人教B版必修第二册 5.1.4 用样本估计总体(课件+学案)

资源简介

5.1.4 用样本估计总体
学习目标 1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3.会用样本的基本数字特征估计总体的基本数字特征.
导语
同学们,你们想拥有一个健康的体魄吗?拥有健康的体魄是我们学习和生活的基础,为了提高大家的体质健康水平,教育部决定,在全国范围内开展“全国亿万青少年学生阳光体育运动”,使大部分学生能做到每天锻炼一小时,我们在座的同学达到目标了吗?我校的同学达到这个标准了吗?
一、用样本的数字特征估计总体的数字特征
1.用样本的数字特征估计总体的数字特征
(1)一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
(2)在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等.
另外,有时候总体的数字特征不可能获得,此时只能用样本的数字特征去估计总体的数字特征.
2.众数、中位数、平均数
众数 在频率分布直方图中,众数是最高小矩形的中点所对应的数据
中位数 (1)在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差 (2)表示样本数据所占频率的等分线
平均数 (1)在频率分布直方图中,平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)平均数是频率分布直方图的重心,是频率分布直方图的平衡点
注意点:
(1)利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息.
(2)一般地,平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”,而标准差则反映了样本的波动程度、离散程度,即均衡性、稳定性、差异性等.因此,我们可以根据问题的需要选择用样本的不同数字特征来分析问题.一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
例1 某中职学校在每年一度的技能大赛中有甲、乙两名同学获得省级比赛一等奖,学校要在甲、乙两名同学中选拔一名同学参加国赛,为了选拔出综合实力最强的选手参加国赛,现抽取甲、乙两名同学在最近8次理论考试与技能考试中的综合成绩,并统计如表:
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)求甲、乙两名同学的平均成绩;
(2)从考试发挥的稳定性的角度考虑,你认为选择哪位同学参加国赛更合适?请说明理由.
解 (1)根据题中数据可知,
甲同学的平均成绩
==85,
乙同学的平均成绩
==85.
(2)由(1)可知==85,
甲同学成绩的方差
=×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]
=×[(-3)2+(-4)2+(-6)2+(-7)2+102+32+82+(-1)2]=35.5,
乙同学成绩的方差
=×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]
=×[72+102+(-5)2+(-10)2+(-2)2+(-5)2+52+02]=41,
所以<,
因为甲、乙两名同学的平均成绩相同,所以两名同学水平相当.
又因为甲同学成绩的方差小于乙同学成绩的方差,所以甲同学的成绩更加稳定.
所以选择甲同学参加国赛更合适.
反思感悟 在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能反映这组数据特征的一些值,例如上述数据,我们可以从平均数、中位数、百分位数、众数、极差、方差、标准差等角度进行比较.
跟踪训练1 (1)(多选)某工厂有甲、乙两条流水线同时生产直径为50 mm的零件,各抽取10个进行测量,其结果如图所示,则以下结论正确的是(  )
A.甲流水线生产的零件直径的极差为0.4 mm
B.乙流水线生产的零件直径的中位数为50.0 mm
C.乙流水线生产的零件直径比甲流水线生产的零件直径稳定
D.甲流水线生产的零件直径的平均值小于乙流水线生产的零件直径的平均值
答案 ABC
解析 对于A,甲流水线生产的零件直径的极差为50.2-49.8=0.4(mm),故A正确;
对于B,将乙流水线生产的零件直径按从小到大的顺序排列,排在第5,6个位置的数据均为50.0,故中位数为50.0 mm,故B正确;
对于C,由图易得,乙流水线生产的零件直径比甲流水线生产的零件直径稳定,故C正确;
对于D,计算可得甲、乙流水线生产的零件直径的平均值均为50.0 mm,故D错误.
(2)林管部门在每年3月12日植树节前,为保证树苗的质量,都会对树苗进行检测,现从甲、乙两种树苗中抽测了10株树苗的高度,其茎叶图如图,下列描述正确的是(  )
A.甲种树苗的平均高度高于乙种树苗的平均高度,且甲种树苗比乙种树苗长得整齐
B.甲种树苗的平均高度高于乙种树苗的平均高度,但乙种树苗比甲种树苗长得整齐
C.乙种树苗的平均高度高于甲种树苗的平均高度,但甲种树苗比乙种树苗长得整齐
D.乙种树苗的平均高度高于甲种树苗的平均高度,且乙种树苗比甲种树苗长得整齐
答案 C
解析 设甲、乙两种树苗的样本平均值分别为,,样本方差分别为,,又由茎叶图中的数据,我们可得甲、乙两种树苗抽取的样本高度分别为
甲:19,20,21,23,25,29,31,32,33,37,
乙:10,10,14,26,27,30,44,46,46,47.
由已知易得,
=×(19+20+21+23+25+29+31+32+33+37)=27,
=×(10+10+14+26+27+30+44+46+46+47)=30,
<,
由茎叶图可知甲种树苗数据比较集中,乙种树苗数据比较分散,所以<.
故乙种树苗的平均高度高于甲种树苗的平均高度,甲种树苗比乙种树苗长得整齐.
二、分层抽样的平均数、方差
假设第一层抽取m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层抽取n个数,分别为y1,y2,…,yn,平均数为,方差为t2.
如果记样本均值为,样本方差为b2,则
==,
b2=
=.
注意点:
在分层抽样时,如果总体分为k层,而且第j层抽取的样本量为nj,样本均值为,样本方差为,j=1,2,…,k.记n=nj,则所有数据的样本均值和方差分别为=(nj),s2=
[nj+nj(-)2].
例2 (多选)某分层抽样中,有关数据如表所示.
样本量 平均数 方差
第1层 45 4 2
第2层 35 8 1
第3层 10 6 3
则下列叙述正确的是(结果保留两位小数)(  )
A.第1,2层所有数据的均值为5.75
B.第1,2层所有数据的方差为1.50
C.第1,2,3层所有数据的均值约为7.68
D.第1,2,3层所有数据的方差约为5.23
答案 AD
解析 第1,2层所有数据的均值为=×4+×8=5.75,A正确;第1,2层所有数据的方差为=×+×=5.5,B不正确;第1,2,3层所有数据的均值为=×4+×8+×6≈5.78,C不正确;第1,2,3层所有数据的方差约为s2=×+×+×≈5.23,D正确.
反思感悟 运用公式求分层抽样的均值与方差时要注意
(1)清楚公式中各个符号的含义,避免代入数据混乱.
(2)运算要格外仔细,并按要求保留有效小数.
跟踪训练2 某培训机构在假期招收了A,B两个数学补习班,A班10人,B班30人,经过一周的补习后进行了一次测试,在该测试中,A班的平均成绩为130分,方差为115,B班的平均成绩为110分,方差为215.求在这次测试中全体学生的平均成绩和方差.
解 依题意=130,=115,
=110,=215,
∴=×130+×110=115,
∴全体学生的平均分为115分.
全体学生成绩的方差为
s2=+(-)2]++(-)2]
=×(115+225)+×(215+25)
=85+180=265.
三、用样本的分布来估计总体的分布
1.同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,(πi-pi)2=[(π1-p1)2+(π2-p2)2+…+(πn-pn)2]不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来越大.
2.用样本的分布来估计总体的分布
如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多,特别地,每一组的频率与总体对应的频率相差不会太大.
例3 (课本例2)我国是世界上严重缺水的国家之一,某市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家庭的月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3,4),[4,5]分成5组,制成了如图所示的频率分布直方图.
(1)求图中a的值;
(2)设该市有10万个家庭,估计全市月均用水量不低于3 t的家庭数;
(3)假设同组中的每个数据都用该组区间的中点值代替,估计全市家庭月均用水量的平均数.
解 (1)因为频率分布直方图所有矩形的面积之和为1,所以(0.12+0.22+0.36+a+0.12)×1=1,解得a=0.18.
(2)抽取的样本中,月均用水量不低于3 t的家庭所占比例为(a+0.12)×1=0.3=30%,因此估计全市月均用水量不低于3 t的家庭所占比例也为30%,所求家庭数为100 000×30%=30 000.
(3)因为0.12×0.5+0.22×1.5+0.36×2.5+0.18×3.5+0.12×4.5=2.46,所以估计全市家庭月均用水量的平均数为2.46.
例3 某校从参加高一年级期末考试的学生中抽出60名,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图中的信息,回答下列问题:
(1)估计这次考试的物理成绩的众数m与中位数n(结果保留一位小数);
(2)估计这次考试的物理成绩的及格率(60分及以上为及格)和平均分.
解 (1)众数是频率分布直方图中最高小矩形底边中点的横坐标,所以众数m=75.0.
前3个小矩形面积之和为0.01×10+0.015×10+0.015×10=0.4<0.5,
前4个小矩形面积之和为0.4+0.03×10=0.7>0.5,
所以中位数n=70+≈73.3.
(2)依题意得,60及60以上的分数在第三、四、五、六组,频率和为
(0.015+0.03+0.025+0.005)×10=0.75,
所以估计这次考试的物理成绩的及格率是75%.
利用组中值估算抽样学生的平均分为
45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
则估计这次考试物理成绩的平均分是71分.
反思感悟 利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能比较准确地估计其众数、中位数和平均数.
跟踪训练3 随着时代不断地进步,人们的生活条件也越来越好,越来越多的人注重自己的身材,其中体脂率是一个很重要的衡量标准.根据一般的成人体准,女性体脂率的正常范围是20%~25%,男性体脂率的正常范围是15%~18%.这一范围适用于大多数成年人,可以帮助判断个体是否存在肥胖的风险.某市有关部门对全市100万名成年女性的体脂率进行一次抽样调查统计,抽取了1 000名成年女性的体脂率作为样本绘制频率分布直方图如图.
(1)求a;
(2)如果成年女性体脂率为25%~30%属于“偏胖”,体脂率超过30%属于“过胖”,那么全市成年女性“偏胖”“过胖”各约有多少人?
(3)小王说:“我的体脂率是调查所得数据的中位数.”小张说:“我的体脂率是调查所得数据的平均数.”试估计谁的体脂率更低.
解 (1)由频率分布直方图可得,5×2a+5×0.03+5×0.07+5×6a+5×2a=1,
所以a=0.01.
(2)由频率分布直方图可得样本中女性“偏胖”的频率为5×0.06=0.3,
样本中女性“过胖”的频率为5×0.02=0.1,
所以全市成年女性“偏胖”的约有1 000 000×0.3=300 000(人),
全市成年女性 “过胖”的约有1 000 000×0.1=100 000(人).
(3)调查所得数据的平均数为12.5×0.1+17.5×0.15+22.5×0.35+27.5×0.3+32.5×0.1=23.25,
设调查所得数据的中位数为x,
因为0.1+0.15=0.25<0.5,0.1+0.15+0.35=0.6>0.5,
所以20所以0.25+(x-20)×0.07=0.5,
所以x=≈23.57,
所以调查所得数据的中位数约为23.57,
所以小王的体脂率约为23.57,小张的体脂率为23.25,
所以小张的体脂率更低.
1.知识清单:
(1)样本的数字特征.
(2)用样本的数字特征估计总体的数字特征.
(3)用样本的分布来估计总体的分布.
2.方法归纳:数据处理.
3.常见误区:样本的数字特征只能估计总体的数字特征,不能替代总体.
1.某校学生的男女人数之比为2∶3,按照男女比例通过分层抽样的方法抽到一个样本,样本中男生每天运动时间的平均数为100分钟、女生为80分钟.结合此数据,估计该校全体学生每天运动时间的平均数为(  )
A.98分钟 B.88分钟
C.90分钟 D.85分钟
答案 B
解析 由题设,若该校男生人数为2n,则女生人数为3n,
∴该校全体学生每天运动时间的平均数为==88(分钟).
2.如图是某学校的教研处根据调查结果绘制的本校学生每天放学后的自学时间情况的频率分布直方图.根据频率分布直方图,则自学时间的中位数和众数的估计值分别是(精确到0.01)(  )
A.2.20,2.25 B.2.29,2.20
C.2.29,2.25 D.2.25,2.25
答案 C
解析 由频率分布直方图得,自学时间在[0.5,2)的频率为(0.16+0.2+0.34)×0.5=0.35,
自学时间在[2,2.5)的频率为0.52×0.5=0.26,
所以自学时间的中位数为
2+×0.5≈2.29,众数为=2.25.
3.某校甲、乙两个班共70人(甲班40人,乙班30人)参加了某知识竞赛,甲班的平均成绩为77分,方差为123,乙班的平均成绩为70分,方差为130,则甲、乙两班全部同学的成绩的方差为(  )
A.74 B.128 C.138 D.136
答案 C
解析 由总样本方差公式
s2=[m+n+-)2],
可得甲、乙两班全部同学的成绩的方差为×
=138.
4.某中学为了解学生数学课程的学习情况,在2 200名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测这2 200名学生在该次数学考试中成绩不低于80分的学生有    人.
答案 616
解析 2 200×(0.020+0.008)×10=616.
课时对点练
[分值:85分]
单选题每小题5分,共40分;多选题每小题6分,共12分
1.在用样本分布估计总体分布的过程中,下列说法中正确的是(  )
A.样本容量一定时总体容量越大,估计越精确
B.总体容量与估计的精确度无关
C.总体容量一定时样本容量越大,估计越精确
D.总体容量一定时样本容量越小,估计越精确
答案 C
解析 当样本容量越大时,估计总体越精确.
2.有一个容量为66的样本,数据的分组及各组的频数如下:
[11.5,15.5)2,[15.5,19.5)4,[19.5,23.5)9,[23.5,27.5)18, [27.5,31.5)11,[31.5,35.5)12,[35.5,39.5)7,[39.5,43.5)3.
根据样本的频数分布估计大于或等于27.5的数据约占(  )
A. B. C. D.
答案 C
解析 由题意知,大于或等于27.5的数据共有11+12+7+3=33,
则约占=.
3.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.估计这次测试数学成绩的平均分为(  )
A.50 B.60 C.72 D.80
答案 C
解析 学生的平均分约为45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×0.05=72.
4.某校为调查高一年级某次考试的数学成绩情况,选取高一年级甲班和乙班共25名学生进行调查.若甲班学生成绩的平均数为90,方差为3;乙班学生成绩的平均数为85,方差为5,且甲班与乙班的学生人数之比为2∶3,则这25名学生成绩的平均数和方差分别为(  )
A.87,10 B.85,10
C.87,10.2 D.85,10.2
答案 C
解析 甲班与乙班的学生人数之比为2∶3,则甲班有10名学生,乙班有15名学生,
由题意可知这25名学生成绩的平均数为=87,
这25名同学成绩的方差为s2==10.2.
5.某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照[11.5,12),[12,12.5),…,[15.5,16)分成9组,制成了如图所示的频率分布直方图.规定成绩低于13秒为优,成绩高于14.8秒为不达标.由频率分布直方图推断,下列选项错误的是(  )
A.频率分布直方图中a的值为0.40
B.由频率分布直方图估计本校高三男生100米体能测试成绩的众数为13.75秒
C.由频率分布直方图估计本校高三男生100米体能测试成绩为优的人数为54
D.由频率分布直方图估计本校高三男生100米体能测试成绩不达标的人数为18
答案 D
解析 0.5×(0.08+0.16+0.30+a+0.52+0.30+0.12+0.08+0.04)=1,解得a=0.40,A选项正确;众数为=13.75,B选项正确;成绩低于13秒的频率为0.5×(0.08+0.16+0.30)=0.5×0.54=0.27,人数为200×0.27=54,C选项正确;成绩高于14.8秒的频率为(15-14.8)×0.12+0.5×(0.08+0.04)=0.084,人数为200×0.084≈17,D选项错误.
6.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如下的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是(  )
A.海水稻根系深度的中位数是45.5 cm
B.普通水稻根系深度的众数是32 cm
C.海水稻根系深度的平均数大于普通水稻根系深度的平均数
D.普通水稻根系深度的方差小于海水稻根系深度的方差
答案 D
解析 A中,海水稻根系深度的中位数为=45.5(cm),正确;
B中,由茎叶图知普通水稻根系深度的众数是32 cm,正确;
C中,由茎叶图可知海水稻根系深度的平均数为×(38+39+39+…+51)=45(cm),
普通水稻根系深度的平均数为×(25+27+32+…+45)=35(cm),故海水稻根系深度的平均数大于普通水稻根系深度的平均数,正确;
D中,海水稻根系深度的方差为=×[(38-45)2+(39-45)2+…+(51-45)2]=23.2,
普通水稻根系深度的方差为=×[(25-35)2+(27-35)2+…+(45-35)2]=35.4,
所以海水稻根系深度的方差小于普通水稻根系深度的方差,错误.
7.(5分)抽样调查某地区120名教师的年龄和学历状况,情况如图所示,则估计该地区35岁以下具有研究生学历的教师所占的百分比为    .
答案 25%
解析 由题可知,35岁以下教师的总人数为
50÷62.5%=80,
∴35岁以下具有研究生学历的教师人数为
80-50=30,
故估计该地区35岁以下具有研究生学历的教师所占的百分比为×100%=25%.
8.(5分)某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试数学成绩的平均分为    .
答案 71
解析 在频率分布直方图中,所有小长方形的面积和为1,设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,
解得x=0.3,即该组频率为0.3,所以本次考试数学成绩的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
9.(11分)甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从甲、乙生产的零件中分别抽取40件、60件,甲的平均尺寸为10,方差为20,乙的平均尺寸为12,方差为40.那么全部100件产品的平均尺寸和方差分别是多少?
解 甲机床生产的零件的平均尺寸、方差分别为
=10,=20,
乙机床生产的零件的平均尺寸、方差分别为
=12,=40,
所以100件产品的平均尺寸
===11.2,
所以100件产品的方差
s2=×[40+60+×(10-12)2]=×[(40×20+60×40)+24×4]=32.96.
10.(12分)为调查某校学生参加校志愿者活动的情况,现抽取一个容量为100的样本,统计了这些学生一周内参加校志愿者活动的时长,并绘制了如图所示的频率分布直方图,记数据分布在[50,100),[100,150),[150,200),[200,250),[250,300),[300,350),[350,400]的频率分别为f1,f2,…,f7.已知f1+f2+f3=0.5,f4=2f6.
(1)求f2,f6的值;(4分)
(2)求样本中在[150,300)内的频数;(4分)
(3)若全校共有2 000名学生,请根据样本数据估计全校学生一周内参加校志愿者活动的时长不少于250分钟的人数.(4分)
解 (1)由题意知f1=0.001×50=0.05,
f3=0.006×50=0.3,
所以f2=0.5-f1-f3=0.5-0.05-0.3=0.15,
又f5=f2=0.15,f7=f1=0.05,
所以f4+f6=1-(f1+f2+f3+f5+f7)=1-(0.5+0.15+0.05)=0.3,
由于f4=2f6,则f6=0.1.
(2)样本中在[150,300)内的频率为f3+f4+f5=0.3+0.2+0.15=0.65,
相应的频数为100×0.65=65.
(3)样本中在[250,400]内的频率为f5+f6+f7=0.15+0.1+0.05=0.3,
估计全校学生一周内参加校志愿者活动的时长不少于250分钟的有2 000×0.3=600(人).
11.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确的结论是(  )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次的总体平均数与标准值接近程度相同
D.两个批次的总体平均数与标准值接近程度不能确定
答案 A
解析 计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.
12.为了了解某校学生的视力情况,随机抽查了该校100名学生的视力,得到如图所示的频率分布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.设最大频率为a,视力在4.5到5.2之间的学生人数为b,则a,b的值分别为(  )
A.0.27,0.96 B.0.27,96
C.27,0.96 D.27,96
答案 B
解析 由频率分布直方图知组距为0.1,由前4组的频数和为40,后6组的频数和为87,知第4组的频数为40+87-100=27,即视力在4.6到4.7之间的频数最大,为27,故最大频率a=0.27.视力在4.5到5.2之间的频率为1-0.01-0.03=0.96,故视力在4.5到5.2之间的学生人数b=0.96×100=96.
13.(多选)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的柱形图,下列结论正确的是(  )
A.甲地该月14时的平均气温低于乙地该月14时的平均气温
B.甲地该月14时的平均气温高于乙地该月14时的平均气温
C.甲地该月14时的气温的极差大于乙地该月14时的气温的极差
D.甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差
答案 AC
解析 甲地数据为26,28,29,31,31;乙地数据为28,29,30,31,32.
所以==29,
==30,甲地气温的极差为31-26=5,乙地气温的极差为32-28=4.因为=×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6,=×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2,所以s甲=,s乙=,所以s甲>s乙.
14.(多选)某省2024年美术联考约有5 000名学生参加,现从考试的科目素描中随机抽取了500名考生的考试成绩(满分100分),记录他们的分数后,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图,则下列说法不正确的是(  )
A.由频率分布直方图可知,全省考生的该项科目分数均不高于90分
B.用样本估计总体,全省该项科目分数低于70分的考生约为3 000人
C.若样本中分数低于40分的考生有30人,则可估计总体中分数在区间[40,50)内的约200人
D.用样本估计总体,全省考生该项科目分数的80%分位数为80
答案 AB
解析 对于A,由题意可知,在500个样本中,该项科目分数均不高于90分,
样本可以用来估计总体,但不能代替总体,在其余考生该项科目的成绩中可能有高于90分的,故A不正确;
对于B,在样本中,分数不低于70分的频率为(0.04+0.02)×10=0.6,
则样本中分数低于70分的频率为0.4,若用样本估计总体,
则全省该项科目分数低于70分的考生约为5 000×0.4=2 000(人),故B不正确;
对于C,在样本中,成绩低于50分的频率为1-(0.04+2×0.02+0.01)×10=0.1,
当样本分数低于40分的考生有30人时,其频率为=0.06,
则样本中分数在区间[40,50)内的频率为0.04,用样本估计总体,
则全省考生中分数在区间[40,50)内的约为5 000×0.04=200(人),故C正确;
对于D,因为第七组的频率为0.02×10=0.2,所以用样本估计总体,
全省考生该项科目分数的80%分位数为80,故D正确.(共93张PPT)
5.1.4
用样本估计总体
第五章 §5.1 统计
<<<
1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.
2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.
3.会用样本的基本数字特征估计总体的基本数字特征.
学习目标
同学们,你们想拥有一个健康的体魄吗?拥有健康的体魄是我们学习和生活的基础,为了提高大家的体质健康水平,教育部决定,在全国范围内开展“全国亿万青少年学生阳光体育运动”,使大部分学生能做到每天锻炼一小时,我们在座的同学达到目标了吗?我校的同学达到这个标准了吗?
导 语
一、用样本的数字特征估计总体的数字特征
二、分层抽样的平均数、方差
课时对点练
三、用样本的分布来估计总体的分布
随堂演练
内容索引
用样本的数字特征估计总体的数字特征

1.用样本的数字特征估计总体的数字特征
(1)一般情况下,如果样本的容量 ,抽样方法又 的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
(2)在容许一定误差存在的前提下,可以用 的数字特征去估计总体的数字特征,这样就能节省人力和物力等.
另外,有时候总体的数字特征不可能获得,此时只能用样本的数字特征去估计总体的数字特征.
恰当
合理
样本
2.众数、中位数、平均数
众数 在频率分布直方图中,众数是最高小矩形的中点所对应的数据
中位数 (1)在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差
(2)表示样本数据所占频率的等分线
平均数 (1)在频率分布直方图中,平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和
(2)平均数是频率分布直方图的重心,是频率分布直方图的平衡点
(1)利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息.
注 意 点
<<<
(2)一般地,平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”,而标准差则反映了样本的波动程度、离散程度,即均衡性、稳定性、差异性等.因此,我们可以根据问题的需要选择用样本的不同数字特征来分析问题.一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
注 意 点
<<<
 某中职学校在每年一度的技能大赛中有甲、乙两名同学获得省级比赛一等奖,学校要在甲、乙两名同学中选拔一名同学参加国赛,为了选拔出综合实力最强的选手参加国赛,现抽取甲、乙两名同学在最近8次理论考试与技能考试中的综合成绩,并统计如表:
例 1
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)求甲、乙两名同学的平均成绩;
根据题中数据可知,
甲同学的平均成绩
==85,
乙同学的平均成绩
==85.

(2)从考试发挥的稳定性的角度考虑,你认为选择哪位同学参加国赛更合适?请说明理由.
由(1)可知==85,
甲同学成绩的方差
=×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2
+(84-85)2]
=×[(-3)2+(-4)2+(-6)2+(-7)2+102+32+82+(-1)2]=35.5,
乙同学成绩的方差
=×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+
(85-85)2]

=×[72+102+(-5)2+(-10)2+(-2)2+(-5)2+52+02]=41,
所以<,
因为甲、乙两名同学的平均成绩相同,所以两名同学水平相当.
又因为甲同学成绩的方差小于乙同学成绩的方差,所以甲同学的成绩更加稳定.
所以选择甲同学参加国赛更合适.

在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能反映这组数据特征的一些值,例如上述数据,我们可以从平均数、中位数、百分位数、众数、极差、方差、标准差等角度进行比较.




 (1)(多选)某工厂有甲、乙两条流水线同时生产直径为50 mm的零件,各抽取10个进行测量,其结果如图所示,则以下结论正确的是
跟踪训练 1
A.甲流水线生产的零件直径的极差为
0.4 mm
B.乙流水线生产的零件直径的中位数
为50.0 mm
C.乙流水线生产的零件直径比甲流水线生产的零件直径稳定
D.甲流水线生产的零件直径的平均值小于乙流水线生产的零件直径的平
均值



对于A,甲流水线生产的零件直径的极差为50.2-49.8=0.4(mm),故A正确;
对于B,将乙流水线生产的零件直径按从小到大的顺序排列,排在第5,6个位置的数据均为50.0,故中位数为50.0 mm,故B正确;
对于C,由图易得,乙流水线生产的零件直径比甲流水线生产的零件直径稳定,故C正确;
对于D,计算可得甲、乙流水线生产的零件直径的平均值均为50.0 mm,故D错误.
解析
(2)林管部门在每年3月12日植树节前,为保证树苗的质量,都会对树苗进行检测,现从甲、乙两种树苗中抽测了10株树苗的高度,其茎叶图如图,下列描述正确的是
A.甲种树苗的平均高度高于乙种树苗的平均高度,
且甲种树苗比乙种树苗长得整齐
B.甲种树苗的平均高度高于乙种树苗的平均高度
但乙种树苗比甲种树苗长得整齐
C.乙种树苗的平均高度高于甲种树苗的平均高度,但甲种树苗比乙种树苗长得
整齐
D.乙种树苗的平均高度高于甲种树苗的平均高度,且乙种树苗比甲种树苗长得
整齐

设甲、乙两种树苗的样本平均值分别为,,样本方差分别为,,又由茎叶图中的数据,我们可得甲、乙两种树苗抽取的样本高度分别为
甲:19,20,21,23,25,29,31,32,33,37,
乙:10,10,14,26,27,30,44,46,46,47.
由已知易得,
=×(19+20+21+23+25+29+31+32+33+37)=27,
解析
=×(10+10+14+26+27+30+44+46+46+47)=30,
<,
由茎叶图可知甲种树苗数据比较集中,乙种树苗数据比较分散,所以<.
故乙种树苗的平均高度高于甲种树苗的平均高度,甲种树苗比乙种树苗长得整齐.
解析

分层抽样的平均数、方差
假设第一层抽取m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层抽取n个数,分别为y1,y2,…,yn,平均数为,方差为t2.
如果记样本均值为,样本方差为b2,则
==,
b2=
=.
在分层抽样时,如果总体分为k层,而且第j层抽取的样本量为nj,样本均值为,样本方差为,j=1,2,…,k.记
n=nj,则所有数据的样本均值和方差分别为=(nj),s2=[nj+nj(-)2].
注 意 点
<<<
(多选)某分层抽样中,有关数据如表所示.
例 2
样本量 平均数 方差
第1层 45 4 2
第2层 35 8 1
第3层 10 6 3
则下列叙述正确的是(结果保留两位小数)
A.第1,2层所有数据的均值为5.75
B.第1,2层所有数据的方差为1.50
C.第1,2,3层所有数据的均值约为7.68
D.第1,2,3层所有数据的方差约为5.23


第1,2层所有数据的均值为=×4+×8=5.75,A正确;
第1,2层所有数据的方差为=×+×=5.5,B不正确;
第1,2,3层所有数据的均值为=×4+×8+×6≈5.78,C不正确;
第1,2,3层所有数据的方差约为s2=×+×+×≈5.23,D正确.
解析
运用公式求分层抽样的均值与方差时要注意
(1)清楚公式中各个符号的含义,避免代入数据混乱.
(2)运算要格外仔细,并按要求保留有效小数.




某培训机构在假期招收了A,B两个数学补习班,A班10人,B班30人,经过一周的补习后进行了一次测试,在该测试中,A班的平均成绩为130分,方差为115,B班的平均成绩为110分,方差为215.求在这次测试中全体学生的平均成绩和方差.
跟踪训练 2
依题意=130,=115,
=110,=215,
∴=×130+×110=115,
∴全体学生的平均分为115分.
全体学生成绩的方差为
s2=+(-)2]++(-)2]
=×(115+225)+×(215+25)
=85+180=265.

用样本的分布来估计总体的分布

1.同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,(πi-pi)2=____________________________不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来 .
[(π1-p1)2+(π2-p2)2+…+(πn-pn)2]
越大
2.用样本的分布来估计总体的分布
如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多,特别地,每一组的频率与总体对应的频率相差不会太大.
(课本例2)我国是世界上严重缺水的国家之一,某市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家庭的月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3,4),[4,5]分成5组,制成了如图所示的频率分布直方图.
例 3
(1)求图中a的值;
因为频率分布直方图所有矩形的面积之和为1,
所以(0.12+0.22+0.36+a+0.12)×1=1,解得a=0.18.

(2)设该市有10万个家庭,估计全市月均用水量不低于3 t的家庭数;
抽取的样本中,月均用水量不低于3 t的家庭所占比例为(a+0.12)×1=0.3
=30%,因此估计全市月均用水量不低于3 t的家庭所占比例也为30%,所求家庭数为100 000×30%=30 000.

(3)假设同组中的每个数据都用该组区间的中点值代替,估计全市家庭月均用水量的平均数.
因为0.12×0.5+0.22×1.5+0.36×2.5+0.18×3.5+0.12×4.5=2.46,所以估计全市家庭月均用水量的平均数为2.46.

某校从参加高一年级期末考试的学生中抽出60名,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图中的信息,回答下列问题:
例 3
(1)估计这次考试的物理成绩的众数m与中位数n(结果保留一位小数);
众数是频率分布直方图中最高小矩形底边中点的横坐标,所以众数m=75.0.
前3个小矩形面积之和为0.01×10+0.015×10+0.015×10=0.4<0.5,
前4个小矩形面积之和为0.4+0.03×10=0.7>0.5,
所以中位数n=70+≈73.3.

(2)估计这次考试的物理成绩的及格率(60分及以上为及格)和平均分.
依题意得,60及60以上的分数在第三、四、五、六组,频率和为
(0.015+0.03+0.025+0.005)×10=0.75,
所以估计这次考试的物理成绩的及格率是75%.
利用组中值估算抽样学生的平均分为
45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
则估计这次考试物理成绩的平均分是71分.

利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能比较准确地估计其众数、中位数和平均数.




随着时代不断地进步,人们的生活条件也越来越好,越来越多的人注重自己的身材,其中体脂率是一个很重要的衡量标准.根据一般的成人体准,女性体脂率的正常范围是20%~25%,男性体脂率的正常范围是15%~18%.这一范围适用于大多数成年人,可以帮助判断个体是否存在肥胖的风险.某市有关部门对全市100万名成年女性的体脂率进行一次抽样调查统计,抽取了1 000名成年女性的体脂率作为样本绘制频率分布直方图如图.
跟踪训练3
(1)求a;
由频率分布直方图可得,5×2a+5×0.03+5×0.07+5×6a+5×2a=1,
所以a=0.01.

(2)如果成年女性体脂率为25%~30%属于“偏胖”,体脂率超过30%属于“过胖”,那么全市成年女性“偏胖”“过胖”各约有多少人?
由频率分布直方图可得样本中女性“偏胖”的频率为5×0.06=0.3,
样本中女性“过胖”的频率为5×0.02=0.1,
所以全市成年女性“偏胖”的约有1 000 000×0.3=300 000(人),
全市成年女性 “过胖”的约有1 000 000×0.1=100 000(人).

(3)小王说:“我的体脂率是调查所得数据的中位数.”小张说:“我的体脂率是调查所得数据的平均数.”试估计谁的体脂率更低.
调查所得数据的平均数为12.5×0.1+17.5×0.15+22.5×0.35+27.5×0.3+32.5×0.1=23.25,
设调查所得数据的中位数为x,
因为0.1+0.15=0.25<0.5,0.1+0.15+0.35=0.6>0.5,
所以20所以0.25+(x-20)×0.07=0.5,
所以x=≈23.57,

所以调查所得数据的中位数约为23.57,
所以小王的体脂率约为23.57,小张的体脂率为23.25,
所以小张的体脂率更低.

1.知识清单:
(1)样本的数字特征.
(2)用样本的数字特征估计总体的数字特征.
(3)用样本的分布来估计总体的分布.
2.方法归纳:数据处理.
3.常见误区:样本的数字特征只能估计总体的数字特征,不能替代总体.
随堂演练

1
2
3
4
1.某校学生的男女人数之比为2∶3,按照男女比例通过分层抽样的方法抽到一个样本,样本中男生每天运动时间的平均数为100分钟、女生为80分钟.结合此数据,估计该校全体学生每天运动时间的平均数为
A.98分钟 B.88分钟
C.90分钟 D.85分钟
由题设,若该校男生人数为2n,则女生人数为3n,
∴该校全体学生每天运动时间的平均数为==88(分钟).
解析

1
2
3
4
2.如图是某学校的教研处根据调查结果绘制的本校学生每天放学后的自学时间情况的频率分布直方图.根据频率分布直方图,则自学时间的中位数和众数的估计值分别是(精确到0.01)
A.2.20,2.25 B.2.29,2.20
C.2.29,2.25 D.2.25,2.25

1
2
3
4
由频率分布直方图得,自学时间在[0.5,2)的频率为(0.16+0.2+0.34)×
0.5=0.35,
自学时间在[2,2.5)的频率为0.52×0.5=0.26,
所以自学时间的中位数为
2+×0.5≈2.29,众数为=2.25.
解析
1
2
3
4
3.某校甲、乙两个班共70人(甲班40人,乙班30人)参加了某知识竞赛,甲班的平均成绩为77分,方差为123,乙班的平均成绩为70分,方差为130,则甲、乙两班全部同学的成绩的方差为
A.74 B.128
C.138 D.136

1
2
3
4
由总样本方差公式
s2=[m+n+-)2],
可得甲、乙两班全部同学的成绩的方差为×
=138.
解析
1
2
3
4
4.某中学为了解学生数学课程的学习情况,在2 200名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测这2 200名学生在该次数学考试中成绩不低于80分的学生有    人.
616
2 200×(0.020+0.008)×10=616.
解析
课时对点练

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
题号 1 2 3 4 5 6 7 8
答案 C C C C D D 25% 71
题号 11 12 13 14 答案 A B AC AB
对一对
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
甲机床生产的零件的平均尺寸、方差分别为
=10,=20,
乙机床生产的零件的平均尺寸、方差分别为
=12,=40,
所以100件产品的平均尺寸
===11.2,
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
所以100件产品的方差
s2=×[40+60+×(10-12)2]=×[(40×20+60×40)+24
×4]=32.96.
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(1)由题意知f1=0.001×50=0.05,
f3=0.006×50=0.3,
所以f2=0.5-f1-f3=0.5-0.05-0.3=0.15,
又f5=f2=0.15,f7=f1=0.05,
所以f4+f6=1-(f1+f2+f3+f5+f7)=1-(0.5+0.15+0.05)=0.3,
由于f4=2f6,则f6=0.1.
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)样本中在[150,300)内的频率为f3+f4+f5=0.3+0.2+0.15=0.65,
相应的频数为100×0.65=65.
(3)样本中在[250,400]内的频率为f5+f6+f7=0.15+0.1+0.05=0.3,
估计全校学生一周内参加校志愿者活动的时长不少于250分钟的有
2 000×0.3=600(人).
基础巩固
1.在用样本分布估计总体分布的过程中,下列说法中正确的是
A.样本容量一定时总体容量越大,估计越精确
B.总体容量与估计的精确度无关
C.总体容量一定时样本容量越大,估计越精确
D.总体容量一定时样本容量越小,估计越精确
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
当样本容量越大时,估计总体越精确.
解析

2.有一个容量为66的样本,数据的分组及各组的频数如下:
[11.5,15.5)2,[15.5,19.5)4,[19.5,23.5)9,[23.5,27.5)18, [27.5,31.5)11,[31.5,35.5)12,[35.5,39.5)7,[39.5,43.5)3.
根据样本的频数分布估计大于或等于27.5的数据约占
A. B.
C. D.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由题意知,大于或等于27.5的数据共有11+12+7+3=33,
则约占=.
解析
3.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.估计这次测试数学成绩的平均分为
A.50 B.60
C.72 D.80
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
学生的平均分约为45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×
0.05=72.
解析

4.某校为调查高一年级某次考试的数学成绩情况,选取高一年级甲班和乙班共25名学生进行调查.若甲班学生成绩的平均数为90,方差为3;乙班学生成绩的平均数为85,方差为5,且甲班与乙班的学生人数之比为2∶3,则这25名学生成绩的平均数和方差分别为
A.87,10 B.85,10
C.87,10.2 D.85,10.2
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
甲班与乙班的学生人数之比为2∶3,则甲班有10名学生,乙班有15名学生,
由题意可知这25名学生成绩的平均数为=87,
这25名同学成绩的方差为s2==10.2.
解析
5.某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照[11.5,12),[12,12.5),…,[15.5,16)分成9组,制成了如图所示的频率分布直方图.规定成绩低于13秒为优,成绩高于14.8秒为不达标.由频率分布直方图推断,下列选项错误的是
A.频率分布直方图中a的值为0.40
B.由频率分布直方图估计本校高三男生100米体
能测试成绩的众数为13.75秒
C.由频率分布直方图估计本校高三男生100米体
能测试成绩为优的人数为54
D.由频率分布直方图估计本校高三男生100米体能测试成绩不达标的人数为18
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
0.5×(0.08+0.16+0.30+a+0.52+0.30+0.12+0.08+0.04)=1,解得a=0.40,A选项正确;
众数为=13.75,B选项正确;成绩低于13秒的频率为0.5×(0.08+
0.16+0.30)=0.5×0.54=0.27,人数为200×0.27=54,C选项正确;
成绩高于14.8秒的频率为(15-14.8)×0.12+0.5×(0.08+0.04)=0.084,人数为200×0.084≈17,D选项错误.
解析
6.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如下的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是
A.海水稻根系深度的中位数是45.5 cm
B.普通水稻根系深度的众数是32 cm
C.海水稻根系深度的平均数大于普通
水稻根系深度的平均数
D.普通水稻根系深度的方差小于海水稻根系深度的方差
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
A中,海水稻根系深度的中位数为=45.5(cm),正确;
B中,由茎叶图知普通水稻根系深度的众数是32 cm,正确;
C中,由茎叶图可知海水稻根系深度的平均数为×(38+39+39+…+
51)=45(cm),
普通水稻根系深度的平均数为×(25+27+32+…+45)=35(cm),故海水稻根系深度的平均数大于普通水稻根系深度的平均数,正确;
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
D中,海水稻根系深度的方差为=×[(38-45)2+(39-45)2+…+(51-45)2]
=23.2,
普通水稻根系深度的方差为=×[(25-35)2+(27-35)2+…+(45-35)2]=
35.4,
所以海水稻根系深度的方差小于普通水稻根系深度的方差,错误.
解析
7.抽样调查某地区120名教师的年龄和学历状况,情况如图所示,则估计该地区35岁以下具有研究生学历的教师所占的百分比为    .
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
25%
由题可知,35岁以下教师的总人数为
50÷62.5%=80,
∴35岁以下具有研究生学历的教师人数为
80-50=30,
故估计该地区35岁以下具有研究生学历的教师所占的百分比为×
100%=25%.
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
8.某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试数学成绩的平均分为    .
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
71
在频率分布直方图中,所有小长方形的面积和为1,设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,
解得x=0.3,即该组频率为0.3,所以本次考试数学成绩的平均分为45×
0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
9.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从甲、乙生产的零件中分别抽取40件、60件,甲的平均尺寸为10,方差为20,乙的平均尺寸为12,方差为40.那么全部100件产品的平均尺寸和方差分别是多少?
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
甲机床生产的零件的平均尺寸、方差分别为
=10,=20,
乙机床生产的零件的平均尺寸、方差分别为
=12,=40,
所以100件产品的平均尺寸
===11.2,

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
所以100件产品的方差
s2=×[40+60+×(10-12)2]=×[(40×20+60×40)+24×4]
=32.96.

10.为调查某校学生参加校志愿者活动的情况,现抽取一个容量为100的样本,统计了这些学生一周内参加校志愿者活动的时长,并绘制了如图所示的频率分布直方图,记数据分布在[50,100),[100,150),[150,200),[200,250),[250,300),[300,350),[350,400]的频率分别为f1,f2,…,f7.已知f1+f2+f3=0.5,f4=2f6.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(1)求f2,f6的值;
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由题意知f1=0.001×50=0.05,
f3=0.006×50=0.3,
所以f2=0.5-f1-f3=0.5-0.05-0.3=0.15,
又f5=f2=0.15,f7=f1=0.05,
所以f4+f6=1-(f1+f2+f3+f5+f7)=1-(0.5+0.15+0.05)=0.3,
由于f4=2f6,则f6=0.1.

(2)求样本中在[150,300)内的频数;
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
样本中在[150,300)内的频率为f3+f4+f5=0.3+0.2+0.15=0.65,
相应的频数为100×0.65=65.

(3)若全校共有2 000名学生,请根据样本数据估计全校学生一周内参加校志愿者活动的时长不少于250分钟的人数.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
样本中在[250,400]内的频率为f5+f6+f7=0.15+0.1+0.05=0.3,
估计全校学生一周内参加校志愿者活动的时长不少于250分钟的有
2 000×0.3=600(人).

11.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确的结论是
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次的总体平均数与标准值接近程度相同
D.两个批次的总体平均数与标准值接近程度不能确定
综合运用
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14

计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
12.为了了解某校学生的视力情况,随机抽查了该校100名学生的视力,得到如图所示的频率分布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.设最大频率为a,视力在4.5到5.2之间的学生人数为b,则a,b的值分别为
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
A.0.27,0.96 B.0.27,96
C.27,0.96 D.27,96

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由频率分布直方图知组距为0.1,由前4组的频数和为40,后6组的频数和为87,知第4组的频数为40+87-100=27,即视力在4.6到4.7之间的频数最大,为27,故最大频率a=0.27.视力在4.5到5.2之间的频率为1-0.01-0.03=0.96,故视力在4.5到5.2之间的学生人数b=0.96×100=96.
解析
13.(多选)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的柱形图,下列结论正确的是
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
A.甲地该月14时的平均气温低于乙地该月14时的平均气温
B.甲地该月14时的平均气温高于乙地该月14时的平均气温
C.甲地该月14时的气温的极差大于乙地该月14时的气温的极差
D.甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差


答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
甲地数据为26,28,29,31,31;乙地数据为28,29,30,31,32.
所以==29,
==30,甲地气温的极差为31-26=5,乙地气温的极差为32-28=4.因为=×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=
3.6,=×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2,所以s甲=,s乙=,所以s甲>s乙.
解析
14.(多选)某省2024年美术联考约有5 000名学生参加,现从考试的科目素描中随机抽取了500名考生的考试成绩(满分100分),记录他们的分数后,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图,则下列说法不正确的是
A.由频率分布直方图可知,全省考生的该项科目分
数均不高于90分
B.用样本估计总体,全省该项科目分数低于70分的考生约为3 000人
C.若样本中分数低于40分的考生有30人,则可估计总体中分数在区间[40,50)内的约
200人
D.用样本估计总体,全省考生该项科目分数的80%分位数为80
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
拓广探究


答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
对于A,由题意可知,在500个样本中,该项科目分数均不高于90分,
样本可以用来估计总体,但不能代替总体,在其余考生该项科目的成绩中可能有高于90分的,故A不正确;
对于B,在样本中,分数不低于70分的频率为(0.04+0.02)×10=0.6,
则样本中分数低于70分的频率为0.4,若用样本估计总体,
则全省该项科目分数低于70分的考生约为5 000×0.4=2 000(人),故B不正确;
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
对于C,在样本中,成绩低于50分的频率为1-(0.04+2×0.02+0.01)×10
=0.1,
当样本分数低于40分的考生有30人时,其频率为=0.06,
则样本中分数在区间[40,50)内的频率为0.04,用样本估计总体,
则全省考生中分数在区间[40,50)内的约为5 000×0.04=200(人),故C正确;
对于D,因为第七组的频率为0.02×10=0.2,所以用样本估计总体,
全省考生该项科目分数的80%分位数为80,故D正确.
解析
第五章 §5.1 统计
<<<

展开更多......

收起↑

资源列表