2025届高中数学一轮复习:第九章9.2 用样本估计总体(课件+讲义+练习四份打包)

资源下载
  1. 二一教育资源

2025届高中数学一轮复习:第九章9.2 用样本估计总体(课件+讲义+练习四份打包)

资源简介

(共80张PPT)
第九章
§9.2 用样本估计总体
课标要求
1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.
2.能用数字特征估计总体集中趋势和总体离散程度.
内容索引
第一部分 落实主干知识
第二部分 探究核心题型
课时精练
第一部分
落实主干知识
1.百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少有(100-p)%的数据_____
这个值.
p%
大于
或等于
2.平均数、中位数和众数
(1)平均数: = .
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最_____
的一个数据(当数据个数是奇数时)或最中间两个数据的 (当数据个数是偶数时).
(3)众数:一组数据中出现次数 的数据(即频数最大值所对应的样本数据).
中间
平均数
最多
3.方差和标准差
(1)方差:s2= 或
(2)标准差:s= .
4.总体方差和总体标准差
1.若x1,x2,…,xn的平均数为 ,那么mx1+a,mx2+a,…,mxn+a的平均数为 +a.
2.数据x1,x2,…,xn与数据x1′=x1+a,x2′=x2+a,…,xn′=xn+a 的方差相等,即数据经过平移后方差不变.
3.若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.(  )
(2)方差与标准差具有相同的单位.(  )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(  )
(4)在频率分布直方图中,可以用最高的小长方形底边中点的横坐标作为众数的估计值.(  )
×
×


2.在下列统计量中,用来描述一组数据离散程度的量是
A.平均数 B.众数
C.百分位数 D.标准差

标准差反映了数据分散程度的大小,所以说标准差是用来描述一组数据离散程度的统计量,故D正确.
3.甲、乙、丙、丁四人参加射击项目选拔赛,成绩如下,则他们中参加奥运会的最佳人选是______.
甲 乙 丙 丁
平均环数 8.5 8.8 8.8 8
方差 3.5 3.5 2.1 8.7

由平均数及方差的定义知,丙的平均成绩较高且较稳定,是最佳人选.
4.有一组数据:-1,a,-2,3,4,2,它们的中位数是1,则这组数据的平均数是______.
1
数据-1,a,-2,3,4,2,已知除a以外的数据从小到大排序为-2,-1,2,3,4,要使得中位数为1,则a在第3位或第4位,
返回
第二部分
探究核心题型
题型一 样本的数字特征的估计
例1 (1)(多选)(2023·荆门联考)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了30名党员,对他们一周的党史学习时间进行了统计,统计数据如下.则下列对该单位党员一周学习党史时间的叙述,正确的有
党史学习时间(小时) 7 8 9 10 11
党员人数 4 8 7 6 5
A.众数是8 B.第40百分位数为8
C.平均数是9 D.中位数是9



由题意,随机抽取30名党员,
由表可知,党史学习时间为8小时的人最多,为8人,故众数是8,故A正确;
因为共有30名党员,故中位数为第15项和第16项的平均数,因为第15项和第16项均为9,故中位数为9,故D正确.
(2)(多选)(2023·新高考全国Ⅰ)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差


取x1=1,x2=x3=x4=x5=2,x6=9,
根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;
根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.
计算一组n个数据第p百分位数的步骤
跟踪训练1 (1)(多选)(2023·商丘模拟)在某次演讲比赛中,由两个评委小组(分别为专业人士“小组A”和观众代表“小组B”)给参赛选手打分,根据两个评委小组给同一名选手打分的分值绘制
成如图所示的折线图,则下列结论正确的是
A.小组A打分的分值的平均数为48
B.小组B打分的分值的中位数为66
C.小组A打分的分值的极差大于小组B打分的分值的极差
D.小组A打分的分值的方差小于小组B打分的分值的方差



由图可知,小组A打分的平均数为 ×(43+47+46+48+50+47+54+50+47)=48,故A正确;
将小组B打分从小到大排列为36,55,58,62,66,
68,68,70,75,所以中位数为66,故B正确;
小组A打分的分值的极差为54-43=11,小组B打分的分值的极差为75-36=39,故C错误;
小组A打分的分值相对更集中,所以小组A打分的分值的方差小于小组B打分的分值的方差,故D正确.
(2)某小组成员的年龄分布茎叶图如图所示,则该小组成员年龄的第25百分位数是________.
32.5
由茎叶图知数据从小到大排列为27,28,32,33,36,36,38,40,45,52,54,58,
因为12×25%=3,
题型二 总体集中趋势的估计
例2 2024年,安徽、甘肃、广西、贵州、黑龙江、吉林、江西七省区作为第四批实施改革的省份进入新高考.2023年10月,进入新高考的七个省份相继公布了高考选考科目的试卷结构.某考试机构举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基
计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.
(1)求出图中a的值并估计本次考试的及格率(“及格率”指得分为90分及以上的学生所占比例);
由频率分布直方图的性质,可得(a+0.004+0.013+0.014+0.016)×20=1,
解得a=0.003.
所以及格率为(0.016+0.014+0.003)×20=0.66=66%.
(2)估计该校学生联考数学成绩的第80百分位数;
得分在110以下的学生所占比例为(0.004+0.013+0.016)×20=0.66,
得分在130以下的学生所占比例为0.66+0.014×20=0.94,
所以第80百分位数位于[110,130)内,
(3)估计该校学生联考数学成绩的众数、平均数.
由图可得,众数的估计值为100.
平均数的估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6.
频率分布直方图中的数字特征
(1)众数:最高矩形的底边中点的横坐标.
(2)中位数:中位数左边和右边的矩形的面积和应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
跟踪训练2 某市共有居民60万人,为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求a的值,并估计该市居民月均
用水量不少于3吨的人数;
由频率分布直方图,可知(0.04+0.08×2+0.12+0.16+2a+0.42+0.50)×0.5=1,
解得a=0.3;
月均用水量不少于3吨的人数为(0.12+0.08+0.04)×0.5×60×104=72 000.
(2)估计该市居民月均用水量的众数和中位数.
由图可估计众数为2.25;
设中位数为x,
因为前5组的频率之和为0.04+0.08+
0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2由0.50(x-2)=0.5-0.48,可得x=2.04,
故居民月均用水量的中位数为2.04.
题型三 总体离散程度的估计
例3 (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10).
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
试验结果如下:
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为 ,样本方差为s2.
(1)求 ,s2;
由题意得zi=xi-yi 的值分别为9,6,8,-8,15,11,19,18,20,12,
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
总体离散程度的估计
标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.
跟踪训练3 (2024·江门模拟)某果园试种了A,B两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记A,B两个品种各10棵产量的平均数分别为
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
(1)分别求这两个品种产量的极差和中位数;
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
这10棵A品种桃树的产量从小到大分别为30,40,50,50,60,60,70,70,80,90,
这10棵A品种桃树产量的极差为90-30=60,
这10棵B品种桃树产量从小到大分别为20,40,50,50,60,60,70,80,80,80,
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
这10棵B品种桃树产量的极差为80-20=60,
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
由(1)可知这两个品种极差和中位数都相等,
则A品种桃树平均产量高,波动小,
所以应该选种A品种桃树.
返回
课时精练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
一、单项选择题
1.某鞋店试销一种新款女鞋,销售情况如表:
鞋号 34 35 36 37 38 39 40 41
日销量/双 2 5 9 16 9 5 3 2
如果你是鞋店经理,那么下列统计量中对你来说最重要的是
A.平均数 B.众数
C.中位数 D.极差

1
2
3
4
5
6
7
8
9
10
11
12
13
14
鞋号 34 35 36 37 38 39 40 41
日销量/双 2 5 9 16 9 5 3 2
鞋店经理最关心的是哪个鞋号的鞋销量最大,由表可知,鞋号为37的鞋销量最大,共销售了16双,所以这组数据最重要的是众数.
2.(2023·唐山模拟)某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为
A.220   B.240   C.250   D.300

1
2
3
4
5
6
7
8
9
10
11
12
13
14
由1 200×80%=960(人),
所以小于103分的学生最多有960人,
所以大于或等于103分的学生有1 200-960=240(人).
3.(2024·南通模拟)为宣传我国第三艘航空母舰“中国人民解放军海军福建舰”正式服役,增强学生的国防意识,某校组织1 000名学生参加了“逐梦深蓝,山河荣耀”国防知识竞赛,从中随机抽取20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,
则下列说法正确的是
A.频率分布直方图中a的值为0.004
B.估计这20名学生考试成绩的第60百分位数为75
C.估计这20名学生数学考试成绩的众数为80
D.估计总体中成绩落在[60,70)内的学生人数为150

1
2
3
4
5
6
7
8
9
10
11
12
13
14
由频率分布直方图可得10×(2a+3a+7a+
6a+2a)=1,
解得a=0.005,故A错误;
前三个矩形面积为(2a+3a+7a)×10=0.6,
即第60百分位数为80,故B错误;
总体中成绩落在[60,70)内的学生人数为3a×10×1 000=150,故D正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
4.(2023·长沙模拟)为调查某地区中学生每天睡眠时间,采用按比例分配的分层随机抽样的方法,现抽取初中生800 人,其每天睡眠时间的平均数为9小时,方差为1,抽取高中生1 200人,其每天睡眠时间的平均数为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为
A.0.94   B.0.96   C.0.75   D.0.78
1
2
3
4
5
6
7
8
9
10
11
12
13
14

1
2
3
4
5
6
7
8
9
10
11
12
13
14
5.(2023·南昌模拟)在统计中,月度同比是指本月和上一年同月相比较的增长率,月度环比是指本月和上一个月相比较的增长率,如图是2022年1月至2022年12月我国居民消费价格月度涨跌幅度统计图,则以下说法错误的是
A.在这12个月中,我国居民消费价格月度
 同比数据的中位数为2.1%
B.在这12个月中,月度环比数据为正数的
 个数比月度环比数据为负数的个数多3
C.在这12个月中,我国居民消费价格月度
 同比数据的平均数为1.85%
D.在这12个月中,我国居民消费价格月度环比数据的众数为0.0%

1
2
3
4
5
6
7
8
9
10
11
12
13
14
在这12个月中,我国居民消费价格月度同比数据由小到大依次为0.9%,0.9%,1.5%,1.6%,1.8%,2.1%,2.1%,2.1%,2.5%,2.5%,2.7%,2.8%,
平均数为 ×(0.9%+0.9%+1.5%+1.6%+1.8%+2.1%+2.1%+2.1%
+2.5%+2.5%+2.7%+2.8%)≈1.958%,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由数据可知我国居民消费价格月度环比的数据中,
有6个月的数据为正数,3个月的数据为0.0%,3个月的数据为负数,
所以月度环比数据为正数的个数
比月度环比数据为负数的个数多3,且0.0%出现次数最多,故众数为0.0%,故A,B,D正确,C错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
6.四名同学各掷骰子5次,分别记录每次骰子向上的点数,根据四名同学的统计结果,可以判断一定没有出现点数6的是
A.平均数为2,方差为2.4
B.中位数为3,方差为1.6
C.中位数为3,众数为2
D.平均数为3,中位数为2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
A选项,若5次结果中有6,
因为3.2>2.4,则当平均数为2,方差为2.4时,一定不会出现点数6,故A正确;
B选项,若5个点数为3,3,3,5,6,则此时满足中位数为3,平均数为4,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
C选项,取5个点数为2,2,3,5,6,满足中位数为3,众数为2,故C错误;
D选项,取5个点数为1,1,2,5,6,满足中位数为2,平均数为3,故D错误.
二、多项选择题
7.(2023·潮州模拟)根据气象学上的标准,如果连续5天的日平均气温都低于10 ℃即为入冬.现将连续5天的日平均气温的记录数据(记录数据都是自然数)作为一组样本,则下列样本中一定符合入冬指标的有
A.平均数小于4
B.平均数小于4且极差小于或等于3
C.平均数小于4且标准差小于或等于4
D.众数等于5且极差小于或等于4


1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
举反例,如0,0,0,0,15,平均数为3小于4,但不符合入冬标准,故A错误;
假设有数据大于或等于10,由极差小于或等于3知,此组数据最小值大于或等于7,与平均值小于4矛盾,故假设不成立,故B正确;
举反例,如1,1,1,1,11,平均数为3,且标准差为4,但不符合入冬标准,故C错误;
众数等于5且极差小于或等于4时,最大数不超过9,故D正确.
8.已知数据x1,x2,…,x9成公差大于0的等差数列,若去掉数据x5,则
A.极差不变 B.第25百分位数变大
C.平均数不变 D.方差变小
1
2
3
4
5
6
7
8
9
10
11
12
13
14


选项A,根据极差的定义,原数据的极差为x9-x1,去掉x5后的极差为x9-x1,即极差不变,故A正确;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
三、填空题
9.(2023·惠州模拟)数据68,70,80,88,89,90,96,98的第75百分位数为______.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
93
1
2
3
4
5
6
7
8
9
10
11
12
13
14
10.(2023·黔西模拟)若样本数据x1,x2,…,x10的标准差为3,则数据2x1-1,2x2-1,…,2x10-1的标准差为______.
6
因为样本数据x1,x2,…,x10的标准差为3,
故样本数据x1,x2,…,x10的方差为9,
则数据2x1-1,2x2-1,…,2x10-1的方差为22×9=36,
故数据2x1-1,2x2-1,…,2x10-1的标准差为6.
11.(2023·济南模拟)某射击运动员连续射击5次,命中的环数(环数为整数)形成一组数据,这组数据的中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为________.
7.8
依题意,这组数据一共有5个数,中位数为8,则从小到大排列,8的前面有2个数,后面也有2个数,又唯一的众数为9,则有两个9,其余数字均只出现一次,则最大数字为9,又极差为3,所以最小数字为6,所以这组数据为6,7,8,9,9,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
12.(2024·杭州模拟)已知一组样本数据共有9个数,其平均数为8,方差为12.将这组样本数据增加一个数据后,所得新的样本数据的平均数为9,则新的样本数据的方差为________.
19.8
设增加的数为k,原来的9个数分别为a1,a2,…,a9,
则a1+a2+…+a9=72,a1+a2+…+a9+k=90,
所以k=18,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
四、解答题
13.(2023·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)求两位学生预赛成绩的平均数和方差;
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
甲的成绩较稳定,所以派甲参赛比较合适.
14.(2024·凉山统考)某校为了提高学生对体育运动的兴趣,举办了一场体育知识答题比赛活动,共有1 000名学生参加了此次答题活动.为了解本次比赛的成绩,从中抽取了100名学生的得分(得分均为整数,满分为100分)进行统计,所有学生的得分都不低于60分,将这100名学生的得分进行分组,第一组[60,70),第二组[70,80),第三组[80,90),
第四组[90,100](单位:分),得到如右的频率分
布直方图.
(1)求图中m的值,并估计此次竞赛活动学生得
分的中位数;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由频率分布直方图知,(m+0.03+0.04+0.02)×10=1,解得m=0.01,
设此次竞赛活动学生得分的中位数为x0,由数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,
可得80解得x0=82.5,
所以估计此次竞赛活动学生得分的中位数为82.5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)根据频率分布直方图,估计此次竞赛活动得分的平均值.若对得分不低于平均值的同学进行奖励,请估计参赛的学生中有多少名学生获奖.(以每组中点值作为该组数据的代表)
由频率分布直方图及(1)知,数据落在[60,70),[70,80),[80,90),[90,100]的频率分别为0.1,
0.3,0.4,0.2,
所以估计此次竞赛活动得分的平均值为82,在参赛的1 000名学生中估计有520名学生获奖.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
返回§9.2 用样本估计总体
课标要求 1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.
知识梳理
1.百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.平均数、中位数和众数
(1)平均数:=(x1+x2+…+xn).
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).
(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).
3.方差和标准差
(1)方差:s2=(xi-)2或-2.
(2)标准差:s=.
4.总体方差和总体标准差
(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则总体方差S2=(Yi-)2.
(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=i(Yi-)2.
常用结论
1.若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+a.
2.数据x1,x2,…,xn与数据x1′=x1+a,x2′=x2+a,…,xn′=xn+a 的方差相等,即数据经过平移后方差不变.
3.若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.
自主诊断
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( × )
(2)方差与标准差具有相同的单位.( × )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( √ )
(4)在频率分布直方图中,可以用最高的小长方形底边中点的横坐标作为众数的估计值.
( √ )
2.在下列统计量中,用来描述一组数据离散程度的量是(  )
A.平均数 B.众数
C.百分位数 D.标准差
答案 D
解析 标准差反映了数据分散程度的大小,所以说标准差是用来描述一组数据离散程度的统计量,故D正确.
3.甲、乙、丙、丁四人参加射击项目选拔赛,成绩如下,则他们中参加奥运会的最佳人选是______.
甲 乙 丙 丁
平均环数 8.5 8.8 8.8 8
方差 3.5 3.5 2.1 8.7
答案 丙
解析 由平均数及方差的定义知,丙的平均成绩较高且较稳定,是最佳人选.
4.有一组数据:-1,a,-2,3,4,2,它们的中位数是1,则这组数据的平均数是________.
答案 1
解析 数据-1,a,-2,3,4,2,已知除a以外的数据从小到大排序为-2,-1,2,3,4,要使得中位数为1,则a在第3位或第4位,即=1,a=0,经检验符合题意,
所以这组数据的平均数是=1.
题型一 样本的数字特征的估计
例1 (1)(多选)(2023·荆门联考)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了30名党员,对他们一周的党史学习时间进行了统计,统计数据如下.则下列对该单位党员一周学习党史时间的叙述,正确的有(  )
党史学习时间(小时) 7 8 9 10 11
党员人数 4 8 7 6 5
A.众数是8 B.第40百分位数为8
C.平均数是9 D.中位数是9
答案 ACD
解析 由题意,随机抽取30名党员,
由表可知,党史学习时间为8小时的人最多,为8人,故众数是8,故A正确;
因为30×40%=12,第40百分位数为=8.5,故B错误;
平均数为×(7×4+8×8+9×7+10×6+11×5)=9,故C正确;
因为共有30名党员,故中位数为第15项和第16项的平均数,因为第15项和第16项均为9,故中位数为9,故D正确.
(2)(多选)(2023·新高考全国Ⅰ)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(  )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
答案 BD
解析 取x1=1,x2=x3=x4=x5=2,x6=9,
则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为=,故A,C均不正确;
根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;
根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.
思维升华 计算一组n个数据第p百分位数的步骤
跟踪训练1 (1)(多选)(2023·商丘模拟)在某次演讲比赛中,由两个评委小组(分别为专业人士“小组A”和观众代表“小组B”)给参赛选手打分,根据两个评委小组给同一名选手打分的分值绘制成如图所示的折线图,则下列结论正确的是(  )
A.小组A打分的分值的平均数为48
B.小组B打分的分值的中位数为66
C.小组A打分的分值的极差大于小组B打分的分值的极差
D.小组A打分的分值的方差小于小组B打分的分值的方差
答案 ABD
解析 由图可知,小组A打分的平均数为×(43+47+46+48+50+47+54+50+47)=48,故A正确;
将小组B打分从小到大排列为36,55,58,62,66,68,68,70,75,所以中位数为66,故B正确;
小组A打分的分值的极差为54-43=11,小组B打分的分值的极差为75-36=39,故C错误;
小组A打分的分值相对更集中,所以小组A打分的分值的方差小于小组B打分的分值的方差,故D正确.
(2)某小组成员的年龄分布茎叶图如图所示,则该小组成员年龄的第25百分位数是________.
答案 32.5
解析 由茎叶图知数据从小到大排列为27,28,32,33,36,36,38,40,45,52,54,58,
因为12×25%=3,
所以第25百分位数是=32.5.
题型二 总体集中趋势的估计
例2 2024年,安徽、甘肃、广西、贵州、黑龙江、吉林、江西七省区作为第四批实施改革的省份进入新高考.2023年10月,进入新高考的七个省份相继公布了高考选考科目的试卷结构.某考试机构举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.
(1)求出图中a的值并估计本次考试的及格率(“及格率”指得分为90分及以上的学生所占比例);
(2)估计该校学生联考数学成绩的第80百分位数;
(3)估计该校学生联考数学成绩的众数、平均数.
解 (1)由频率分布直方图的性质,可得(a+0.004+0.013+0.014+0.016)×20=1,
解得a=0.003.
所以及格率为(0.016+0.014+0.003)×20=0.66=66%.
(2)得分在110以下的学生所占比例为(0.004+0.013+0.016)×20=0.66,
得分在130以下的学生所占比例为0.66+0.014×20=0.94,
所以第80百分位数位于[110,130)内,
由110+20×=120,估计第80百分位数为120.
(3)由图可得,众数的估计值为100.
平均数的估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6.
思维升华 频率分布直方图中的数字特征
(1)众数:最高矩形的底边中点的横坐标.
(2)中位数:中位数左边和右边的矩形的面积和应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
跟踪训练2 某市共有居民60万人,为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求a的值,并估计该市居民月均用水量不少于3吨的人数;
(2)估计该市居民月均用水量的众数和中位数.
解 (1)由频率分布直方图,可知(0.04+0.08×2+0.12+0.16+2a+0.42+0.50)×0.5=1,
解得a=0.3;
月均用水量不少于3吨的人数为(0.12+0.08+0.04)×0.5×60×104=72 000.
(2)由图可估计众数为2.25;
设中位数为x,
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2由0.50(x-2)=0.5-0.48,可得x=2.04,
故居民月均用水量的中位数为2.04.
题型三 总体离散程度的估计
例3 (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10).试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
解 (1)由题意得zi=xi-yi 的值分别为9,6,8,-8,15,11,19,18,20,12,
则=×(9+6+8-8+15+11+19+18+20+12)=11,
s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.
(2)由(1)知,=11,2=2=,
故有≥2,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
思维升华 总体离散程度的估计
标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.
跟踪训练3 (2024·江门模拟)某果园试种了 A,B两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记A,B两个品种各10棵产量的平均数分别为和,方差分别为s和s.
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
(1)分别求这两个品种产量的极差和中位数;
(2)求,,s,s;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
解 (1)这10棵A品种桃树的产量从小到大分别为30,40,50,50,60,60,70,70,80,90,
这10棵A品种桃树产量的极差为90-30=60,
中位数为=60,
这10棵B品种桃树产量从小到大分别为
20,40,50,50,60,60,70,80,80,80,
这10棵B品种桃树产量的极差为80-20=60,
中位数为=60.
(2)=×(30+40+50+50+60+60+70+70+80+90)=60,
=×(20+40+50+50+60+60+70+80+80+80)=59,
s=×[(30-60)2+(40-60)2+(50-60)2+(50-60)2+(60-60)2+(60-60)2+(70-60)2+(70-60)2+(80-60)2+(90-60)2]
=300,
s=×[(20-59)2+(40-59)2+(50-59)2+(50-59)2+(60-59)2+(60-59)2+(70-59)2+(80-59)2+(80-59)2+(80-59)2]=349.
(3)由(1)可知这两个品种极差和中位数都相等,
由(2)可知>,s则A品种桃树平均产量高,波动小,
所以应该选种A品种桃树.
课时精练
一、单项选择题
1.某鞋店试销一种新款女鞋,销售情况如表:
鞋号 34 35 36 37 38 39 40 41
日销量/双 2 5 9 16 9 5 3 2
如果你是鞋店经理,那么下列统计量中对你来说最重要的是(  )
A.平均数 B.众数
C.中位数 D.极差
答案 B
解析 鞋店经理最关心的是哪个鞋号的鞋销量最大,由表可知,鞋号为37的鞋销量最大,共销售了16双,所以这组数据最重要的是众数.
2.(2023·唐山模拟)某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为(  )
A.220 B.240 C.250 D.300
答案 B
解析 由1 200×80%=960(人),
所以小于103分的学生最多有960人,
所以大于或等于103分的学生有1 200-960=240(人).
3.(2024·南通模拟)为宣传我国第三艘航空母舰“中国人民解放军海军福建舰”正式服役,增强学生的国防意识,某校组织1 000名学生参加了“逐梦深蓝,山河荣耀”国防知识竞赛,从中随机抽取20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是(  )
A.频率分布直方图中a的值为0.004
B.估计这20名学生考试成绩的第60百分位数为75
C.估计这20名学生数学考试成绩的众数为80
D.估计总体中成绩落在[60,70)内的学生人数为150
答案 D
解析 由频率分布直方图可得
10×(2a+3a+7a+6a+2a)=1,
解得a=0.005,故A错误;
前三个矩形面积为(2a+3a+7a)×10=0.6,
即第60百分位数为80,故B错误;
估计这二十人的众数为=75,故C错误;
总体中成绩落在[60,70)内的学生人数为3a×10×1 000=150,故D正确.
4.(2023·长沙模拟)为调查某地区中学生每天睡眠时间,采用按比例分配的分层随机抽样的方法,现抽取初中生800 人,其每天睡眠时间的平均数为9小时,方差为1,抽取高中生1 200人,其每天睡眠时间的平均数为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为(  )
A.0.94 B.0.96 C.0.75 D.0.78
答案 A
解析 该地区中学生每天睡眠时间的平均数为
×9+×8=8.4(小时),
该地区中学生每天睡眠时间的方差为
×[1+(9-8.4)2]+×[0.5+(8-8.4)2]=0.94.
5.(2023·南昌模拟)在统计中,月度同比是指本月和上一年同月相比较的增长率,月度环比是指本月和上一个月相比较的增长率,如图是2022年1月至2022年12月我国居民消费价格月度涨跌幅度统计图,则以下说法错误的是(  )
A.在这12个月中,我国居民消费价格月度同比数据的中位数为2.1%
B.在这12个月中,月度环比数据为正数的个数比月度环比数据为负数的个数多3
C.在这12个月中,我国居民消费价格月度同比数据的平均数为1.85%
D.在这12个月中,我国居民消费价格月度环比数据的众数为0.0%
答案 C
解析 在这12个月中,我国居民消费价格月度同比数据由小到大依次为0.9%,0.9%,1.5%,1.6%,1.8%,2.1%,2.1%,2.1%,2.5%,2.5%,2.7%,2.8%,
中位数为=2.1%,
平均数为×(0.9%+0.9%+1.5%+1.6%+1.8%+2.1%+2.1%+2.1%+2.5%+2.5%+2.7%+2.8%)≈1.958%,
由数据可知我国居民消费价格月度环比的数据中,
有6个月的数据为正数,3个月的数据为0.0%,3个月的数据为负数,
所以月度环比数据为正数的个数比月度环比数据为负数的个数多3,且0.0%出现次数最多,故众数为0.0%,故A,B,D正确,C错误.
6.四名同学各掷骰子5次,分别记录每次骰子向上的点数,根据四名同学的统计结果,可以判断一定没有出现点数6的是(  )
A.平均数为2,方差为2.4
B.中位数为3,方差为1.6
C.中位数为3,众数为2
D.平均数为3,中位数为2
答案 A
解析 A选项,若5次结果中有6,因为平均数为2,则方差s2>×(2-6)2=3.2,因为3.2>2.4,则当平均数为2,方差为2.4时,一定不会出现点数6,故A正确;
B选项,若5个点数为3,3,3,5,6,则此时满足中位数为3,平均数为4,则方差s2=×[(3-4)2×3+(5-4)2+(6-4)2]=1.6,故B错误;
C选项,取5个点数为2,2,3,5,6,满足中位数为3,众数为2,故C错误;
D选项,取5个点数为1,1,2,5,6,满足中位数为2,平均数为3,故D错误.
二、多项选择题
7.(2023·潮州模拟)根据气象学上的标准,如果连续5天的日平均气温都低于10 ℃即为入冬.现将连续5天的日平均气温的记录数据(记录数据都是自然数)作为一组样本,则下列样本中一定符合入冬指标的有(  )
A.平均数小于4
B.平均数小于4且极差小于或等于3
C.平均数小于4且标准差小于或等于4
D.众数等于5且极差小于或等于4
答案 BD
解析 举反例,如0,0,0,0,15,平均数为3小于4,但不符合入冬标准,故A错误;
假设有数据大于或等于10,由极差小于或等于3知,此组数据最小值大于或等于7,与平均值小于4矛盾,故假设不成立,故B正确;
举反例,如1,1,1,1,11,平均数为3,且标准差为4,但不符合入冬标准,故C错误;
众数等于5且极差小于或等于4时,最大数不超过9,故D正确.
8.已知数据x1,x2,…,x9成公差大于0的等差数列,若去掉数据x5,则(  )
A.极差不变 B.第25百分位数变大
C.平均数不变 D.方差变小
答案 AC
解析 选项A,根据极差的定义,原数据的极差为x9-x1,去掉x5后的极差为x9-x1,即极差不变,故A正确;
选项B,原数据的第25百分位数为x3,去掉x5后的第25百分位数为(x2+x3)选项C,原数据的平均数为=x5,去掉x5后的平均数为=(x1+…+x4+x6+…+x9)=×=x5=,即平均数不变,故C正确;
选项D,原数据的方差为s2=[(x1-x5)2+(x2-x5)2+…+(x9-x5)2],去掉x5后的方差为s′2=[(x1-x5)2+(x2-x5)2+…+(x4-x5)2+(x6-x5)2+…+(x9-x5)2],故s2三、填空题
9.(2023·惠州模拟)数据68,70,80,88,89,90,96,98的第75百分位数为________.
答案 93
解析 因为8×75%=6,根据百分位数的定义可知,该数学成绩的第75百分位数为第6个数和第7个数的平均数为=93.
10.(2023·黔西模拟)若样本数据x1,x2,…,x10的标准差为3,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.
答案 6
解析 因为样本数据x1,x2,…,x10的标准差为3,
故样本数据x1,x2,…,x10的方差为9,
则数据2x1-1,2x2-1,…,2x10-1的方差为22×9=36,
故数据2x1-1,2x2-1,…,2x10-1的标准差为6.
11.(2023·济南模拟)某射击运动员连续射击5次,命中的环数(环数为整数)形成一组数据,这组数据的中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为________.
答案 7.8
解析 依题意,这组数据一共有5个数,中位数为8,则从小到大排列,8的前面有2个数,后面也有2个数,又唯一的众数为9,则有两个9,其余数字均只出现一次,则最大数字为9,又极差为3,所以最小数字为6,所以这组数据为6,7,8,9,9,所以平均数为=7.8.
12.(2024·杭州模拟)已知一组样本数据共有9个数,其平均数为8,方差为12.将这组样本数据增加一个数据后,所得新的样本数据的平均数为9,则新的样本数据的方差为________.
答案 19.8
解析 设增加的数为k,原来的9个数分别为a1,a2,…,a9,
则a1+a2+…+a9=72,a1+a2+…+a9+k=90,
所以k=18,
又因为(ai-8)2=12,即(ai-8)2=108,
所以[(ai-9)2+(k-9)2]=[(ai-8)2-2(ai-8)+9+81]=19.8.
四、解答题
13.(2023·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)求两位学生预赛成绩的平均数和方差;
(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.
解 (1)甲=×(82+81+79+78+95+88+93+84)=85,
乙=×(92+95+80+75+83+80+90+85)=85,
s=×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,
s=×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.
(2)由(1)知甲=乙,s甲的成绩较稳定,所以派甲参赛比较合适.
14.(2024·凉山统考)某校为了提高学生对体育运动的兴趣,举办了一场体育知识答题比赛活动,共有1 000名学生参加了此次答题活动.为了解本次比赛的成绩,从中抽取了100名学生的得分(得分均为整数,满分为100分)进行统计,所有学生的得分都不低于60分,将这100名学生的得分进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100](单位:分),得到如下的频率分布直方图.
(1)求图中m的值,并估计此次竞赛活动学生得分的中位数;
(2)根据频率分布直方图,估计此次竞赛活动得分的平均值.若对得分不低于平均值的同学进行奖励,请估计参赛的学生中有多少名学生获奖.(以每组中点值作为该组数据的代表)
解 (1)由频率分布直方图知,(m+0.03+0.04+0.02)×10=1,解得m=0.01,
设此次竞赛活动学生得分的中位数为x0,由数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,
可得80解得x0=82.5,
所以估计此次竞赛活动学生得分的中位数为82.5.
(2)由频率分布直方图及(1)知,数据落在[60,70),[70,80),[80,90),[90,100]的频率分别为0.1,0.3,0.4,0.2,
=65×0.1+75×0.3+85×0.4+95×0.2=82,
此次竞赛活动学生得分不低于82的频率为0.2+×0.4=0.52,则1 000×0.52=520,
所以估计此次竞赛活动得分的平均值为82,在参赛的1 000名学生中估计有520名学生获奖.§9.2 用样本估计总体
课标要求 1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.
知识梳理
1.百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有________的数据小于或等于这个值,且至少有(100-p)%的数据____________这个值.
2.平均数、中位数和众数
(1)平均数:=________________________.
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最________的一个数据(当数据个数是奇数时)或最中间两个数据的    (当数据个数是偶数时).
(3)众数:一组数据中出现次数________的数据(即频数最大值所对应的样本数据).
3.方差和标准差
(1)方差:s2=____________________________或-2.
(2)标准差:s=________________________.
4.总体方差和总体标准差
(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则总体方差S2=(Yi-)2.
(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=i(Yi-)2.
常用结论
1.若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+a.
2.数据x1,x2,…,xn与数据x1′=x1+a,x2′=x2+a,…,xn′=xn+a 的方差相等,即数据经过平移后方差不变.
3.若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.
自主诊断
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.(  )
(2)方差与标准差具有相同的单位.(  )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(  )
(4)在频率分布直方图中,可以用最高的小长方形底边中点的横坐标作为众数的估计值.(  )
2.在下列统计量中,用来描述一组数据离散程度的量是(  )
A.平均数 B.众数
C.百分位数 D.标准差
3.甲、乙、丙、丁四人参加射击项目选拔赛,成绩如下,则他们中参加奥运会的最佳人选是______.
甲 乙 丙 丁
平均环数 8.5 8.8 8.8 8
方差 3.5 3.5 2.1 8.7
4.有一组数据:-1,a,-2,3,4,2,它们的中位数是1,则这组数据的平均数是________.
题型一 样本的数字特征的估计
例1 (1)(多选)(2023·荆门联考)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了30名党员,对他们一周的党史学习时间进行了统计,统计数据如下.则下列对该单位党员一周学习党史时间的叙述,正确的有(  )
党史学习时间(小时) 7 8 9 10 11
党员人数 4 8 7 6 5
A.众数是8 B.第40百分位数为8
C.平均数是9 D.中位数是9
(2)(多选)(2023·新高考全国Ⅰ)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(  )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
跟踪训练1 (1)(多选)(2023·商丘模拟)在某次演讲比赛中,由两个评委小组(分别为专业人士“小组A”和观众代表“小组B”)给参赛选手打分,根据两个评委小组给同一名选手打分的分值绘制成如图所示的折线图,则下列结论正确的是(  )
A.小组A打分的分值的平均数为48
B.小组B打分的分值的中位数为66
C.小组A打分的分值的极差大于小组B打分的分值的极差
D.小组A打分的分值的方差小于小组B打分的分值的方差
(2)某小组成员的年龄分布茎叶图如图所示,则该小组成员年龄的第25百分位数是________.
题型二 总体集中趋势的估计
例2 2024年,安徽、甘肃、广西、贵州、黑龙江、吉林、江西七省区作为第四批实施改革的省份进入新高考.2023年10月,进入新高考的七个省份相继公布了高考选考科目的试卷结构.某考试机构举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.
(1)求出图中a的值并估计本次考试的及格率(“及格率”指得分为90分及以上的学生所占比例);
(2)估计该校学生联考数学成绩的第80百分位数;
(3)估计该校学生联考数学成绩的众数、平均数.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
思维升华 频率分布直方图中的数字特征
(1)众数:最高矩形的底边中点的横坐标.
(2)中位数:中位数左边和右边的矩形的面积和应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
跟踪训练2 某市共有居民60万人,为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求a的值,并估计该市居民月均用水量不少于3吨的人数;
(2)估计该市居民月均用水量的众数和中位数.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
题型三 总体离散程度的估计
例3 (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10).试验结果如下:
试验 序号i 1 2 3 4 5 6 7 8 9 10
伸缩 率xi 545 533 551 522 575 544 541 568 596 548
伸缩 率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
跟踪训练3 (2024·江门模拟)某果园试种了 A,B两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记A,B两个品种各10棵产量的平均数分别为和,方差分别为s和s.
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
(1)分别求这两个品种产量的极差和中位数;
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
(2)求,,s,s;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________一、单项选择题
1.某鞋店试销一种新款女鞋,销售情况如表:
鞋号 34 35 36 37 38 39 40 41
日销量/双 2 5 9 16 9 5 3 2
如果你是鞋店经理,那么下列统计量中对你来说最重要的是(  )
A.平均数 B.众数
C.中位数 D.极差
2.(2023·唐山模拟)某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为(  )
A.220 B.240 C.250 D.300
3.(2024·南通模拟)为宣传我国第三艘航空母舰“中国人民解放军海军福建舰”正式服役,增强学生的国防意识,某校组织1 000名学生参加了“逐梦深蓝,山河荣耀”国防知识竞赛,从中随机抽取20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是(  )
A.频率分布直方图中a的值为0.004
B.估计这20名学生考试成绩的第60百分位数为75
C.估计这20名学生数学考试成绩的众数为80
D.估计总体中成绩落在[60,70)内的学生人数为150
4.(2023·长沙模拟)为调查某地区中学生每天睡眠时间,采用按比例分配的分层随机抽样的方法,现抽取初中生800 人,其每天睡眠时间的平均数为9小时,方差为1,抽取高中生1 200人,其每天睡眠时间的平均数为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为(  )
A.0.94 B.0.96 C.0.75 D.0.78
5.(2023·南昌模拟)在统计中,月度同比是指本月和上一年同月相比较的增长率,月度环比是指本月和上一个月相比较的增长率,如图是2022年1月至2022年12月我国居民消费价格月度涨跌幅度统计图,则以下说法错误的是(  )
A.在这12个月中,我国居民消费价格月度同比数据的中位数为2.1%
B.在这12个月中,月度环比数据为正数的个数比月度环比数据为负数的个数多3
C.在这12个月中,我国居民消费价格月度同比数据的平均数为1.85%
D.在这12个月中,我国居民消费价格月度环比数据的众数为0.0%
6.四名同学各掷骰子5次,分别记录每次骰子向上的点数,根据四名同学的统计结果,可以判断一定没有出现点数6的是(  )
A.平均数为2,方差为2.4
B.中位数为3,方差为1.6
C.中位数为3,众数为2
D.平均数为3,中位数为2
二、多项选择题
7.(2023·潮州模拟)根据气象学上的标准,如果连续5天的日平均气温都低于10 ℃即为入冬.现将连续5天的日平均气温的记录数据(记录数据都是自然数)作为一组样本,则下列样本中一定符合入冬指标的有(  )
A.平均数小于4
B.平均数小于4且极差小于或等于3
C.平均数小于4且标准差小于或等于4
D.众数等于5且极差小于或等于4
8.已知数据x1,x2,…,x9成公差大于0的等差数列,若去掉数据x5,则(  )
A.极差不变 B.第25百分位数变大
C.平均数不变 D.方差变小
三、填空题
9.(2023·惠州模拟)数据68,70,80,88,89,90,96,98的第75百分位数为________.
10.(2023·黔西模拟)若样本数据x1,x2,…,x10的标准差为3,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.
11.(2023·济南模拟)某射击运动员连续射击5次,命中的环数(环数为整数)形成一组数据,这组数据的中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为________.
12.(2024·杭州模拟)已知一组样本数据共有9个数,其平均数为8,方差为12.将这组样本数据增加一个数据后,所得新的样本数据的平均数为9,则新的样本数据的方差为________.
四、解答题
13.(2023·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)求两位学生预赛成绩的平均数和方差;
(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.
14.(2024·凉山统考)某校为了提高学生对体育运动的兴趣,举办了一场体育知识答题比赛活动,共有1 000名学生参加了此次答题活动.为了解本次比赛的成绩,从中抽取了100名学生的得分(得分均为整数,满分为100分)进行统计,所有学生的得分都不低于60分,将这100名学生的得分进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100](单位:分),得到如下的频率分布直方图.
(1)求图中m的值,并估计此次竞赛活动学生得分的中位数;
(2)根据频率分布直方图,估计此次竞赛活动得分的平均值.若对得分不低于平均值的同学进行奖励,请估计参赛的学生中有多少名学生获奖.(以每组中点值作为该组数据的代表)
§9.2 用样本估计总体
1.B 2.B 3.D 4.A 5.C 6.A
7.BD
8.AC [选项A,根据极差的定义,原数据的极差为x9-x1,去掉x5后的极差为x9-x1,即极差不变,故A正确;
选项B,原数据的第25百分位数为x3,去掉x5后的第25百分位数为(x2+x3)选项C,原数据的平均数为=x5,去掉x5后的平均数为=(x1+…+x4+x6+…+x9)=×=x5=,即平均数不变,故C正确;
选项D,原数据的方差为s2=[(x1-x5)2+(x2-x5)2+…+(x9-x5)2],去掉x5后的方差为s′2=[(x1-x5)2+(x2-x5)2+…+(x4-x5)2+(x6-x5)2+…+(x9-x5)2],故s29.93 10.6 11.7.8
12.19.8
解析 设增加的数为k,原来的9个数分别为a1,a2,…,a9,
则a1+a2+…+a9=72,a1+a2+…+a9+k=90,所以k=18,
又因为(ai-8)2=12,
即(ai-8)2=108,
所以[(ai-9)2+(k-9)2]
=[(ai-8)2-2(ai-8)+9+81]=19.8.
13.解 (1)甲=×(82+81+79+78+95+88+93+84)=85,
乙=×(92+95+80+75+83+80+90+85)=85,
s=×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,
s=×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.
(2)由(1)知甲=乙,s甲的成绩较稳定,所以派甲参赛比较合适.
14.解 (1)由频率分布直方图知,(m+0.03+0.04+0.02)×10=1,解得m=0.01,
设此次竞赛活动学生得分的中位数为x0,由数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,
可得80所以估计此次竞赛活动学生得分的中位数为82.5.
(2)由频率分布直方图及(1)知,数据落在[60,70),[70,80),[80,90),[90,100]的频率分别为0.1,0.3,0.4,0.2,
=65×0.1+75×0.3+85×0.4+95×0.2=82,
此次竞赛活动学生得分不低于82的频率为0.2+×0.4=0.52,
则1 000×0.52=520,
所以估计此次竞赛活动得分的平均值为82,在参赛的1 000名学生中估计有520名学生获奖.

展开更多......

收起↑

资源列表