第九章第02讲 用样本估计总体 (精讲)(解析版)

资源下载
  1. 二一教育资源

第九章第02讲 用样本估计总体 (精讲)(解析版)

资源简介

第02讲 用样本估计总体 (精讲)
目录
第一部分:知识点精准记忆
第二部分:课前自我评估测试
第三部分:典型例题剖析
题型一:百分位数的估计
题型二:总体集中趋势的估计
角度1:样本的数字特征
角度2:频率分布直方图中的数字特征
题型三:总体离散程度的估计
第四部分:高考真题感悟
知识点一:总体百分位数的估计
(1)第百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的第百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
知识点二:样本的数字特征
(1)众数
一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数.
(2)中位数
一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
(3)平均数
一组数据的和与这组数据的个数的商称为这组数据的平均数.数据,,,的平均数为
(4)标准差与方差
如果有个数据,,,那么平均数,标准差为:,方差:
知识点三:在频率分布直方图中,众数,中位数,平均数的估计值
(1)最高的小矩形底边中点的横坐标即是众数;
(2)中位数左边和右边的所有小矩形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
知识点四:平均数,方差的线性关系:
数据 平均数 方差
,,,
,,,
,,,
,,,
一、单选题
1.(2022·全国·高一单元测试)在样本的频率分布直方图中,一共有个小矩形,第4个小矩形的面积等于其余()个小矩形面积和的,则第4个小矩形对应的频率为( )
A.0.3 B.0.4 C.0.5 D.0.7
【答案】A
【详解】设第4个小矩形对应的频率为,则其余()个小矩形对应的频率为,
所以,解得.
故选:A.
2.(2022·全国·高一单元测试)下表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的30百分位数是( )
班级得分 7 8 9 10 11 13 14
频数 2 1 2 3 1 2 1
A.11 B.10.5 C.9.5 D.9
【答案】D
【详解】,
把12个班级的得分按照从小到大排序为
7,7,8,9,9,10,10,10,11,13,13,14,
可得30百分位数是第4个得分数,即9.
故选:D
二、填空题
3.(2022·全国·高一单元测试)已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)
【答案】##
【详解】因为,
所以这组数据的第5个数:50为第60百分位数.
观察易知这组数据的众数为50,
所以a和b的大小关系是.
故答案为:
4.(2022·全国·高一课时练习)联合国《生物多样性公约》缔约方大会第十五次会议(COP15)在中国昆明举行,全国30个城市联动举行了“2021COP15春城之邀——一粒来自昆明的种子”活动,活动特别准备了2万份“神秘”花种盲盒,其中有一种花的植株高度的频率分布直方图如图所示,则这种花的植株高度的众数约为______,中位数约为______.
【答案】 45 45.8
【详解】由频率分布直方图,知频率最大的区间为,
所以众数为.
因为,,
所以中位数在内,设中位数为x,
则,解得.
故答案为:;
5.(2022·全国·高一单元测试)某电子商务公司对10000名网络购物者2021年度的消费情况进行统计,发现每个人的消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.直方图中的a=___________,在这些购物者中,平均消费金额约为___________万元.
【答案】 3 0.537##
【详解】由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得,
因此平均消费金额约为0.35×0.15+0.45×0.25+0.55×0.3+0.65×0.2+0.75×0.08+0.85×0.02=0.537(万元).
故答案为:3,0.537
题型一:百分位数的估计
典型例题
例题1.(2022·云南·弥勒四中高二开学考试)某校高一年级15个班参加合唱比赛,得分从小到大排序依次为:,,则这组数据的分位数是( )
A.90 B. C.86 D.93
【答案】B
【详解】因为,所以这组数据的分位数是第12个数和第13个数的平均数,
即,
故选:B
例题2.(2022·全国·高一课时练习)某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:
锻炼时间/h 7 8 9 10 11
人数 6 10 9 8 7
则该校学生一周进行课外锻炼的时间的第40百分位数是( )
A.8.5 B.8 C.7 D.9
【答案】A
【详解】抽取的学生人数为.由,
故第40百分位数为所有数据从小到大排序的第16项与第17项数据的平均数,
即.
故选: A.
例题3.(2022·福建莆田·高一期末)按从小到大顺序排列的9个数据:10,16,25,33,39,43,,65,70,若这组数据的第一四分位数与第三四分位数的和是73,则等于( )
A.40 B.48 C.50 D.57
【答案】B
【详解】对于已知个数据:,
,第一四分位数为,
,第三四分位数为,
,解得.
故选:B.
例题4.(2022·山西长治·高一期末)某地区为了解最近11天该地区的空气质量,调查了该地区过去11天的浓度(单位:),数据依次为53,56,69,70,72,79,65,80,45,41,.已知这组数据的极差为40,则这组数据的第百分位数为( )
A.71 B.75.5 C.79 D.72
【答案】C
【详解】由题意得,数据的极差为40,因为数据中最小值为41,
故m应为最大值,为81,
则 ,
将数据53,56,69,70,72,79,65,80,45,41,81,
从小大大排列为:41,45, 53,56,65,69,70,72,79, 80, 81,
故这组数据的第m百分位数为79,
故选:C
同类题型归类练
1.(2022·湖北武汉·高三开学考试)某校高三数学备课组老师的年龄(单位:岁)分别为:28,29,42,32,41,56,45.48,55,59,则这组数据的第80百分位数为( )
A.54.5 B.55 C.55.5 D.56
【答案】C
【详解】这10个数按从小到大顺序排列为:28,29,32,41,42,45,48,55,56,59,
,第8个数是55,第9个数是56,
因此第80百分位数为.
故选:C.
2.(2022·福建省福州第一中学高一期末)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了40名党员,对他们一周的党史学习时间进行了统计,统计数据如表所示:
党史学习时间(小时) 7 8 9 10 11
党员人数 6 10 9 8 7
则该单位党员一周学习党史时间的众数及第75百分位数分别是( )
A.8,10 B.8,10.5 C.9,10 D.8,9.5
【答案】A
【详解】该单位党员一周学习党史时间中,8出现的次数最多,众数是8,
学习时间小于10小时的比例是,小于11小时的比例是,因此第75百分数是10.
故选:A.
3.(2022·四川眉山·高二期末(理))某班最近一次化学考试成绩的频率分布直方图如下图所示,若化学老师欲将大家的成绩由高到低排列,并奖励排名在前39%的同学,试估计化学老师选取的学生分数应不低于( )
A.73 B.75 C.77 D.79
【答案】C
【详解】由题意可知,,解得,
化学考试成绩在内的频率为,
所以第39百分位数的一定位于内,设第39百分位数为,则
,解得.
所以估计化学老师选取的学生分数应不低于分.
故选:C.
4.(2022·湖南衡阳·高一期末)有10种不同的零食,每100克可食部分包含的能量(单位:J)如下:100,120,125,165,430,186,175,234,425,310.这10种零食每100克可食部分的能量的第60百分位数为__________.
【答案】210
【详解】10个数据从小到大顺序排列为:,
,而第6个数据为186,第7个数据为234,.
所以第60百分位数为210.
故答案为:210.
题型二:总体集中趋势的估计
角度1:样本的数字特征
典型例题
例题1.(2022·全国·高一课时练习)已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入三个新数据4,5,6,若新样本的平均数为,方差为,则( )
A., B.,
C., D.,
【答案】B
【详解】解:设新样本的10个数据分别为,,…,,,,,
由题意得,又,所以,
所以,

故选:B
例题2.(2022·全国·高一课时练习)若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不低于第3名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是( )
A.甲同学:平均数为2,众数为1
B.乙同学:平均数为2,方差小于1
C.丙同学:中位数为2,众数为2
D.丁同学:众数为2,方差大于1
【答案】B
【详解】对于A,甲同学:若平均数为2,众数为1,则有1次名次应为4,不符合题意;
对于B,乙同学:平均数为2,设乙同学3次考试的名次分别为,,,
则方差,
则,所以,,均不大于3,符合题意;
对于C,丙同学:中位数为2,众数为2,有可能是2,2,4,不符合题意;
对于D,丁同学:众数为2,方差大于1,有可能是2,2,6,不符合题意.
故选:B
例题3.(2022·河北保定·高一阶段练习)在某市举行的唱歌比赛中,5名专业人士和5名观众代表组成一个评委小组,给参赛选手打分.这10个分数的平均分为8分,方差为12,若去掉一个最高分10分和一个最低分6分,则剩下的8个分数的方差为_____________.
附:已知样本数据的平均数与方差满足关系式.
【答案】14
【详解】设这10个分数分别为,6,10,平均数为,方差为,的平均数为,方差为,所以

则,
则,即,则,
所以.
故答案为:14.
例题4.(2022·全国·高一单元测试)在①55%分位数,②众数这两个条件中任选一个,补充在下面问题中的横线上,并解答问题.维生素又叫-抗坏血酸,是一种水溶性维生素,是高等灵长类动物与其他少数生物的必需营养素.现从猕猴桃 柚子两种食物中测得每100克维生素的含量(单位:mg)各10个数据如下,其中猕猴桃的一个数据被污损.
猕猴桃:104,119,106,102,132,107,113,134,116,x;
柚子:121,113,109,122,114,116,132,121,131,117.
已知等于柚子的10个数据中的___________.
(1)求的值与猕猴桃的数据的中位数;
(2)分别计算上述猕猴桃 柚子两种食物中测得每100克维生素含量的平均数.
【答案】(1)121,中位数为
(2)mg,mg
(1)柚子的10个数据按照从小到大的顺序排列为:109,113,114,116,117,121,121,122,131,132.选①,因为,所以柚子10个数据的55%分位数为第6个数,即121,所以x=121.猕猴桃的10个数据按照从小到大的顺序排列为:102,104,106,107,113,116,119,121,132,134,则中位数为.选②,因为柚子的10个数据的众数为121,所以x=121.猕猴桃的10个数据按照从小到大的顺序排列为:102,104,106,107,113,116,119,121,132,134,则中位数为.
(2)由(1)得每100克猕猴桃维生素C含量的平均数为mg每100克柚子维生素C含量的平均数为mg
同类题型归类练
1.(多选)(2022·全国·高一单元测试)某公司为了解用户对其产品的满意度,随机调查了10个用户,得到用户对产品的满意度评分如下表所示,评分用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高,则下列说法正确的是( )
7 8 9 7 5 4 10 9 4 7
A.这组数据的平均数为6 B.这组数据的众数为7
C.这组数据的极差为6 D.这组数据的75%分位数为9
【答案】BCD
【详解】这组数从小到大排列为:4,4,5,7,7,7,8,9,9,10,
计算这组数据的平均数为,选项A错误;
这组数据的众数是7,选项B正确;
这组数据的极差是,选项C正确;
因为10×75%=7.5,且第8个数是9,所以这组数据的75%分位数为9,选项D正确.
故选:BCD.
2.(2022·山东滨州·高一期末)已知数据,…,的众数 平均数 方差 第80百分位数分别是,,,,数据,,,…,的众数 平均数 方差 第80百分位数分别是,,,,且满足,则下列结论正确的是( )
A. B. C. D.
【答案】BCD
【详解】由题意可知,两组数据满足,则它们的众数也满足该关系,则有,故A错误;
由平均数计算公式得:
,即,故B正确;
由方差的性质可得,故C正确;
对于数据,…,,假设其第80百分位数为,
当是整数时, ,当不是整数时,设其整数部分为k,则,
故对于数据,…,,假设其第80百分位数为,
当是整数时, ,当不是整数时,设其整数部分为k,则,
故,故D正确,
故选:BCD
3.(2022·湖北·襄阳五中高三阶段练习)若已知30个数的平均数为6,方差为9;现从原30个数中剔除这10个数,且剔除的这10个数的平均数为8,方差为5,则剩余的20个数的方差为___________.
【答案】
【详解】由题意得,,
,,
所以剩余的20个数的平均数为,

所以剩余的20个数的方差为,
故答案为:8
4.(2022·全国·高一单元测试)鲤鱼是中华五千年文化传承的载体之一,它既是拼搏进取、敢于突破自我、敢于冒险奋进精神的载体,又是富裕、吉庆、幸运的美好象征.某水产养殖研究所准备进行“中国红鲤”和“中华彩鲤”杂交育种实验.研究所对200尾中国红鲤和160尾中华彩鲤幼苗进行2个月培育后,将根据体长分别选择生长快的10尾中国红鲤和8尾中华彩鲤作为种鱼进一步培育.为了解培育2个月后全体幼鱼的体长情况,将其按照品种进行分层随机抽样,其中抽取的40尾中国红鲤的体长数据(单位:cm)如下:
5.0 6.0 7.0 7.5 8.0 8.4 4.0 3.5 4.5 4.3
5.0 4.0 3.0 2.5 4.0 1.6 6.0 6.5 5.5 5.7
3.1 5.2 4.4 5.0 6.4 3.5 7.0 4.0 3.0 3.4
6.9 4.8 5.6 5.0 5.6 6.5 3.0 6.0 7.0 6.6
(1)根据以上数据,估计某尾体长为8.3 cm的中国红鲤能否被选为种鱼,并说明理由.
(2)通过计算得到样本中中国红鲤体长的平均值为5.1 cm,中华彩鲤体长的平均值为4.875 cm,求所有样本数据的平均值.
【答案】(1)不能,理由见解析
(2)cm
(1)能被选为种鱼,理由如下:因为200尾中国红鲤中有10尾能被选为种鱼,所以估计40尾中国红鲤中有2尾能被选为种鱼,样本数据中体长为8.4 cm和8cm的中国红鲤能被选为种鱼,其余的中国红鲤不能被选为种鱼,由于8.3>8,所以估计该尾中国红鲤能被选为种鱼.
(2)根据分层随机抽样的原则,抽取中华彩鲤的尾数为,所以所有样本数据的平均值为(cm).
角度2:频率分布直方图中的数字特征
典型例题
例题1.(多选)(2022·江苏·如皋市第一中学高一期末)某中学举行安全知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按照分成了5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是( )
A.这组数据的极差为50 B.这组数据的众数为76
C.这组数据的中位数为 D.这组数据的第75百分位数为85
【答案】CD
【详解】解:对于A:由频率分布图无法得到这组数据的最大值和最小值,
故这组数据的极差无法准确判断,故A错误;
数据的众数为,故B错误;
,,
所以中位数位于之间,设中位数为,则,解得,
即这组数据的中位数为,故C正确;
,,故估计第分位数是,故D正确;
故选:CD
例题2.(2022·吉林·长春市第二实验中学高一期末)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例、使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数、将数据分成7组:,,…,,并整理得到如图的频率分布直方图.
(1)估计总体400名学生中分数小于60的人数;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间内的人数;
(3)根据该大学规定、把25%的学生划定为不及格、确定本次测试的及格分数线、低于及格分数线的学生需要补考.
【答案】(1)80(2)20(3)65分
(1)解:据频率分布直方图可知,样本中分数不小于60的频率为,所以样本中分数小于60的频率为,
所以估计总体400名学生中分数小于60的人数为.
(2)解:根据题意,样本中分数不小于50的频率为,
分数在区间内的人数为,
所以总体中分数在区间内的人数估计为.
(3)解:设分数的第25百分位数为,
分数小于70的频率为,
分数小于60的频率为,
所以,即,解得,
则本次考试的及格分数线为65分.
例题3.(2022·全国·高一单元测试)中秋佳节来临之际,小李准备销售一种农特产,这段时间内,每售出1箱该特产获利50元,未售出的,每箱亏损30元.经调查,市场需求量的频率分布直方图如图所示.小李购进了160箱该特产,以(单位:箱,)表示市场需求量,(单位:元)表示经销该特产的利润.
(1)根据频率分布直方图估计市场需求量的众数和平均数;
(2)将表示为的函数;
(3)根据频率分布直方图求利润不少于4800元的频率.
【答案】(1)150,153
(2)
(3)0.9
(1)由频率分布直方图,得市场需求量的众数的估计值是150,需求量为[100,120)的频率为0.005×20=0.1,需求量为[120,140)的频率为0.01×20=0.2,需求量为[140,160)的频率为0.015×20=0.3,需求量为[160,180)的频率为0.0125×20=0.25,需求量为[180,200]的频率为0.0075×20=0.15,则市场需求量的平均数约为110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153.
(2)因为每售出1箱该特产获利50元,未售出的,每箱亏损30元,所以当时,,当时,,所以.
(3)当时,由,得;当时,,所以当时,利润不少于4800元,所以由(1)知利润不少于4800元的频率为.
同类题型归类练
1.(多选)(2022·黑龙江·哈九中高一期末)某校为了解学生对食堂的满意程度,设计了一份调查问卷,从该校高中生中随机抽取部分学生参加测试,记录了他们的分数,将收集到的学生测试分数按照,,,,,,分组,画出频率分布直方图,已知随机抽取的学生测试分数不低于80分的学生有27人,则以下结论中正确的是( )
A.此次测试众数的估计值为85
B.此次测试分数在的学生人数为6人
C.随机抽取的学生测试分数的第55百分位数约为80
D.平均数m在中位数n右侧
【答案】ABC
【详解】由直方图可知此次测试众数的估计值为85,故A正确;
因为不低于80分的学生的频率为,
∴该校高中生中随机抽取学生的人数为人,
所以此次测试分数在的学生人数为人,故B正确;
因为,
所以随机抽取的学生测试分数的第55百分位数约为80,故C正确;
由直方图在左边“拖尾”,可知平均数小于中位数,即平均数m在中位数n左侧,故D错误.
故选:ABC.
2.(2022·全国·高一单元测试)某市政府为了节约生活用水,实施居民生活用水定额管理政策,即确定一个居民月用水量标准x(单位:吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,并随机抽取部分居民进行调查,抽取的居民月均用水量的频率分布直方图如图所示.(同一组中的数据以该组区间的中点值为代表)
(1)求频率分布直方图中a的值;
(2)试估计该市居民月均用水量的众数、平均数;
(3)如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?
【答案】(1)(2)吨,吨(3)
(1)由频率分布直方图中所有矩形的面积之和为1,可得,解得.
(2)由频率分布直方图可知,该市居民月均用水量的众数约为(吨),由频率分布直方图可知,平均数约为(吨).
(3)由频率分布直方图可知,月均用水量低于2.5吨的居民人数所占的百分比为,月均用水量低于3吨的居民人数所占的百分比为,所以,由题意可得,解得.所以如果希望85%的居民月均用水量不超过标准x,那么x定为2.9吨比较合理.
3.(2022·河北保定·高一阶段练习)某学校组织“数学文化”知识竞赛,分为初赛和决赛,有400名学生参加知识竞赛的初赛(满分150分),根据初赛成绩依次分为,,,,,这六组,得到如图所示的频率分布直方图.
(1)求本次初赛成绩的平均数;(每组数据以区间中点值为代表)
(2)若计划决赛人数为80,估计参加决赛的最低分数线.
【答案】(1)(2)127.5
(1)由题意有,解得m=0.030.本次初赛成绩的平均数为.
(2)因为,所以决赛成绩的最低分为80%分位数.前四个矩形的面积之和为,前五个矩形的面积之和为.设80%分位数为,则,解得m=127.5.因此,若计划决赛人数为80,估计参加决赛的最低分数线为127.5.
4.(2022·贵州黔东南·高一期末)统计某校n名学生期中考试化学成绩(单位:分),由统计结果得如下频数分布表和频率分布直方图:
化学成绩组 [50,60) [60,70) [70,80) [80,90) [90,100]
频数 m 26 38 p 8
(1)求出表中m,p的值;
(2)估计该校学生化学成绩的平均数(同一组中的数据用该组区间的中点值作代表)及中位数(保留一位小数);
(3)根据以上抽样调查数据,能否认为该校学生化学成绩达到“化学成绩不低于70分的学生所占比例不低于该校全体学生的80%”的考核标准?
【答案】(1);(2)平均数约为75;中位数的为74.7(3)不能
(1)由频率分布直方图将进行数据分析可得:;;.
(2)化学成绩的样本平均数为∴该校学生化学成绩的平均数约为75.第一组频率为:0.06,第二组频率为:0.26,第三组频率为:0.38. ∵∴中位数落在第三组[70,80)内,设中位数为x则解得因此,中位数的为74.7
(3)学成绩不低于70分的学生所占比例约为,由于该估计值小于0.8,故不能认为该校学生化学成绩达到“化学成绩不低于70分的学生所占比例不低于该校全体学生的80%的规定.
题型三:总体离散程度的估计
典型例题
例题1.(2022·海南·琼海市嘉积第二中学高二期中)已知、、…、的平均值为6,方差为3,则、、…、的平均值为______,方差为______.
【答案】 11 12
【详解】新数据平均值为,新数据方差为
故答案为:11;12.
例题2.(2022·湖南·湘阴县教育科学研究室高一期末)为了了解某设备生产产品质量的稳定性,现随机抽取了10件产品,其质量(单位:克)如下:495,500,503,508,498,500,493,500,503,500,质量落在区间 (表示质量的平均值,为标准差)内的产品件数为____.
【答案】7
【详解】根据题意
所以
所以质量落在区间内的产品件数为7个.
故答案为:7
例题3.(2022·全国·高一单元测试)为响应“绿色出行”号召,某市先后推出了“共享单车”和“新能源分时租赁汽车”,并计划在甲 乙两个工厂选择一个工厂生产汽车轮胎,现分别从甲 乙两厂各随机选取10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:
(1)分别计算甲 乙两厂提供的10个轮胎宽度的平均数;
(2)轮胎的宽度在内,则称这个轮胎是标准轮胎.试比较甲 乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个工厂会被选择.
【答案】(1)甲厂平均数195,乙厂平均数194
(2)乙厂的轮胎会被选择
(1)甲厂提供的10个轮胎宽度的平均数.乙厂提供的10个轮胎宽度的平均数.
(2)甲厂提供的10个轮胎的宽度在[194,196]内的数据为195,194,196,194,196,195,共6个,标准轮胎宽度的平均数为,方差为乙厂提供的10个轮胎的宽度在[194,196]内的数据为195,196,195,194,195,195,共6个,标准轮胎宽度的平均数为.方差为由于甲 乙两厂标准轮胎宽度的平均数相等,但乙的方差更小,所以乙厂的轮胎会被选择.
例题4.(2022·黑龙江·哈尔滨三中高一期末)2022年北京冬奥会的成功举办,带动中国3亿多人参与冰雪运动,这是对国际奥林匹克运动发展的巨大贡献.2020《中国滑雪产业白皮书》显示,2020-2021排名前十的省份的滑雪人次(单位:万人次)数据如下表:
排名 省份 2020-2021 2019-2020 2018-2019
1 河北 221 136 235
2 吉林 202 123 207
3 北京 188 112 186
4 黑龙江 149 101 195
5 新疆 133 76 116
6 四川 99 52 69
7 河南 98 58 95
8 浙江 94 62 108
9 陕西 79 47 76
10 山西 78 39 100
(1)由表中数据可知,2018-2019年这十个省份滑雪总人次为1387万,而受疫情影响,2019-2020年下降至806万,计算2018-2019年和2019-2020年这10个省份滑雪人次的平均数,,并据此计算这两年的平均数;
(2)已知2018-2019年滑雪人次的方差,2019-2020年滑雪人次的方差,据此计算这两年滑雪人次的方差;(结果保留整数)
(3)据统计近年滑雪人均每次消费为6000元,若以2020-2021年数据为基础,每个省份滑雪人次都按(2)中标准差的人数增长(过程中数据均保留整数),估计2021-2022年滑雪消费超过100亿元的省份有几个?
【答案】(1);(2)3035;(3)4.
(1)由题意,,,.
(2)由,,
.
(3)由题设,消费超过100亿元,则人数为万人,
由(2)各省人数增长为万人,
显然,
所以估计2021-2022年滑雪消费超过100亿元的省份有河北、吉林、北京、黑龙江,共4个.
同类题型归类练
1.(2022·全国·高一单元测试)从甲 乙 丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查,结果如下:
甲:5,5,6,6,8,8,8,10;
乙:4,5,6,7,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
(1)三个厂家的广告中都称该产品的使用寿命是8年,请指出___________(从“甲 乙 丙”三厂家中选择一个)厂家在广告中依据了统计数据中的哪个特征数?
(2)计算甲厂家抽取的8件产品的方差.
【答案】(1)答案见解析(2)
(1)选择甲厂家,因为甲厂家抽取的8件产品的众数是8,所以甲厂家的广告依据了统计数据中的众数;选择乙厂家,因为乙厂家抽取的8件产品的平均数是8,所以乙厂家的广告依据了统计数据中的平均数;选择丙厂家,因为丙厂家抽取的8件产品的中位数是8,所以丙厂家的广告依据了统计数据中的中位数.
(2)甲厂家抽取的8件产品的使用寿命为5,5,6,6,8,8,8,10,其平均数为,方差为.
2.(2022·全国·高一单元测试)随着手机和网络的普及,外卖行业得到迅速的发展.某外卖平台为了解某地区用户对其提供的服务的满意度,随机调查了40个用户,得到用户的满意度评分如下:
(1)请你估计该地区所有用户评分的25%,95%分位数;
(2)若从这40个用户中抽取一个容量为10的样本,且抽到的10个用户的评分分别为92,84,86,78,89,74,83,78,77,89,试计算这10个数据的平均数和方差;
(3)在(2)的条件下,若用户的满意度评分在内,则满意度等级为“A级”,试用样本估计总体的思想,根据所抽到的10个数据,估计该地区满意度等级为“A级”的用户所占的百分比.
(参考数据:,,)
【答案】(1)76.5,95(2),(3)
(1)这40个用户评分按从小到大排列如下:63,66,72,73,74,74,75,76,76,76,77,78,78,78,79,79,80,81,81,81,82,82,83,83,84,84,85,85,86,86,88,88,89,89,91,92,93,95,95,97,得到,,可知这40个用户评分的25%,95%分位数分别为第10项和第11项数据的平均数,第38项和第39项数据的平均数,分别为76.5,95,据此估计该地区所有用户评分的25%,95%分位数分别约为76.5,95.
(2),.
(3)由题意知评分在,即(77.26,88.74)内的满意度等级为“A级”,样本中评分在(77.26,88.74)内的有5人,则可估计该地区满意度等级为“A级”的用户所占的百分比约为.
3.(2022·山东济南·高一期末)为了调查某中学高一年级学生的身高情况,在高一年级随机抽取100名学生作为样本,把他们的身高(单位:cm)按照区间,,,,分组,得到样本身高的频率分布直方图如图所示.
(1)求频率分布直方图中x的值以及样本中身高不低于175cm的学生人数;
(2)在统计过程中,小明与小张两位同学因事缺席,测得其余98名同学的平均身高为172cm,方差为29.之后补测得到小明与小张的身高分别为171cm与173cm.试根据上述数据求样本的方差.
【答案】(1);30人
(2)
(1)由频率分布直方图知,,所以.
又样本中身高不低于175cm的学生的频率为
所以,样本中身高不低于175cm的学生人数为人.
(2)设除小张与小明外其他98名同学的身高为,,,…,,小张与小明的身高分别为,,样本的平均数为,样本的方差为.
由题意.
又,
所以样本的方差.
4.(2022·山西吕梁·高一期末)随着高校强基计划招生的持续开展,我市高中生抓起了参与数学兴趣小组的热潮.为调查我市高中生对数学学习的喜好程度,从甲、乙两所高中各随机抽取了名学生,记录他们在一周内平均每天学习数学的时间,并将其分成了个区间:、、、、、,整理得到如下频率分布直方图:
(1)求图1中的值,并估计甲高中学生一周内平均每天学习数学时间的众数;
(2)估计乙高中学生一周内平均每天学习数学时间的均值及方差(同一组中的数据用该组区间的中点值作代表);
(3)若从甲、乙两所高中分别抽取样本量为、的两个样本,经计算得它们的平均数和方差分别为:、与、,记总的样本平均数为,样本方差为,证明:
①;
②.
【答案】(1),众数是
(2),
(3)①证明见解析 ;②证明见解析
(1)解:由频率分布直方图可得,解得,
甲高中学生一周内平均每天学习数学时间的众数是.
(2)解:,
.
(3)证明:①,即得证;


,,
同理可得,

所以,,即得证.
1.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A. B. C. D.
【答案】D
【详解】由频率分布直方图可知,评分在区间内的影视作品数量为.
故选:D.
2.(2021·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
【答案】C
【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.
该地农户家庭年收入低于4.5万元的农户的比率估计值为,故A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计值为,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为,故D正确;
该地农户家庭年收入的平均值的估计值为(万元),超过6.5万元,故C错误.
综上,给出结论中不正确的是C.
故选:C.
3.(多选)(2021·全国·高考真题)下列统计量中,能度量样本的离散程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的极差 D.样本的平均数
【答案】AC
【详解】由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势;
故选:AC.
4.(2021·全国·高考真题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
【答案】CD
【详解】A:且,故平均数不相同,错误;
B:若第一组中位数为,则第二组的中位数为,显然不相同,错误;
C:,故方差相同,正确;
D:由极差的定义知:若第一组的极差为,则第二组的极差为,故极差相同,正确;
故选:CD
5.(2021·全国·高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【答案】(1);(2)新设备生产产品的该项指标的均值较旧设备有显著提高.
【详解】(1),


.
(2)依题意,,,
,所以新设备生产产品的该项指标的均值较旧设备有显著提高.第02讲 用样本估计总体 (精讲)
目录
第一部分:知识点精准记忆
第二部分:课前自我评估测试
第三部分:典型例题剖析
题型一:百分位数的估计
题型二:总体集中趋势的估计
角度1:样本的数字特征
角度2:频率分布直方图中的数字特征
题型三:总体离散程度的估计
第四部分:高考真题感悟
知识点一:总体百分位数的估计
(1)第百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的第百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
知识点二:样本的数字特征
(1)众数
一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数.
(2)中位数
一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
(3)平均数
一组数据的和与这组数据的个数的商称为这组数据的平均数.数据,,,的平均数为
(4)标准差与方差
如果有个数据,,,那么平均数,标准差为:,方差:
知识点三:在频率分布直方图中,众数,中位数,平均数的估计值
(1)最高的小矩形底边中点的横坐标即是众数;
(2)中位数左边和右边的所有小矩形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
知识点四:平均数,方差的线性关系:
数据 平均数 方差
,,,
,,,
,,,
,,,
一、单选题
1.(2022·全国·高一单元测试)在样本的频率分布直方图中,一共有个小矩形,第4个小矩形的面积等于其余()个小矩形面积和的,则第4个小矩形对应的频率为( )
A.0.3 B.0.4 C.0.5 D.0.7
2.(2022·全国·高一单元测试)下表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的30百分位数是( )
班级得分 7 8 9 10 11 13 14
频数 2 1 2 3 1 2 1
A.11 B.10.5 C.9.5 D.9
3.(2022·全国·高一单元测试)已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)
4.(2022·全国·高一课时练习)联合国《生物多样性公约》缔约方大会第十五次会议(COP15)在中国昆明举行,全国30个城市联动举行了“2021COP15春城之邀——一粒来自昆明的种子”活动,活动特别准备了2万份“神秘”花种盲盒,其中有一种花的植株高度的频率分布直方图如图所示,则这种花的植株高度的众数约为______,中位数约为______.
5.(2022·全国·高一单元测试)某电子商务公司对10000名网络购物者2021年度的消费情况进行统计,发现每个人的消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.直方图中的a=___________,在这些购物者中,平均消费金额约为___________万元.
题型一:百分位数的估计
典型例题
例题1.(2022·云南·弥勒四中高二开学考试)某校高一年级15个班参加合唱比赛,得分从小到大排序依次为:,,则这组数据的分位数是( )
A.90 B. C.86 D.93
例题2.(2022·全国·高一课时练习)某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:
锻炼时间/h 7 8 9 10 11
人数 6 10 9 8 7
则该校学生一周进行课外锻炼的时间的第40百分位数是( )
A.8.5 B.8 C.7 D.9
例题3.(2022·福建莆田·高一期末)按从小到大顺序排列的9个数据:10,16,25,33,39,43,,65,70,若这组数据的第一四分位数与第三四分位数的和是73,则等于( )
A.40 B.48 C.50 D.57
例题4.(2022·山西长治·高一期末)某地区为了解最近11天该地区的空气质量,调查了该地区过去11天的浓度(单位:),数据依次为53,56,69,70,72,79,65,80,45,41,.已知这组数据的极差为40,则这组数据的第百分位数为( )
A.71 B.75.5 C.79 D.72
同类题型归类练
1.(2022·湖北武汉·高三开学考试)某校高三数学备课组老师的年龄(单位:岁)分别为:28,29,42,32,41,56,45.48,55,59,则这组数据的第80百分位数为( )
A.54.5 B.55 C.55.5 D.56
2.(2022·福建省福州第一中学高一期末)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了40名党员,对他们一周的党史学习时间进行了统计,统计数据如表所示:
党史学习时间(小时) 7 8 9 10 11
党员人数 6 10 9 8 7
则该单位党员一周学习党史时间的众数及第75百分位数分别是( )
A.8,10 B.8,10.5 C.9,10 D.8,9.5
3.(2022·四川眉山·高二期末(理))某班最近一次化学考试成绩的频率分布直方图如下图所示,若化学老师欲将大家的成绩由高到低排列,并奖励排名在前39%的同学,试估计化学老师选取的学生分数应不低于( )
A.73 B.75 C.77 D.79
4.(2022·湖南衡阳·高一期末)有10种不同的零食,每100克可食部分包含的能量(单位:J)如下:100,120,125,165,430,186,175,234,425,310.这10种零食每100克可食部分的能量的第60百分位数为__________.
题型二:总体集中趋势的估计
角度1:样本的数字特征
典型例题
例题1.(2022·全国·高一课时练习)已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入三个新数据4,5,6,若新样本的平均数为,方差为,则( )
A., B.,
C., D.,
例题2.(2022·全国·高一课时练习)若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不低于第3名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是( )
A.甲同学:平均数为2,众数为1
B.乙同学:平均数为2,方差小于1
C.丙同学:中位数为2,众数为2
D.丁同学:众数为2,方差大于1
例题3.(2022·河北保定·高一阶段练习)在某市举行的唱歌比赛中,5名专业人士和5名观众代表组成一个评委小组,给参赛选手打分.这10个分数的平均分为8分,方差为12,若去掉一个最高分10分和一个最低分6分,则剩下的8个分数的方差为_____________.
附:已知样本数据的平均数与方差满足关系式.
例题4.(2022·全国·高一单元测试)在①55%分位数,②众数这两个条件中任选一个,补充在下面问题中的横线上,并解答问题.维生素又叫-抗坏血酸,是一种水溶性维生素,是高等灵长类动物与其他少数生物的必需营养素.现从猕猴桃 柚子两种食物中测得每100克维生素的含量(单位:mg)各10个数据如下,其中猕猴桃的一个数据被污损.
猕猴桃:104,119,106,102,132,107,113,134,116,x;
柚子:121,113,109,122,114,116,132,121,131,117.
已知等于柚子的10个数据中的___________.
(1)求的值与猕猴桃的数据的中位数;
(2)分别计算上述猕猴桃 柚子两种食物中测得每100克维生素含量的平均数.
同类题型归类练
1.(多选)(2022·全国·高一单元测试)某公司为了解用户对其产品的满意度,随机调查了10个用户,得到用户对产品的满意度评分如下表所示,评分用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高,则下列说法正确的是( )
7 8 9 7 5 4 10 9 4 7
A.这组数据的平均数为6 B.这组数据的众数为7
C.这组数据的极差为6 D.这组数据的75%分位数为9
2.(2022·山东滨州·高一期末)已知数据,…,的众数 平均数 方差 第80百分位数分别是,,,,数据,,,…,的众数 平均数 方差 第80百分位数分别是,,,,且满足,则下列结论正确的是( )
A. B. C. D.
3.(2022·湖北·襄阳五中高三阶段练习)若已知30个数的平均数为6,方差为9;现从原30个数中剔除这10个数,且剔除的这10个数的平均数为8,方差为5,则剩余的20个数的方差为___________.
4.(2022·全国·高一单元测试)鲤鱼是中华五千年文化传承的载体之一,它既是拼搏进取、敢于突破自我、敢于冒险奋进精神的载体,又是富裕、吉庆、幸运的美好象征.某水产养殖研究所准备进行“中国红鲤”和“中华彩鲤”杂交育种实验.研究所对200尾中国红鲤和160尾中华彩鲤幼苗进行2个月培育后,将根据体长分别选择生长快的10尾中国红鲤和8尾中华彩鲤作为种鱼进一步培育.为了解培育2个月后全体幼鱼的体长情况,将其按照品种进行分层随机抽样,其中抽取的40尾中国红鲤的体长数据(单位:cm)如下:
5.0 6.0 7.0 7.5 8.0 8.4 4.0 3.5 4.5 4.3
5.0 4.0 3.0 2.5 4.0 1.6 6.0 6.5 5.5 5.7
3.1 5.2 4.4 5.0 6.4 3.5 7.0 4.0 3.0 3.4
6.9 4.8 5.6 5.0 5.6 6.5 3.0 6.0 7.0 6.6
(1)根据以上数据,估计某尾体长为8.3 cm的中国红鲤能否被选为种鱼,并说明理由.
(2)通过计算得到样本中中国红鲤体长的平均值为5.1 cm,中华彩鲤体长的平均值为4.875 cm,求所有样本数据的平均值.
角度2:频率分布直方图中的数字特征
典型例题
例题1.(多选)(2022·江苏·如皋市第一中学高一期末)某中学举行安全知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按照分成了5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是( )
A.这组数据的极差为50 B.这组数据的众数为76
C.这组数据的中位数为 D.这组数据的第75百分位数为85
例题2.(2022·吉林·长春市第二实验中学高一期末)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例、使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数、将数据分成7组:,,…,,并整理得到如图的频率分布直方图.
(1)估计总体400名学生中分数小于60的人数;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间内的人数;
(3)根据该大学规定、把25%的学生划定为不及格、确定本次测试的及格分数线、低于及格分数线的学生需要补考.
例题3.(2022·全国·高一单元测试)中秋佳节来临之际,小李准备销售一种农特产,这段时间内,每售出1箱该特产获利50元,未售出的,每箱亏损30元.经调查,市场需求量的频率分布直方图如图所示.小李购进了160箱该特产,以(单位:箱,)表示市场需求量,(单位:元)表示经销该特产的利润.
(1)根据频率分布直方图估计市场需求量的众数和平均数;
(2)将表示为的函数;
(3)根据频率分布直方图求利润不少于4800元的频率.
同类题型归类练
1.(多选)(2022·黑龙江·哈九中高一期末)某校为了解学生对食堂的满意程度,设计了一份调查问卷,从该校高中生中随机抽取部分学生参加测试,记录了他们的分数,将收集到的学生测试分数按照,,,,,,分组,画出频率分布直方图,已知随机抽取的学生测试分数不低于80分的学生有27人,则以下结论中正确的是( )
A.此次测试众数的估计值为85
B.此次测试分数在的学生人数为6人
C.随机抽取的学生测试分数的第55百分位数约为80
D.平均数m在中位数n右侧
2.(2022·全国·高一单元测试)某市政府为了节约生活用水,实施居民生活用水定额管理政策,即确定一个居民月用水量标准x(单位:吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,并随机抽取部分居民进行调查,抽取的居民月均用水量的频率分布直方图如图所示.(同一组中的数据以该组区间的中点值为代表)
(1)求频率分布直方图中a的值;
(2)试估计该市居民月均用水量的众数、平均数;
(3)如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?
3.(2022·河北保定·高一阶段练习)某学校组织“数学文化”知识竞赛,分为初赛和决赛,有400名学生参加知识竞赛的初赛(满分150分),根据初赛成绩依次分为,,,,,这六组,得到如图所示的频率分布直方图.
(1)求本次初赛成绩的平均数;(每组数据以区间中点值为代表)
(2)若计划决赛人数为80,估计参加决赛的最低分数线.
4.(2022·贵州黔东南·高一期末)统计某校n名学生期中考试化学成绩(单位:分),由统计结果得如下频数分布表和频率分布直方图:
化学成绩组 [50,60) [60,70) [70,80) [80,90) [90,100]
频数 m 26 38 p 8
(1)求出表中m,p的值;
(2)估计该校学生化学成绩的平均数(同一组中的数据用该组区间的中点值作代表)及中位数(保留一位小数);
(3)根据以上抽样调查数据,能否认为该校学生化学成绩达到“化学成绩不低于70分的学生所占比例不低于该校全体学生的80%”的考核标准?
题型三:总体离散程度的估计
典型例题
例题1.(2022·海南·琼海市嘉积第二中学高二期中)已知、、…、的平均值为6,方差为3,则、、…、的平均值为______,方差为______.
例题2.(2022·湖南·湘阴县教育科学研究室高一期末)为了了解某设备生产产品质量的稳定性,现随机抽取了10件产品,其质量(单位:克)如下:495,500,503,508,498,500,493,500,503,500,质量落在区间 (表示质量的平均值,为标准差)内的产品件数为____.
例题3.(2022·全国·高一单元测试)为响应“绿色出行”号召,某市先后推出了“共享单车”和“新能源分时租赁汽车”,并计划在甲 乙两个工厂选择一个工厂生产汽车轮胎,现分别从甲 乙两厂各随机选取10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:
(1)分别计算甲 乙两厂提供的10个轮胎宽度的平均数;
(2)轮胎的宽度在内,则称这个轮胎是标准轮胎.试比较甲 乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个工厂会被选择.
例题4.(2022·黑龙江·哈尔滨三中高一期末)2022年北京冬奥会的成功举办,带动中国3亿多人参与冰雪运动,这是对国际奥林匹克运动发展的巨大贡献.2020《中国滑雪产业白皮书》显示,2020-2021排名前十的省份的滑雪人次(单位:万人次)数据如下表:
排名 省份 2020-2021 2019-2020 2018-2019
1 河北 221 136 235
2 吉林 202 123 207
3 北京 188 112 186
4 黑龙江 149 101 195
5 新疆 133 76 116
6 四川 99 52 69
7 河南 98 58 95
8 浙江 94 62 108
9 陕西 79 47 76
10 山西 78 39 100
(1)由表中数据可知,2018-2019年这十个省份滑雪总人次为1387万,而受疫情影响,2019-2020年下降至806万,计算2018-2019年和2019-2020年这10个省份滑雪人次的平均数,,并据此计算这两年的平均数;
(2)已知2018-2019年滑雪人次的方差,2019-2020年滑雪人次的方差,据此计算这两年滑雪人次的方差;(结果保留整数)
(3)据统计近年滑雪人均每次消费为6000元,若以2020-2021年数据为基础,每个省份滑雪人次都按(2)中标准差的人数增长(过程中数据均保留整数),估计2021-2022年滑雪消费超过100亿元的省份有几个?
同类题型归类练
1.(2022·全国·高一单元测试)从甲 乙 丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查,结果如下:
甲:5,5,6,6,8,8,8,10;
乙:4,5,6,7,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
(1)三个厂家的广告中都称该产品的使用寿命是8年,请指出___________(从“甲 乙 丙”三厂家中选择一个)厂家在广告中依据了统计数据中的哪个特征数?
(2)计算甲厂家抽取的8件产品的方差.
2.(2022·全国·高一单元测试)随着手机和网络的普及,外卖行业得到迅速的发展.某外卖平台为了解某地区用户对其提供的服务的满意度,随机调查了40个用户,得到用户的满意度评分如下:
(1)请你估计该地区所有用户评分的25%,95%分位数;
(2)若从这40个用户中抽取一个容量为10的样本,且抽到的10个用户的评分分别为92,84,86,78,89,74,83,78,77,89,试计算这10个数据的平均数和方差;
(3)在(2)的条件下,若用户的满意度评分在内,则满意度等级为“A级”,试用样本估计总体的思想,根据所抽到的10个数据,估计该地区满意度等级为“A级”的用户所占的百分比.
(参考数据:,,)
3.(2022·山东济南·高一期末)为了调查某中学高一年级学生的身高情况,在高一年级随机抽取100名学生作为样本,把他们的身高(单位:cm)按照区间,,,,分组,得到样本身高的频率分布直方图如图所示.
(1)求频率分布直方图中x的值以及样本中身高不低于175cm的学生人数;
(2)在统计过程中,小明与小张两位同学因事缺席,测得其余98名同学的平均身高为172cm,方差为29.之后补测得到小明与小张的身高分别为171cm与173cm.试根据上述数据求样本的方差.
4.(2022·山西吕梁·高一期末)随着高校强基计划招生的持续开展,我市高中生抓起了参与数学兴趣小组的热潮.为调查我市高中生对数学学习的喜好程度,从甲、乙两所高中各随机抽取了名学生,记录他们在一周内平均每天学习数学的时间,并将其分成了个区间:、、、、、,整理得到如下频率分布直方图:
(1)求图1中的值,并估计甲高中学生一周内平均每天学习数学时间的众数;
(2)估计乙高中学生一周内平均每天学习数学时间的均值及方差(同一组中的数据用该组区间的中点值作代表);
(3)若从甲、乙两所高中分别抽取样本量为、的两个样本,经计算得它们的平均数和方差分别为:、与、,记总的样本平均数为,样本方差为,证明:
①;
②.
1.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A. B. C. D.
2.(2021·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
3.(多选)(2021·全国·高考真题)下列统计量中,能度量样本的离散程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的极差 D.样本的平均数
4.(2021·全国·高考真题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
5.(2021·全国·高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).

展开更多......

收起↑

资源列表