资源简介 第2节 用样本估计总体1.能用样本估计总体的集中趋势参数(平均数、中位数、众数、百分位数),理解集中趋势参数的统计含义.2.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.1.百分位数(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)四分位数:25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.第50百分位数就是中位数,中位数是百分位数的特例,百分位数是中位数的推广.2.总体集中趋势的估计数字特征 样本数据 频率分布直方图众数 出现次数最多的数据 取最高的小矩形底边中点的横坐标中位数 将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标平均数 样本数据的算术平均数=(x1+x2+…+xn) 每个小矩形的面积乘小矩形底边中点的横坐标之和平均数、中位数、众数分别从不同角度描述了一组数据的特征,刻画了一组数据的大致情况.平均数表示“一般水平”,中位数表示“中等水平”,众数表示“多数水平”.一组数据的平均数、中位数都是唯一的.众数不唯一,还可以没有,且众数一定是原数据中的数,而平均数和中位数都不一定是原始数中的数.3.总体离散程度的估计设一组数据x1,x2,x3,…,xn的平均数为 ,则这组数据的方差和标准差分别是s2=,s=.方差和标准差描述了一组数据与平均数的离散程度,反映了一组数据相对于平均数的波动情况,标准差和方差越大,说明这组数据的波动性越大.1.若数据x1,x2,…,xn的平均数为 ,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.2.s2=(xi-)2=-,即各数平方的平均数减去平均数的平方.1.(多选题)某校高三年级共有800名学生参加了数学测验(满分150分),已知这800名学生的数学成绩均不低于90分,将这800名学生的数学成绩分组并得到频率分布直方图(如图所示),则下列说法正确的是( BCD )A.a=0.045B.这800名学生中数学成绩在110分以下的人数为160人C.这800名学生数学成绩的众数可近似认为是125D.这800名学生数学成绩的第75百分位数约为128.6解析:对选项A,(0.01+0.01+0.025+a+0.015+0.005)×10=1,解得a=0.035,故A错误;对选项B,成绩在110分以下的人数为(0.01+0.01)×10×800=160,故B正确;对选项C,由频率分布直方图可知众数可近似认为是125,故C正确;对选项D,成绩的第75百分位数约为120+×10≈128.6,故D正确.故选BCD.2.(2021·四川成都高三三模)某市环境保护局公布了该市A,B两个景区2014年至2020年各年的全年空气质量优良天数的数据.现根据这组数据绘制了如图所示的折线图,则由该折线图得出的下列结论正确的是( D )A.景区A这七年的空气质量优良天数的极差为98B.景区B这七年的空气质量优良天数的中位数为283C.分别记景区A,B这七年的空气质量优良天数的众数为m1,m2,则m1>m2D.分别记景区A,B这七年的空气质量优良天数的标准差为s1,s2,则s1>s2解析:A.景区A这七年的空气质量优良天数的极差为313-203=110,本选项不正确;B.景区B这七年的空气质量优良天数的中位数为266,本选项不正确;C.由折线图可知,m1=254,m2=262,显然m1D.由折线图可知,景区A这七年的空气质量优良天数的数据波动要比景区B这七年的空气质量优良天数的数据波动大,因此s1>s2,本选项正确.故选D.3.如图是某校随机抽取100名学生数学月考成绩的频率分布直方图,据此估计该校本次月考数学成绩的总体情况(同一组中的数据用该组区间的中点值为代表),下列说法正确的是( D )A.平均数为74B.众数为60或70C.中位数为75D.该校数学月考成绩在80分以上的学生约占25%解析:对于A,=0.005×10×55+0.04×10×65+0.03×10×75+0.02×10×85+0.005×10×95=73,故A不正确;对于B,由频率分布直方图可知众数为65,故B不正确;对于C,设中位数为x,则0.005×10+0.04×10+0.03×(x-70)=0.5,解得x=71,故C不正确;对于D,数学月考成绩在80分以上的学生约占0.02×10+0.005×10=0.25,即为25%,故D正确.故选D.4.(必修第二册P202例2改编)一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,则该组数据的第75百分位数为 ,第86百分位数为 . 解析:因为75%×20=15,所以第75百分位数为=14.5.因为86%×20=17.2,所以第86百分位数为第18个数据17.答案:14.5 175.(2021·山东淄博二模)某班40名学生,在一次考试中统计所得平均分为80分,方差为70,后来发现有两名同学的成绩有损,甲实得80分错记为60分,乙实得70分错记为90分,则更正后的方差为 . 解析:因为甲实得80分,记为60分,少记20分,乙实得70分,记为90分,多记20分,所以总分没有变化,因此更正前后的平均分没有变化,都是80分,设甲、乙以外的其他同学的成绩分别为a3,a4,…,a40,因为更正前的方差为70,所以(60-80)2+(90-80)2+(a3-80)2+…+(a40-80)2=70×40,所以(a3-80)2+…+(a40-80)2=2 800-400-100=2 300,更正后的方差为s2===60,所以更正后的方差为60.答案:60总体百分位数的估计 离散型数字的百分位数从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,50,95百分位数;(2)请你找出珍珠质量较小的前15%的珍珠质量;(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解:(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,则第25百分位数是=8.15,第50百分位数是=8.5,第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15,第50百分位数为8.5,第95百分位数是9.9,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.计算一组数据的p%分位数的步骤 连续型数字的百分位数统计局就某地居民的月收入(单位:元)情况调查了10 000人,并根据所得数据画出了样本频率分布直方图,如图所示.每个分组包括左端点,不包括右端点,如第一组表示月收入在[2 500,3 000)内.(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入从这10 000人中用分层随机抽样的方法抽出100人进行进一步分析,则月收入在[4 000,4 500)内的应抽取多少人 (2)根据频率分布直方图估计样本数据的第50百分位数.解:(1)因为(0.000 2+0.000 4+0.000 3+0.000 1+2a)×500=1,所以a=0.000 5.所以月收入在[4 000,4 500)内的频率为0.000 5×500=0.25,所以100人中月收入在[4 000,4 500)内的人数为0.25×100=25.(2)法一 因为0.000 2×500=0.1,0.000 4×500=0.2,0.000 5×500=0.25,0.1+0.2+0.25=0.55>0.5,所以样本数据的中位数是3 500+=3 900(元).法二 设所求的中位数为x,由于中位数将频率分布直方图平均分为两部分,所以0.1+0.2+(x-3 500)×0.000 5=0.5,解得x=3 900(元).频率分布直方图中第p百分位数的求解方法可以模仿中位数的求解思路:(1)确定第p百分位数所在的区间[a,b).(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+×(b-a).[针对训练]1.某车间12名工人一天生产某产品(单位:kg)的数量分别为13.8,13,13.5,15.7,13.6,14.8,14,14.6,15,15.2,15.8,15.4,则所给数据的第25,50,75百分位数分别是 . 解析:将12个数据按从小到大排序:13,13.5,13.6,13.8,14,14.6,14.8,15,15.2,15.4,15.7,15.8.由i=12×25%=3,得所给数据的第25百分位数是第3个数据与第4个数据的平均数,即=13.7;由i=12×50%=6,得所给数据的第50百分位数是第6个数据与第7个数据的平均数,即=14.7;由i=12×75%=9,得所给数据的第75百分位数是第9个数据和第10个数据的平均数,即=15.3.答案:13.7,14.7,15.32.将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图(如图所示),则此班的模拟考试成绩的80%分位数是 (结果保留两位小数). 解析:由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.022 5)×10×100%=92.5%,因此,80%分位数一定位于[120,130)内.因为120+×10≈124.44.所以此班的模拟考试成绩的80%分位数约为124.44.答案:124.44总体集中趋势的估计某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05,则高一参赛学生的成绩的众数、中位数、平均成绩分别为( )A.65 65 67 B.65 70 67C.70 65 70 D.65 65 70解析:用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得出众数为65.又因为第一个小矩形的面积为0.3,设第二个小矩形底边的一部分长为x,则x×0.04=0.2,解得x=5,所以中位数为60+5=65.依题意,利用平均数的计算公式,可得平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,所以参赛学生的平均成绩为67分.故选A.用频率分布直方图估计众数、中位数、平均数(1)众数:取最高小长方形底边中点的横坐标作为众数.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.[针对训练]为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均值为 ,则( )A.me=m0= B.me=m0<C.me解析:由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现次数最多,故m0=5,=≈5.97.于是m0总体离散程度的估计 极差、方差(标准差)的计算(多选题)甲、乙两名射击运动员在某次测试中各射击20次,两人测试成绩的条形图如图所示,则( )A.甲运动员测试成绩的中位数等于乙运动员测试成绩的中位数B.甲运动员测试成绩的众数大于乙运动员测试成绩的众数C.甲运动员测试成绩的平均数大于乙运动员测试成绩的平均数D.甲运动员测试成绩的方差小于乙运动员测试成绩的方差解析:由图可得甲运动员测试成绩中3次7环,8次8环,5次9环,4次10环,所以甲运动员测试成绩的中位数为8,众数为8,平均数为=8.5,方差为=;乙运动员测试成绩中4次7环,7次8环,4次9环,5次10环,所以乙运动员测试成绩的中位数为8,众数为8,平均数为=8.5,方差为=,故选项A正确,B不正确,C不正确,D正确.故选AD.计算标准差的5步骤(1)求出样本数据的平均数 .(2)求出每个样本数据与样本平均数的差xi-(i=1,2,…,n).(3)求出xi-(i=1,2,…,n)的平方值.(4)求出上一步中n个平方值的平均数,即为样本方差.(5)求出上一步中平均数的算术平方根,即为样本标准差. 样本的数字特征与优化决策问题(2019·全国Ⅱ卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的 分组 [-0.20,0) [0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80)企业 数 2 24 53 14 7(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:≈8.602.解:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)=×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=ni(yi-)2=×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6.s==0.02×≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[针对训练]1.(多选题)(2021·福建三明高三期末)某研究性学习小组调査了某脱贫县的甲、乙两个家庭,对他们过去7年(2013年至2019年)的家庭收入情况分别进行统计,得到这两个家庭的年人均纯收入(单位:千元/人)数据,绘制成折线图如图所示.根据上图信息,对于甲、乙两个家庭的年人均纯收入(以下分别简称甲,乙)情况的判断,正确的是( )A.过去7年,甲的极差小于乙的极差B.过去7年,甲的平均值小于乙的平均值C.过去7年,甲的中位数小于乙的中位数D.过去7年,甲的年平均增长率小于乙的年平均增长率解析:A.甲的极差为4.2-3.6=0.6,乙的极差为4.1-3.4=0.7,故A正确;B.甲的平均数为=,乙的平均数为=,故B错误;C.将数据从小到大进行排列,甲的中位数为3.7;乙的中位数为3.8,故C正确;D.过去7年,甲的年平均增长率为-1,乙的年平均增长率为-1.因为-==<0,所以-1<-1,故D正确.故选ACD.2.(2020·全国Ⅰ卷)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如表:甲分厂产品等级的频数分布表等级 A B C D频数 40 20 20 20乙分厂产品等级的频数分布表等级 A B C D频数 28 17 34 21(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务 解:(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为=0.4;乙分厂加工出来的一件产品为A级品的概率的估计值为=0.28.(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为利润 65 25 -5 -75频数 40 20 20 20因此甲分厂加工出来的100件产品的平均利润为=15(元).由数据知乙分厂加工出来的100件产品利润的频数分布表为利润 70 30 0 -70频数 28 17 34 21因此乙分厂加工出来的100件产品的平均利润为=10(元).比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.如图所示是某市3月1日至3月10日的最低气温(单位:℃)的折线统计图,由图可知这10天最低气温的第80百分位数是( )A.-2 B.0 C.1 D.2解析:由折线图可知,这10天的最低气温按照从小到大的排列为:-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是=2.故选D.某同学随机抽查某市10个小区所得到的绿化率情况如表所示:小区绿化率/% 20 25 30 32小区个数 2 4 3 1则关于这10个小区绿化率情况,下列说法错误的是( )A.方差是13% B.众数是25%C.中位数是25% D.平均数是26.2%解析:根据表格数据,众数为25%,选项B正确;中位数为25%,选项C正确;平均数为%=26.2%,选项D正确;方差为[2×(20-26.2)2+4×(25-26.2)2+3×(30-26.2)2+(32-26.2)2]=15.96;选项A错误.故选A.知识点、方法 基础巩固练 综合运用练 应用创新练百分位数 6,8众数、中位数、平均数 3 10,11,13极差、方差与标准差 3,5,7 10,11,12 15统计图表与数字特征的综合 1,2,4,9 14 161.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论不正确的是( C )A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间解析:因为频率分布直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%>50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.故选C.2.(2021·吉林高三模拟)甲,乙,丙三名运动员在某次测试中各射击20次,三人测试成绩的频率分布条形图分别如图1,图2和图3所示,若s甲,s乙,s丙分别表示他们测试成绩的标准差,则( D )A.s乙C.s乙解析:甲的平均成绩为(7+8+9+10)×0.25=8.5,其方差为=0.25×[(7-8.5)2+(8-8.5)2+(9-8.5)2+(10-8.5)2]=1.25.乙的平均成绩为7×0.3+8×0.2+9×0.2+10×0.3=8.5,其方差为=0.3×(7-8.5)2+0.2×(8-8.5)2+0.2×(9-8.5)2+0.3×(10-8.5)2=1.45.丙的平均成绩为7×0.2+8×0.3+9×0.3+10×0.2=8.5,其方差为=0.2×(7-8.5)2+0.3×(8-8.5)2+0.3×(9-8.5)2+0.2×(10-8.5)2=1.05.所以s丙3.(多选题)(2021·新高考Ⅰ卷)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( CD )A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同解析:A.E(y)=E(x+c)=E(x)+c且c≠0,故平均数不相同,错误;B.若第一组中位数为xi,则第二组的中位数为yi=xi+c,显然不相同,错误;C.D(y)=D(x)+D(c)=D(x),故方差相同,正确;D.由极差的定义知,若第一组的极差为xmax-xmin,则第二组的极差为ymax-ymin=(xmax+c)-(xmin+c)=xmax-xmin,故极差相同,正确.故选CD.4.在某次高中学科竞赛中,4 000名考生的参赛成绩按[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成六组,其频率分布直方图如图所示,则下列说法错误的是( D )A.成绩在[70,80)内的考生人数最多B.不及格(60分以下)的考生人数约为1 000人C.考生竞赛成绩平均分的估计值为70.5分D.考生竞赛成绩中位数的估计值为75分解析:A.根据统计图可知,[70,80)对应的频率除以组距的值最大,即频率最大,所以人数最多,故正确;B.不及格的频率为(0.010+0.015)×10=0.25,所以不及格的人数约为4 000×0.25=1 000(人),故正确;C.根据频率分布直方图可知平均数为(45×0.01+55×0.015+65×0.02+75×0.03+85×0.015+95×0.01)×10=70.5,故正确;D.前三组的频率之和为(0.01+0.015+0.02)×10=0.45<0.5,前四组的频率之和为(0.01+0.015+0.02+0.03)×10=0.75>0.5,所以中位数在第四组数据中,且中位数为70+×10≈71.7,故错误.故选D.5.已知数据x1,x2,…,x2 020的平均数、标准差分别为=90,sx=20,数据y1,y2,…,y2 020的平均数、标准差分别为 ,sy,若yn=+5(n=1,2,…,2 020),则( D )A.=45,sy=5 B.=45,sy=10C.=50,sy=5 D.=50,sy=10解析:因为yn=+5(n=1,2,…,2 020),所以=[(+5)+(+5)+…+(+5)]=[()+5×2 020]=+5=50,sy===sx=×20=10.故选D.6.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为 .解析:成绩的70%分位数为x,因为=0.55,=0.85,所以x∈[16,17),所以0.55+(x-16)×=0.70,解得x=16.5.答案:16.57.在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1■,■,那么这组数据的方差s2可能的最大值是 .解析:设这组数据的最后两个分别是10+x,y,则9+10+11+(10+x)+y=50,得x+y=10,故y=10-x,故s2==+x2,显然x取9时,s2有最大值32.8.答案:32.88.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为 ; (2)由频率分布直方图估计志愿者年龄的85%分位数为 . 解析:(1)设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.(2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,所以志愿者年龄的85%分位数在[35,40)内,因此志愿者年龄的85%分位数为35+×5≈39.答案:(1)0.04 (2)399.(2021·安徽合肥调研)第24届冬奥会将于2022年在中国北京和张家口举行.为宣传冬奥会,让更多的人了解、喜爱冰雪项目,某大学举办了冬奥会知识竞赛,并从中随机抽取了100名学生的成绩,绘制成如图所示的频率分布直方图.(1)试根据频率分布直方图估计,这100人的平均成绩(同一组数据用该组区间的中点值代替);(2)若采用分层随机抽样的方法从成绩在[70,80),[80,90),[90,100]的学生中共抽取6人,再将其随机地分配到3个社区开展冬奥会宣传活动(每个社区2人),求“成绩在同一区间的学生分配到不同社区”的概率.解:(1)平均成绩=0.02×45+0.16×55+0.22×65+0.30×75+0.20×85+0.10×95=73.00.(2)由题意知,从成绩在[70,80),[80,90),[90,100]的学生中分别选取了3人,2人,1人.6人平均分成3组分配到3个社区,共有=90种方法.成绩在同一区间的学生分配到不同社区的方法有=36(种),所以“成绩在同一区间的学生分配到不同社区”的概率P==.10.(多选题)(2021·辽宁锦州高三一模)冬末春初,乍暖还寒,人们容易感冒发热.若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产.某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3 ℃,则称没有发生群体性发热.下列连续7天体温高于37.3 ℃人数的统计特征数中,能判定该公司没有发生群体性发热的为( BD )A.中位数为3,众数为2B.均值小于1,中位数为1C.均值为3,众数为4D.均值为2,标准差为解析:将7个数由小到大依次记为x1,x2,x3,x4,x5,x6,x7.对于A选项,反例:2,2,2,3,3,4,6,满足中位数为3,众数为2,与题意矛盾,A选项不合乎要求;对于B选项,假设x7≥6,即该公司发生了群体性发热,因中位数为1,则x6≥x5≥x4=1,平均数为=≥>1,矛盾,故假设不成立,即该公司没有发生群体性发热,B选项合乎要求;对于C选项,反例:0,1,2,4,4,4,6,满足众数为4,均值为3,与题意矛盾,C选项不合乎要求;对于D选项,假设x7≥6,即该公司发生群体性发热,若均值为2,则方差为s2=≥=>2,即s>,与D选项矛盾,故假设不成立,即该公司没有发生群体性发热,D选项合乎要求.故选BD.11.(多选题)(2021·河北邯郸高三三模)在管理学研究中,有一种衡量个体领导力的模型,称为“五力模型”,即一个人的领导力由五种能力——影响力、控制力、决断力、前瞻力和感召力构成.如图是某企业对两位领导人领导力的测评图,其中每项能力分为三个等级,“一般”记为4分、“较强”记为5分、“很强”记为6分,把分值称为能力指标,则下列判断正确的是( AB )A.甲、乙的五项能力指标的均值相同B.甲、乙的五项能力指标的方差相同C.如果从控制力、决断力、前瞻力考虑,乙的领导力高于甲的领导力D.如果从影响力、控制力、感召力考虑,甲的领导力高于乙的领导力解析:甲的五项能力指标为6,5,4,5,4.平均值为=4.8,乙的五项能力指标为6,4,5,4,5,平均值为=4.8,则A正确;由于均值相同,各项指标数也相同(只是顺序不同),所以方差也相同,则B正确;从控制力、决断力、前瞻力考虑,甲的均值为,乙的均值为,所以甲的领导力高于乙的领导力,则C不正确;从影响力、控制力、感召力考虑,甲、乙的指标均值相同,方差也相同,所以甲、乙水平相当,则D不正确.故选AB.12.(2021·河南郑州一测)某同学10次测评成绩的数据如下(从小到大排列):2,2,3,4,10+x,10+y,19,19,20,21.已知成绩的中位数为12,若要使标准差最小,则4x+2y的值为 . 解析:由成绩的中位数为12,得=12,故x+y=4,故成绩的平均数为(2+2+3+4+10+x+10+y+19+19+20+21)=11.4.要使标准差最小,即方差最小,只需使(10+x-11.4)2+(10+y-11.4)2最小,又(10+x-11.4)2+(10+y-11.4)2=(x-1.4)2+(y-1.4)2≥=0.72,当且仅当x-1.4=y-1.4时取等号,即x=y=2时,标准差最小.此时4x+2y=12.答案:1213.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.(1)求,,,;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果-≥2,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解:(1)==10,==10.3,==0.036,==0.04.(2)依题意,-=0.3=2×0.15=2=2,2=2,-≥2,所以新设备生产产品的该项指标的均值较旧设备有显著提高.14.某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200 kW·h的部分按0.5元/(kW·h)收费,超过200 kW·h但不超过400 kW·h的部分按0.8元/(kW·h)收费,超过400 kW·h的部分按1.0元/(kW·h)收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:kW·h)的函数解析式;(2)为了了解居民的用电情况,通过随机抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值;(3)根据(2)中求得的数据计算用电量的75%分位数.解:(1)当0≤x≤200时,y=0.5x;当200y=0.5×200+0.8×(x-200)=0.8x-60;当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140. 所以y与x之间的函数解析式为y=(2)由(1)可知,当y=260时,x=400,即用电量低于400 kW·h的占80%,结合频率分布直方图可知解得a=0.001 5,b=0.002 0.(3)设75%分位数为m,因为用电量低于300 kW·h的所占比例为(0.001+0.002+0.003)×100=60%,用电量低于400 kW·h的占80%,所以75%分位数m在[300,400)内,所以0.6+(m-300)×0.002=0.75,解得m=375,即用电量的75%分位数为375.15.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.甲、乙两位同学分别随机抽取10位本地市民调查他们的幸福感指数,甲得到十位市民的幸福感指数分别为5,6,6,7,7,7,7,8,8,9,乙得到十位市民的幸福感指数的平均数为8,方差为2.2,则这20位市民幸福感指数的方差为( C )A.1.75 B.1.85C.1.95 D.2.05解析:设甲得到的十位市民的幸福感指数分别为x1,x2,…,x10,乙得到十位市民的幸福感指数分别为x11,x12,…,x20,故这20位市民的幸福感指数的方差为(++…+++…+)-,因为乙得到十位市民的幸福感指数的平均数为8,方差为2.2,x11+x12+…+x20=8×10=80,故==7.5,而(+…+)-64=2.2,故+…+=662,而++…+=52+62+62+4×72+2×82+92=502,故所求的方差为(502+662)-7.52=1.95.故选C.16.(多选题)(2021·福建高三二模)在第一次全市高三年级统考后,某数学老师为了解本班学生的本次数学考试情况,将全班50名学生的数学成绩绘制成频率分布直方图.已知该班级学生的数学成绩全部介于65到145之间(满分150分),将数学成绩按如下方式分成八组:第一组[65,75),第二组[75,85),…,第八组[135,145],按上述分组方法得到的频率分布直方图的一部分,如图所示,则下列结论正确的是( BCD )A.第七组的频率为0.008B.该班级数学成绩的中位数的估计值为101C.该班级数学成绩的平均分的估计值大于95D.该班级数学成绩的方差的估计值大于26解析:对于选项A,设第七组的频率为x,则10×(0.004+0.012+0.016+0.03+0.02+0.006+0.004)+x=1,得x=0.08,选项A错误;对于选项B,由10×(0.004+0.012+0.016+0.03)=0.62>0.5>10×(0.004+0.012+0.016)=0.32知中位数在[95,105)区间.若中位数为x,则10×(0.004+0.012+0.016)+(x-95)×0.03=(105-x)×0.03+10×(0.02+0.006+0.008+0.004),解得x=101,选项B正确;对于选项C,由图知70×0.04+80×0.12+90×0.16+100×0.3+110×0.2+120×0.06+130×0.08+140×0.04=102,选项C正确;对于选项D,s2=fi=(70-102)2×0.04+(80-102)2×0.12+(90-102)2×0.16+(100-102)2×0.3+(110-102)2×0.2+(120-102)2×0.06+(130-102)2×0.08+(140-102)2×0.04=276,选项D正确.故选BCD. 展开更多...... 收起↑ 资源预览