资源简介 中小学教育资源及组卷应用平台专题24 统计与统计案例【考纲要求】1、了解随机抽样2、掌握用样本估计总体3、理解统计是实际应用一、随机抽样【思维导图】【考点总结】一、 随机抽样像人口普查那样,对每一个调查对象都惊醒调查的方法,称为全面调查,又称普查.在一个调查中,我们把调查对象的全体成为总体,组成总体的每一个调查对象成为个体.像这样,根据一定目的,从总体中抽取-一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.1.简单的随机抽样一般地,设一个总体含有N (N为正整数)个个体,从中逐个抽取n(1≤n如果抽取是不放回的,且每次抽取时总体内未进人样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.2.分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.二、用样本估计总体1.总体取值规律的估计为了探索-组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.在这个实际问题中,因为我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例,所以选择频率分布表和频率分布直方图来整理和表示数据.与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.1.求极差极差式一组数据中最大值与最小值的差2.决定组距与组数合适的组距与组数对发现数据分布规律有重要意义.组数太多或太少,都会影响我们了解数据的分布情况组距与组数的确定没有固定的标准,常常需要-一个尝试和选择的过程。数据分组的组数与数据的个数有关,一般数据的个数越多,所分组数也越多.3.将数据分组4.列频率分布表5.画频率分布直方图小长方形的面积=组距×总体百分位数的估计把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,区间(13.6, 13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数=13.7,并称此数为这组数据的第80百分位数,或80%分位数.一般地,一组数据的第p百分位数是这样-一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且少有(100-p)%的数据大于或等于这个值.三、统计案例 公司员工的肥胖情况调查分析背景与数据近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数来衡量人体胖瘦程度以及是否健康,其计算公式是BMI=中国成人的BMI数值标准为:BM1<18.5为偏瘦;18.5≤BMI<23.9为正常;24≤ BMI<27.9为偏胖;BMI≥28为肥胖.【题型汇编】题型一:随机抽样题型二:用样本估计总体题型三:统计案例【题型讲解】题型一:随机抽样一、单选题1.(2022·上海静安·二模)2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市联合举行.共有个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为人,延庆冬奥村的容量约人,张家口冬奥村的容量约人.为了解各冬奥村服务质量,现共准备了份调查问卷,采用分层抽样的方法,则需在延庆冬奥村投放的问卷数量是( )A.58份 B.50份 C.32份 D.19份【答案】C【解析】【分析】直接由分层抽样的概念计算求解即可.【详解】在延庆冬奥村投放的问卷数量是份.故选:C.2.(2022·青海·大通回族土族自治县教学研究室三模(文))2021年东京奥运会某国家游泳队有男运动员48人,女运动员36人,世界反兴奋剂机构采用分层抽样的方法,从该国游泳运动员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中女运动员应抽的人数为( )A.12 B.14 C.16 D.18【答案】A【解析】【分析】根据分层抽样的性质解题即可.【详解】因为每个个体被抽到的概率等于,根据分层抽样方法的原理可得样本中女运动员的人数为.故选:A.3.(2022·陕西宝鸡·二模(文))北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”很受欢迎,现工厂决定从20只“冰墩墩”,15只“雪容融”和10个北京2022年冬奥会会徽中,采用比例分配分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n为( )A.3 B.2 C.5 D.9【答案】D【解析】【分析】利用分层抽样中的比例列出方程,求出答案.【详解】,解得:故选:D4.(2022·江西·二模(理))某工厂利用随机数表对生产的300个零件进行抽样测试,先将300个零件进行编号001,002,…,299,300.从中抽取30个样本,根据提供随机数表的第5行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第3个样本编号是( )84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45A.072 B.134 C.007 D.253【答案】A【解析】【分析】根据随机数表的使用方法,从表中第5行第6列开始向右读取数据,每3个数字一组,判断其是否小于或等于300且与已经取过的编号是否重复即可得到所需样本编号.【详解】从表中第5行第6列开始向右读取数据,依次为:253(第1个),313(大于300,不取),457(大于300,不取),860(大于300,不取),736(大于300,不取),253(与253重复,不取),007(第2个),328(大于300,不取),623(大于300,不取),457(大于300,不取),889(大于300,不取),072(第3个).故得到的第3个样本编号是072.故选:A.5.(2022·新疆乌鲁木齐·二模(理))从某中学随机抽取100名学生,将他们的身高数据(单位cm)绘制成频率分布直方图,若要从身高在,,三组内的学生中,用分层抽样的方法选取16人参加一次活动.则从身高在内的学生中选取的人数应为( )A.3 B.4 C.5 D.7【答案】B【解析】【分析】先求得的值,然后结合分层抽样的知识计算出正确答案.【详解】依题意,解得,身高在,,三组内的学生比例为,用分层抽样的方法选取16人参加一次活动,则从身高在内的学生中选取的人数应为人故选:B二、多选题1.(2022·湖南·雅礼中学二模)下列说法正确的有( )A.一组数据按大小顺序排列,位于最中间的一个数据就是中位数B.分层抽样为保证每个个体等可能入样,需在各层中进行简单随机抽样C.若A∩B为不可能事件,A∪B为必然事件,则事件A与事件B互为对立事件D.线性回归分析中,的值越小,说明残差平方和越小,则模型拟合效果越好【答案】BC【解析】【分析】根据题意依次判断即可.【详解】对A,一组数据按大小顺序排列,位于最中间的一个数据或中间两个数的平均数是中位数,故A错误;对B,根据随机抽样的性质可判断B正确;对C,根据对立事件的定义可判断C正确;对D,线性回归分析中,的值越大,说明残差平方和越小,则模型拟合效果越好,故D错误.故选:BC.三、解答题1.(2022·四川成都·三模(理))某中学为增强学生的环保意识,举办了“爱成都,护环境”的知识竞赛活动,为了解本次知识竞赛活动参赛学生的成绩,从中抽取了n名学生的分数(得分取正整数,满分为100分,所有学生的得分都在区间中)作为样本进行统计.按照,,,,的分组作出如下的频率分布直方图,并作出下面的样本分数茎叶图(图中仅列出了得分在,的数据).(1)求样本容量n和频率分布直方图中x,y的值;(2)在选取的样本中,从竞赛成绩不低于70分的三组学生中按分层抽样抽取了9名学生,再从抽取的这9名学生中随机抽取2名学生到天府广场参加环保知识宣传活动,求这2名学生中恰好有1名学生的分数在中的概率.【答案】(1);;(2)【解析】【分析】(1)根据茎叶图中的频数和直方图中的频率求出和,再根据所有频率之和为求出即可得解;(2)根据分层抽样和古典概型的概率公式可求出结果.(1)由直方图可知,分数在中的频率为,根据茎叶图可知,分数在中的频数为,所以样本容量,根据茎叶图可知,分数在中的频数为,所以分数在中的频率为,所以,所以,由,得,综上所述:,,.(2)由题意,本次竞赛成绩样本中分数在中的学生有名,分数在中的学生有名,分数在中的学生有名.按分层抽样抽取的9名学生中,分数在中的学生有名,分数在中的学生有名,分数在中的学生有名.∴从这9名学生中随机选取2名学生的情况种数.又所选2名学生中恰好有1名学生的分数在中的情况种数,∴所选2名学生中恰好有1名学生的分数在中的概率.2.(2022·江西师大附中三模(文))随着经济的高速发展,南昌市居住环境及人文环境进一步得到改善.目前已基本依水建成赣江西岸绿道 赣江东岸绿道 乌沙河绿道 玉带河桃花河绿道 抚河故道绿道 幸福渠绿道 艾溪湖瑶湖绿道等城市主干绿道.新建提升20个公园,精心打造100条景观路,织起一张“四横七纵六环”的“绿道网”.另外,位于凤凰洲赣江边的省文化中心的建成已成为展示江西历史文化的地标建筑.省文化中心由省博物馆 省图书馆 省科技馆三馆组成,三个主体建筑由北向南排列,分别隐喻历史 现在与未来,反映出文化发展的路径,描述了探索知识的故事与旅程.作为江西省文化的新地标,城市的新客厅,成为加快推动江西文化强省建设的一个亮丽缩影,成为丰富江西省人民群众精神文化需求的重要阵地.(1)相比老年人而言,青年人更喜欢在闲暇时间选择去省文化中心参观 学习.已知某区青年人的男女比例为3:2,现采用分层抽样的方法从中抽取100名作为样本,对这100位青年是否在闲暇时间去省文化中心进行统计,得条形图如下所示.男 女 合计去省文化中心不去省文化中心合计完成下列2×2列联表,并判断是否有90%的把握认为青年人选择去省文化中心与性别有关?(2)现有甲 乙 丙 丁四位青年人,他们每个周末都选择去省文化中心,将他们想去的场馆情况汇总如下:场馆 图书馆 科技馆 博物馆意向 甲 乙 丙 甲 乙 丁 乙 丙 丁若每人只能从已登记的选择意向中随机选取一个场馆,且每个场馆至多有两人选择,求甲 乙两人选择去同一个场馆的概率.附:0.100 0.050 0.025 0.010 , 其中.2.706 3.841 5.024 6.635【答案】(1)列联表答案见解析,没有90%的把握认为青年人选择去省文化中心与性别有关(2)【解析】【分析】(1)先由分层抽样及条形图完善列联表,再计算,结合临界值作出判断即可;(2)列举出所有的基本事件,从中找出甲 乙两人选择去同一个场馆的基本事件,由古典概型求解即可.(1)由分层抽样知男性共人,女性共人,结合条形图得去省文化中心男性有人,去省文化中心女性人,完成2×2列联表如下:男 女 合计去省文化中心 40 25 65不去省文化中心 20 15 35合计 60 40 100计算:,所以,没有90%的把握认为青年人选择去省文化中心与性别有关.(2)分两种情况来考虑:4人分别去其中的两个场馆 4人分别去三个场馆.我们将所有的情况列举如下:序号 图书馆 科技馆 博物馆1 甲丙 乙丁2 乙丙 甲丁3 甲乙 丙丁4 甲丁 乙丙5 甲乙 丙丁6 甲丙 乙丁7 甲乙 丁 丙8 甲丙 乙 丁9 甲丙 丁 乙10 乙丙 甲 丁11 丙 甲乙 丁12 乙 甲丁 丙13 丙 甲丁 乙14 甲 乙丁 丙15 甲 丁 乙丙16 甲 乙 丙丁17 乙 甲 丙丁18 丙 甲 乙丁共有18种选择,其中甲 乙选择同一个场馆的有4种,故概率为.题型二:用样本估计总体一、单选题1.(2022·辽宁·抚顺市第二中学三模)下列一组数据、、、、、、、、、的分位数为( )A. B. C. D.【答案】D【解析】【分析】利用百分位数的定义可求得结果.【详解】题干中共个数,因为,所以,所求的分位数为.故选:D.2.(2022·全国·二模(理))以下三组数据的标准差分别为,,.5,5,5,5,5,5,5,5,53,3,4,4,5,6,6,7,72,2,2,2,5,8,8,8,8则有( )A. B.C. D.【答案】A【解析】【分析】分别计算出三组数据的标准差,比较得到结果.【详解】第一组数据的平均数为5,所以方差为0,标准差为;第二组数据的平均数为,所以方差为,故标准差为,第三组数据的平均数为,所以方差为,故标准差为,所以故选:A3.(2022·新疆·三模(文))塔里木河为中国第一大内流河,全长2179千米,由发源于天山的阿克苏河,发源于昆仑山的叶尔羌河,和田河汇流而成,塔里木河自西向东蜿蜓于塔里木盆地北部,上游地区大多流经起伏不平的戈壁荒漠,所以河水的含沙量大,很不稳定,被称为“无缰的野马”,已知阿克苏河,和田河和叶尔羌河的含沙量和流量比(见表),则塔里木河河水的含沙量约为( )三河河水的含沙量和流量比河的名称 含沙量 流量比阿克苏河和田河 叶尔羌河 3.869.85 3.2 72 1A.3.333 B.4.060C.4.992 D.5.637【答案】C【解析】【分析】根据表中数据给定的流量比,确定含沙权数为7,2,1,再根据各自的含沙量确定塔里木河河水的含沙量.【详解】已知阿克苏河,和田河和叶尔羌河的含沙量和流量比为,所以阿克苏河,和田河和叶尔羌河流量的含沙量的权数分别为:7,2,1.由加权平均数公式得塔里木河河水的含沙量约为:.故选:C.4.(2022·江西赣州·二模(理))一组数据按从小到大排列为2,3,3,x,7,10,若这组数据的平均数是中位数的倍,则下列说法错误的是( )A. B.众数为3 C.中位数为4 D.方差为【答案】D【解析】【分析】先求出,再根据定义或方差的计算公式逐项判断后可得正确的选项.【详解】这组数据的平均数为,而中位数为,故,解得,故A正确,此时该组数据的众数为3,故B正确,而中位数为,故C正确,方差为,故D错误,故选:D.5.(2022·陕西商洛·二模(文))数据,,,…,的平均数为,数据,,,…,的平均数为,则数据,,,…,,,,,…,的平均数为( )A. B.C. D.【答案】D【解析】【分析】利用平均数的计算公式计算.【详解】由题意得:,,所以故选:D6.(2022·河南河南·三模(理))一支田径队有男运动员48人,女运动员36人,用分层抽样的方法从全体运动员中抽取一个容量为7的样本,抽出的男运动员平均身高为,抽出的女运动员平均身高为,估计该田径队运动员的平均身高是( )A. B. C. D.【答案】B【解析】【分析】根据平均数的求法求得该田径队运动员的平均身高【详解】依题意,该田径队运动员的平均身高为.故选:B7.(2022·辽宁葫芦岛·一模)有一组样本数据,,…,,由这组数据得到新样本数据,,,…,,其中,c为非零常数,则( )A.两组样本数据的样本方差相同 B.两组样本数据的样本众数相同C.两组样本数据的样本平均数相同 D.两组样本数据的样本中位数相同【答案】A【解析】【分析】由方差、平均数、众数和中位数的定义依次判断即可.【详解】因为原来样本平均数,新样本平均数,C错误;原来方差为,新样本方差为,A正确;设原样本众数为,则新样本众数为,B错误;设原样本中位数为,则新样本中位数为,D错误.故选:A.8.(2022·天津·二模)为了检查“双减”政策落实效果,某校邀请学生家长对该校落实效果进行评分.现随机抽取100名家长进行评分调查,发现他们的评分都在40—100之间,将数据按分成6组,整理得到如图所示的频率分布直方图,则在抽取的家长中,评分落在区间内的人数是( )A.55 B.75 C.80 D.85【答案】B【解析】【分析】根据给定的频率分布直方图,求得落在区间内的频率为,进而求得其人数.【详解】根据给定的频率分布直方图,可得落在区间内的频率为:,所以在抽取的家长中,评分落在区间内的人数是人.故选:B.二、多选题1.(2022·辽宁大连·二模)为评估一种农作物的种植效果,选了10块地作试验田.这10块地的亩产量(单位:kg)互不相等,且从小到大分别为,则下列说法正确的有( )A.的平均数可以用来评估这种农作物亩产量稳定程度B.的标准差可以用来评估这种农作物亩产量稳定程度C.可以用来评估这种农作物亩产量稳定程度D.的中位数为【答案】BC【解析】【分析】根据平均数、标准差、极差、中位数的定义即可求解.【详解】解:标准差和极差都可以用来评估这种农作物亩产量稳定程度,故BC正确.故A错误,中位数为,故D错.故选:BC.2.(2022·重庆·三模)已知一组样本数据:4,4,5,7,7,7,8,9,9,10.关于这组样本数据,结论正确的是( )A.平均数为8 B.众数为7 C.极差为6 D.中位数为8【答案】BC【解析】【分析】分别求出平均数、众数、极差和中位数,即可判断.【详解】对于数据:4,4,5,7,7,7,8,9,9,10.平均数为,故A错误;众数为7.故B正确;极差为10-4=6.故C正确;中位数为.故D错误.故选:BC三、解答题1.(2022·黑龙江·哈九中三模(文))某经销商采购了一批水果,根据某些评价指标进行打分,现从中随机抽取20筐(每筐1kg),得分数据如下:17,23,29,31,34,40,46,50,51,51,58,62,62,68,71,78,79,80,85,95.根据以往的大数据认定:得分在区间,,,内的分别对应四级、三级、二级、一级.(1)试求这20筐水果得分的平均数.(2)用样本估计总体,经销商参考以下两种销售方案进行销售;方案1:将得分的平均数换算为等级,按换算后的等级出售;方案2:分等级出售.不同等级水果的售价如下表所示:等级 一级 二级 三级 四级售价(万元/吨) 2 1.8 1.4 1.2请从经销商的角度,根据售价分析采用哪种销售方案较好,并说明理由.【答案】(1)(2)采用方案1较好;理由见解析【解析】【分析】(1)利用平均数公式进行求解;(2)分别计算出方案1与方案2的平均数,比较后得到答案.(1)这20筐水果得分的平均数为(2)方案1:由于得分的平均数,所以可以估计这批水果的销售单价为1.8万元/吨.方案2:设这批水果售价的平均值为万元/吨,由已知数据得,得分在内的有17,23,共2个,所以估计四级水果所占比例为,得分在内的有29,31,34,40,46,50,共6个,所以估计三级水果所占比例为,得分在内的有51,51,58,62,62,68,71,共7个,所以估计二级水果所占比例为,得分在内的有78,79,80,85,95,共5个,所以估计一级水果所占比例为,则(万元/吨).所以从经销商的角度考虑,采用方案1的售价较高,所以采用方案1较好.2.(2022·贵州遵义·三模(文))某中学在2021年高考分数公布后对高三年级各班的成绩进行分析.经统计,某班有50名同学,总分都在区间内,将得分区间平均分成5组,统计频数、频率后,得到了如图所示的“频率分布”折线图.(1)请根据频率分布折线图,画出频率分布直方图;(2)根据频率分布直方图估计该班级的平均分.【答案】(1)答案见解析(2)【解析】【分析】(1)根据频率分布折线图,画出频率分布直方图;(2)根据频率分布直方图,和平均数计算方法,即可求出结果.(1)根据折线图,频率分布直方图如下图:(2)平均分为:;所以该班级的平均分约为.题型三:统计案例一、单选题1.(2022·全国·高三专题练习(理))为保障食品安全,某监管部门对辖区内一家食品企业进行检查,现从其生产的某种产品中随机抽取100件作为样本,并以产品的一项关键质量指标值为检测依据,整理得到如下的样本频率分布直方图.若质量指标值在内的产品为一等品,则该企业生产的产品为一等品的概率约为( )A.0.38 B.0.61C.0.122 D.0.75【答案】B【分析】利用频率组距,即可得解.【详解】根据频率分布直方图可知,质量指标值在内的概率故选:B2.(2022·全国·高三专题练习(理))某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【答案】A【分析】观察折线图,结合选项逐一判断即可【详解】对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,观察折线图,各年的月接待游客量高峰期大致在7,8月份,故C正确;对于D选项,观察折线图,各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳,故D正确.故选:A3.(2022·全国·高三专题练习)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【分析】首先设出新农村建设前的经济收入为M,根据题意,得到新农村建设后的经济收入为2M,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.【详解】设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入我0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D正确;故选A.点睛:该题考查的是有关新农村建设前后的经济收入的构成比例的饼形图,要会从图中读出相应的信息即可得结果.4.(2022·天津·高三专题练习)某学校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30],样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是A.56 B.60 C.140 D.120【答案】C【详解】试题分析:由题意得,自习时间不少于小时的频率为,故自习时间不少于小时的人数为,故选C.考点:频率分布直方图及其应用.二、多选题5.(2022·湖南娄底·高三期末)2017年3月,由国家信息中心“一带一路”大数据中心等编写的《“一带一路”贸易合作大数据报告(2017)》发布,呈现了我国与“一带一路”沿线国家的贸易成果现状报告.贸易顺差额=贸易出口额-贸易进口额.由数据分析可知,在2011年到2016年这六年中( ).中国与“一带一路”沿线国家出口额和进口额(亿美元)A.2016年中国与沿线国家贸易进口额最小B.中国与沿线国家贸易进口额的中位数为4492亿美元C.中国与沿线国家贸易出口额逐年递增D.中国与沿线国家贸易顺差额逐年递增【答案】AB【分析】每一个选项根据题中的信息进行分析即可判断.【详解】对于A,2011年中国与沿线国家贸易出口额最小,进口额最小的是2016年,所以A正确;对于B,由已知图中的数据可得进口额的中位数为4492,B正确;对于C,2014年到2016年的出口额为6370.4,6145.8,5874.8,所以C错误;对于D,又2011年至2016年的贸易顺差额依次为:142.9,428.6,976.8,1536.8,2262.4,2213.7,2016年开始下降,所以D错误.故选:AB6.(2022·江苏·高三专题练习)江西省重点中学协作体于2020年进行了一次校际数学竞赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在之间,其得分的频率分布直方图如图,则下列结论正确的是( )A.得分在之间的共有40人B.从这100名参赛者中随机选取1人,其得分在的概率为0.5C.这100名参赛者得分的中位数为65D.可求得【答案】ABD【分析】结合频率分布直方图,对每一个选项一一分析即可.A算出的频率,再乘以100可得答案,B算出得分在中的频率即可,C找出面积刚好为0.5的位置,再算其频率,D利用频率之和为1,列出算式可求.【详解】由频率分布直方图,可得对于选项A,得分在之间共有人,故A正确;对于选项B,从100名参赛者中随机选取1人,其得分在中的概率为,故B正确;对于选项C,前2个小矩形面积之和为0.4,前3个小矩形面积之和为0.7,所以中位数在[60,70],这100名参赛者得分的中位数为,故C错误;对于选项D,由频率分布直方图的性质,可得,解得,故D正确.故选:ABD.7.(2022·全国·高三专题练习)如图是某公司2018年1月至12月空调销售任务及完成情况的统计图,如10月份销售任务是400台,完成率为90%,下列叙述正确的是A.2018年3月的销售任务是400台B.2018年月销售任务的平均值不超过600台C.2018年总销售量为4870台D.2018年月销售量最大的是6月份【答案】ABC【解析】由频率分布折线图、密度曲线逐一检验即可得解.【详解】解:由题图可知选项A正确;2018年月销售任务的平均值为,故选项B正确;2018年总销售量为,故选项C正确;2018年月销售量最大的是5月份,为800台,故选项D不正确.故选:【点睛】本题考查了频率分布折线图、密度曲线,属于基础题.三、解答题1.(2022·全国·高三专题练习(文))某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.的分组企业数 2 24 53 14 7(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:.【答案】(1) 增长率超过的企业比例为,产值负增长的企业比例为;(2)平均数;标准差.【分析】(1)本题首先可以通过题意确定个企业中增长率超过的企业以及产值负增长的企业的个数,然后通过增长率超过的企业以及产值负增长的企业的个数除随机调查的企业总数即可得出结果;(2)可通过平均值以及标准差的计算公式得出结果.【详解】(1)由题意可知,随机调查的个企业中增长率超过的企业有个,产值负增长的企业有个,所以增长率超过的企业比例为,产值负增长的企业比例为.(2)由题意可知,平均值,标准差的平方:,所以标准差.【点睛】本题考查平均值以及标准差的计算,主要考查平均值以及标准差的计算公式,考查学生从信息题中获取所需信息的能力,考查学生的计算能力,是简单题.2.(2022·全国·高三专题练习(文))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.(1)求乙离子残留百分比直方图中的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1) ,;(2) ,.【分析】(1)由及频率和为1可解得和的值;(2)根据公式求平均数.【详解】(1)由题得,解得,由,解得.(2)由甲离子的直方图可得,甲离子残留百分比的平均值为,乙离子残留百分比的平均值为【点睛】本题考查频率分布直方图和平均数,属于基础题.21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台专题24 统计与统计案例【考纲要求】1、了解随机抽样2、掌握用样本估计总体3、理解统计是实际应用一、随机抽样【思维导图】【考点总结】一、 随机抽样像人口普查那样,对每一个调查对象都惊醒调查的方法,称为全面调查,又称普查.在一个调查中,我们把调查对象的全体成为总体,组成总体的每一个调查对象成为个体.像这样,根据一定目的,从总体中抽取-一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.1.简单的随机抽样一般地,设一个总体含有N (N为正整数)个个体,从中逐个抽取n(1≤n如果抽取是不放回的,且每次抽取时总体内未进人样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.2.分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.二、用样本估计总体1.总体取值规律的估计为了探索-组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.在这个实际问题中,因为我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例,所以选择频率分布表和频率分布直方图来整理和表示数据.与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.1.求极差极差式一组数据中最大值与最小值的差2.决定组距与组数合适的组距与组数对发现数据分布规律有重要意义.组数太多或太少,都会影响我们了解数据的分布情况组距与组数的确定没有固定的标准,常常需要-一个尝试和选择的过程。数据分组的组数与数据的个数有关,一般数据的个数越多,所分组数也越多.3.将数据分组4.列频率分布表5.画频率分布直方图小长方形的面积=组距×总体百分位数的估计把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,区间(13.6, 13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数=13.7,并称此数为这组数据的第80百分位数,或80%分位数.一般地,一组数据的第p百分位数是这样-一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且少有(100-p)%的数据大于或等于这个值.三、统计案例 公司员工的肥胖情况调查分析背景与数据近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数来衡量人体胖瘦程度以及是否健康,其计算公式是BMI=中国成人的BMI数值标准为:BM1<18.5为偏瘦;18.5≤BMI<23.9为正常;24≤ BMI<27.9为偏胖;BMI≥28为肥胖.【题型汇编】题型一:随机抽样题型二:用样本估计总体题型三:统计案例【题型讲解】题型一:随机抽样一、单选题1.(2022·上海静安·二模)2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市联合举行.共有个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为人,延庆冬奥村的容量约人,张家口冬奥村的容量约人.为了解各冬奥村服务质量,现共准备了份调查问卷,采用分层抽样的方法,则需在延庆冬奥村投放的问卷数量是( )A.58份 B.50份 C.32份 D.19份2.(2022·青海·大通回族土族自治县教学研究室三模(文))2021年东京奥运会某国家游泳队有男运动员48人,女运动员36人,世界反兴奋剂机构采用分层抽样的方法,从该国游泳运动员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中女运动员应抽的人数为( )A.12 B.14 C.16 D.183.(2022·陕西宝鸡·二模(文))北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”很受欢迎,现工厂决定从20只“冰墩墩”,15只“雪容融”和10个北京2022年冬奥会会徽中,采用比例分配分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n为( )A.3 B.2 C.5 D.94.(2022·江西·二模(理))某工厂利用随机数表对生产的300个零件进行抽样测试,先将300个零件进行编号001,002,…,299,300.从中抽取30个样本,根据提供随机数表的第5行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第3个样本编号是( )84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45A.072 B.134 C.007 D.2535.(2022·新疆乌鲁木齐·二模(理))从某中学随机抽取100名学生,将他们的身高数据(单位cm)绘制成频率分布直方图,若要从身高在,,三组内的学生中,用分层抽样的方法选取16人参加一次活动.则从身高在内的学生中选取的人数应为( )A.3 B.4 C.5 D.7二、多选题1.(2022·湖南·雅礼中学二模)下列说法正确的有( )A.一组数据按大小顺序排列,位于最中间的一个数据就是中位数B.分层抽样为保证每个个体等可能入样,需在各层中进行简单随机抽样C.若A∩B为不可能事件,A∪B为必然事件,则事件A与事件B互为对立事件D.线性回归分析中,的值越小,说明残差平方和越小,则模型拟合效果越好三、解答题1.(2022·四川成都·三模(理))某中学为增强学生的环保意识,举办了“爱成都,护环境”的知识竞赛活动,为了解本次知识竞赛活动参赛学生的成绩,从中抽取了n名学生的分数(得分取正整数,满分为100分,所有学生的得分都在区间中)作为样本进行统计.按照,,,,的分组作出如下的频率分布直方图,并作出下面的样本分数茎叶图(图中仅列出了得分在,的数据).(1)求样本容量n和频率分布直方图中x,y的值;(2)在选取的样本中,从竞赛成绩不低于70分的三组学生中按分层抽样抽取了9名学生,再从抽取的这9名学生中随机抽取2名学生到天府广场参加环保知识宣传活动,求这2名学生中恰好有1名学生的分数在中的概率.2.(2022·江西师大附中三模(文))随着经济的高速发展,南昌市居住环境及人文环境进一步得到改善.目前已基本依水建成赣江西岸绿道 赣江东岸绿道 乌沙河绿道 玉带河桃花河绿道 抚河故道绿道 幸福渠绿道 艾溪湖瑶湖绿道等城市主干绿道.新建提升20个公园,精心打造100条景观路,织起一张“四横七纵六环”的“绿道网”.另外,位于凤凰洲赣江边的省文化中心的建成已成为展示江西历史文化的地标建筑.省文化中心由省博物馆 省图书馆 省科技馆三馆组成,三个主体建筑由北向南排列,分别隐喻历史 现在与未来,反映出文化发展的路径,描述了探索知识的故事与旅程.作为江西省文化的新地标,城市的新客厅,成为加快推动江西文化强省建设的一个亮丽缩影,成为丰富江西省人民群众精神文化需求的重要阵地.(1)相比老年人而言,青年人更喜欢在闲暇时间选择去省文化中心参观 学习.已知某区青年人的男女比例为3:2,现采用分层抽样的方法从中抽取100名作为样本,对这100位青年是否在闲暇时间去省文化中心进行统计,得条形图如下所示.男 女 合计去省文化中心不去省文化中心合计完成下列2×2列联表,并判断是否有90%的把握认为青年人选择去省文化中心与性别有关?(2)现有甲 乙 丙 丁四位青年人,他们每个周末都选择去省文化中心,将他们想去的场馆情况汇总如下:场馆 图书馆 科技馆 博物馆意向 甲 乙 丙 甲 乙 丁 乙 丙 丁若每人只能从已登记的选择意向中随机选取一个场馆,且每个场馆至多有两人选择,求甲 乙两人选择去同一个场馆的概率.附:0.100 0.050 0.025 0.010 , 其中.2.706 3.841 5.024 6.635题型二:用样本估计总体一、单选题1.(2022·辽宁·抚顺市第二中学三模)下列一组数据、、、、、、、、、的分位数为( )A. B. C. D.2.(2022·全国·二模(理))以下三组数据的标准差分别为,,.5,5,5,5,5,5,5,5,53,3,4,4,5,6,6,7,72,2,2,2,5,8,8,8,8则有( )A. B.C. D.3.(2022·新疆·三模(文))塔里木河为中国第一大内流河,全长2179千米,由发源于天山的阿克苏河,发源于昆仑山的叶尔羌河,和田河汇流而成,塔里木河自西向东蜿蜓于塔里木盆地北部,上游地区大多流经起伏不平的戈壁荒漠,所以河水的含沙量大,很不稳定,被称为“无缰的野马”,已知阿克苏河,和田河和叶尔羌河的含沙量和流量比(见表),则塔里木河河水的含沙量约为( )三河河水的含沙量和流量比河的名称 含沙量 流量比阿克苏河和田河 叶尔羌河 3.869.85 3.2 72 1A.3.333 B.4.060C.4.992 D.5.6374.(2022·江西赣州·二模(理))一组数据按从小到大排列为2,3,3,x,7,10,若这组数据的平均数是中位数的倍,则下列说法错误的是( )A. B.众数为3 C.中位数为4 D.方差为5.(2022·陕西商洛·二模(文))数据,,,…,的平均数为,数据,,,…,的平均数为,则数据,,,…,,,,,…,的平均数为( )A. B.C. D.6.(2022·河南河南·三模(理))一支田径队有男运动员48人,女运动员36人,用分层抽样的方法从全体运动员中抽取一个容量为7的样本,抽出的男运动员平均身高为,抽出的女运动员平均身高为,估计该田径队运动员的平均身高是( )A. B. C. D.7.(2022·辽宁葫芦岛·一模)有一组样本数据,,…,,由这组数据得到新样本数据,,,…,,其中,c为非零常数,则( )A.两组样本数据的样本方差相同 B.两组样本数据的样本众数相同C.两组样本数据的样本平均数相同 D.两组样本数据的样本中位数相同8.(2022·天津·二模)为了检查“双减”政策落实效果,某校邀请学生家长对该校落实效果进行评分.现随机抽取100名家长进行评分调查,发现他们的评分都在40—100之间,将数据按分成6组,整理得到如图所示的频率分布直方图,则在抽取的家长中,评分落在区间内的人数是( )A.55 B.75 C.80 D.85二、多选题1.(2022·辽宁大连·二模)为评估一种农作物的种植效果,选了10块地作试验田.这10块地的亩产量(单位:kg)互不相等,且从小到大分别为,则下列说法正确的有( )A.的平均数可以用来评估这种农作物亩产量稳定程度B.的标准差可以用来评估这种农作物亩产量稳定程度C.可以用来评估这种农作物亩产量稳定程度D.的中位数为2.(2022·重庆·三模)已知一组样本数据:4,4,5,7,7,7,8,9,9,10.关于这组样本数据,结论正确的是( )A.平均数为8 B.众数为7 C.极差为6 D.中位数为8三、解答题1.(2022·黑龙江·哈九中三模(文))某经销商采购了一批水果,根据某些评价指标进行打分,现从中随机抽取20筐(每筐1kg),得分数据如下:17,23,29,31,34,40,46,50,51,51,58,62,62,68,71,78,79,80,85,95.根据以往的大数据认定:得分在区间,,,内的分别对应四级、三级、二级、一级.(1)试求这20筐水果得分的平均数.(2)用样本估计总体,经销商参考以下两种销售方案进行销售;方案1:将得分的平均数换算为等级,按换算后的等级出售;方案2:分等级出售.不同等级水果的售价如下表所示:等级 一级 二级 三级 四级售价(万元/吨) 2 1.8 1.4 1.2请从经销商的角度,根据售价分析采用哪种销售方案较好,并说明理由.2.(2022·贵州遵义·三模(文))某中学在2021年高考分数公布后对高三年级各班的成绩进行分析.经统计,某班有50名同学,总分都在区间内,将得分区间平均分成5组,统计频数、频率后,得到了如图所示的“频率分布”折线图.(1)请根据频率分布折线图,画出频率分布直方图;(2)根据频率分布直方图估计该班级的平均分.题型三:统计案例一、单选题1.(2022·全国·高三专题练习(理))为保障食品安全,某监管部门对辖区内一家食品企业进行检查,现从其生产的某种产品中随机抽取100件作为样本,并以产品的一项关键质量指标值为检测依据,整理得到如下的样本频率分布直方图.若质量指标值在内的产品为一等品,则该企业生产的产品为一等品的概率约为( )A.0.38 B.0.61C.0.122 D.0.752.(2022·全国·高三专题练习(理))某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳3.(2022·全国·高三专题练习)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半4.(2022·天津·高三专题练习)某学校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30],样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是A.56 B.60 C.140 D.120二、多选题5.(2022·湖南娄底·高三期末)2017年3月,由国家信息中心“一带一路”大数据中心等编写的《“一带一路”贸易合作大数据报告(2017)》发布,呈现了我国与“一带一路”沿线国家的贸易成果现状报告.贸易顺差额=贸易出口额-贸易进口额.由数据分析可知,在2011年到2016年这六年中( ).中国与“一带一路”沿线国家出口额和进口额(亿美元)A.2016年中国与沿线国家贸易进口额最小B.中国与沿线国家贸易进口额的中位数为4492亿美元C.中国与沿线国家贸易出口额逐年递增D.中国与沿线国家贸易顺差额逐年递增6.(2022·江苏·高三专题练习)江西省重点中学协作体于2020年进行了一次校际数学竞赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在之间,其得分的频率分布直方图如图,则下列结论正确的是( )A.得分在之间的共有40人B.从这100名参赛者中随机选取1人,其得分在的概率为0.5C.这100名参赛者得分的中位数为65D.可求得7.(2022·全国·高三专题练习)如图是某公司2018年1月至12月空调销售任务及完成情况的统计图,如10月份销售任务是400台,完成率为90%,下列叙述正确的是A.2018年3月的销售任务是400台B.2018年月销售任务的平均值不超过600台C.2018年总销售量为4870台D.2018年月销售量最大的是6月份三、解答题1.(2022·全国·高三专题练习(文))某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.的分组企业数 2 24 53 14 7(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:.2.(2022·全国·高三专题练习(文))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.(1)求乙离子残留百分比直方图中的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源列表 专题24 统计与统计案例(原卷版).docx 专题24 统计与统计案例(解析版).docx