资源简介 第九章 统计、成对数据的统计分析第1节 随机抽样、统计图表 [课标要求] (1)获取数据的基本途径及相关概念:①知道获取数据的基本途径及相关概念;②了解总体、样本、样本容量的概念,了解数据的随机性;(2)抽样:①了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数法;②了解分层抽样的特点和适用范围,了解分层抽样的必要性,掌握各层样本量比例分配的方法;(3)统计图表:能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性. 备考第1步——梳理教材基础,落实必备知识1.统计的有关概念名称 定义全面调查(普查) 对每一个调查对象都进行调查的方法总体 在一个调查中,把调查对象的全体称为总体个体 组成总体的每一个调查对象抽样调查 根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法样本 从总体中抽取的那部分个体样本量 样本中包含的个体数2.简单随机抽样(1)一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n(2)最常用的简单随机抽样的方法:抽签法和随机数法.3.分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.4.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数,组数=;(3)将数据分组;(4)列频率分布表,=频率;(5)画频率分布直方图.5.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.6.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.7.条形图、折线图及扇形图(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.(一)必背常用结论1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.(二)盘点易错易混1.利用随机数表抽样时,①选定的初始数和读数的方向是任意的;②对各个个体编号要视总体中的个体数情况而定,且必须保证所编号码的位数一致.2.在频率分布直方图中,要注意纵轴表示的不是该组的频率,而是,对应小矩形的面积才是相应的频率.【小题热身】1.某幼儿园为了了解全园310名小班学生的身高情况,从中抽取31名学生进行身高测量,下列说法正确的是( )A.总体是310B.310名学生中的每一名学生都是个体C.样本是31名小班学生D.样本容量是31解析:根据样本和样本容量,总体和总体容量的定义可知,样本是学生的身高,样本容量是31,总体是310名学生的身高,总体容量是310,故选D.答案:D2.[易错题]用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )A., B.,C., D.,解析:法一 在抽样过程中,个体a每一次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为.故选A.法二 第一次被抽到,显然为;第二次被抽到,首先第一次不能被抽到,第二次抽才被抽到.可能性为×=.故选A.答案:A3.(2021·山东潍坊三模)某学校参加志愿服务社团的学生中,高一年级有50人,高二年级有30人,高三年级有20人,现用分层抽样的方法从这100名学生中抽取学生组成一个活动小组,已知从高二年级的学生中抽取了6人,则从高三年级的学生中应抽取的人数为( )A.2 B.3 C.4 D.5解析:设高三抽取的人数为x人,则=,即x=4.答案:C4.(2021·天津高考)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70)、[70,74)、…、[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是( )A.20 B.40 C.64 D.80解析:由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.05×4=80.答案:D5.(多选)空气质量的指数AQI是反映空气质量状况的指数,AQI指数的值越小,表明空气质量越好.AQI指数不超过50,空气质量为“优”;AQI指数大于50且不超过100,空气质量为“良”;AQI指数大于100,空气质量为“污染”.下图是某市2020年空气质量指数(AQI)的月折线图.下列关于该市2020年空气质量的叙述中一定正确的是( )某市2020年空气质量指数(AQI)月折线图A.全年的平均AQI指数对应的空气质量等级为优或良B.每月都至少有一天空气质量为优C.2月,8月,9月和12月均出现污染天气D.空气质量为“污染”的天数最多的月份是2月份解析:每月的平均AQI指数都不超过100,故全年的平均AQI指数也不超过100,对应的空气质量为优或良,故选项A正确;每月的AQI指数最小值均不超过50,故每月都至少有一天空气质量为优,选项B正确;2月,8月,9月和12月AQI的指数最大值均大于100,故至少有一天出现了污染天气,故选项C正确;2月,8月,9月,12月中空气质量为“污染”的天数不确定,故选项D不一定正确.答案:ABC 备考第2步——突破核心考点,提升关键能力考点1__简单随机抽样[自主演练]【例1】 (1)利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为( )A. B. C. D.(2)嫦娥五号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第7个个体的编号为( )45 67 32 12 12 31 02 0104 52 15 20 01 12 51 2932 04 92 34 49 35 82 0036 23 48 69 69 38 74 81A.12 B.20C.29 D.23解析:(1)根据题意,=,解得n=28.故在整个抽样过程中每个个体被抽到的概率为=.(2)依次从数表中读出的有效编号为12,02,01,04,15,20,01,29,重复出现的数字只算第一次,所以选出来的第7个个体的编号为29.答案:(1)C (2)C[思维升华] 应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,将超过总体号码或出现重复号码的数字舍去.考点2__分层抽样[典例引领]【例2】 (1)(2021·河北邯郸二模)某校高一有500名学生,为了培养学生良好的阅读习惯,学校要求他们从四大名著中选一本阅读,其中有200人选《三国演义》,125人选《水浒传》,125人选《西游记》,50人选《红楼梦》,若采用分层抽样的方法随机抽取40名学生分享他们的读后感,则选《西游记》的学生抽取的人数为( )A.5 B.10 C.12 D.15(2)某工厂生产A,B,C三种不同型号的产品,某月生产A,B,C这三种型号的产品的数量之比依次为1∶a∶2,现用分层抽样的方法抽取一个容量为60的样本,已知B种型号的产品被抽取了24件,则a=( )A.1 B.2 C.3 D.4解析:(1)根据分层抽样的方法可得,选《西游记》的学生抽取的人数为40×=10.(2)由题可知=,解得a=2.答案:(1)B (2)B[思维升华] 1.分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.2.分层抽样的计算应根据抽样比构造方程求解.其中“抽样比==”.[对点练] 1.受疫情影响,口罩成了人们生活的必需品,为了解某市某口罩厂甲、乙、丙三个车间生产的同一种口罩质量是否存在显著差异,数量分别为2 400,1 600,1 200,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从乙车间的产品中抽取了40件,则n=( )A.90 B.100 C.120 D.130解析:因为甲、乙、丙三个车间生产的产品数量的比依次为2 400∶1 600∶1 200=6∶4∶3,所以=.求得n=130.答案:D2.(2021·安徽安庆一中三模)某工厂生产A、B、C三种产品的数量刚好构成一个公比为q(q≠1)的等比数列,现从全体产品中按分层抽样的方法抽取一个样本容量为260的样本进行调查,其中C产品的数量为20,则抽取的A产品的数量为( )A.100 B.140 C.180 D.120解析:因为A、B、C三种产品的数量刚好构成一个公比为q的等比数列,C产品的数量为20,所以A产品的数量为,B产品的数量为,因为样本容量为260,所以++20=260,解得q=或-(舍去),q=,则产品的数量为=180.答案:C考点3__统计图表及应用[多维讲练]统计图表主要包括扇形图、条形图、折线图、频率分布直方图和茎叶图,因其能直观简便的表示数据之间的变化及关系,故在高考中经常考查,多为选择或填空题,尤其是多项选择题中命制统计图表信息题的可能性更大.难度中等,主要考查数据分析和逻辑推理的核心素养.角度1 扇形图【例3】 (多选)(2021·山东威海模拟)2020年7月16日,国家统计局发布2020年上半年中国经济数据.数据显示,上半年,全国居民人均消费支出9 718元,较2019年上半年全国人均消费支出10 330元,下降约5.9%(不考虑价格因素),图1、图2分别为2019年上半年与2020年上半年居民人均消费支出构成,则下列说法正确的是( )A.2020年上半年较2019年上半年人均生活用品及服务消费支出减少了B.2019年上半年人均衣着消费支出和人均居住消费支出的总和超过了人均食品烟酒消费支出C.2020年上半年较2019年上半年人均居住消费支出减少了D.2020年上半年较2019年上半年人均教育文化娱乐消费支出比重降幅最大解析:对于A,2020年上半年和2019年上半年人均生活用品及服务消费支出占比均为6%,而2020年上半年人均消费支出比2019年上半年人均消费支出小,所以该项消费支出减少了,故选项A正确;对于B,2019年上半年人均衣着消费支出和人均居住消费支出的总和占比30.2%,超过了人均食品烟酒消费支出所占比例28.6%,故选项B正确;对于C,2019年上半年人均居住消费支出为10 330×23.1%≈2 386元,2020年上半年人均居住消费支出为9 718×25.4%≈2 468元,人均居住消费支出增加了,故选项C错误;对于D,由图可知,人均教育文化娱乐消费支出比重降幅最大,为10%-6.8%=3.2%,故选项D正确.答案:ABD[思维升华] 通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.[对点练] 1.(多选)某校研究性学习小组根据某市居民人均消费支出的统计数据,制作2018年人均消费支出条形图(单位:元)和2019年人均消费支出扇形图(如图).已知2019年居民人均消费总支出比2018年居民人均消费总支出提高8.5%,则下列结论正确的是( )A.2019年的人均衣食支出金额比2018年的人均衣食支出金额高B.2019年除医疗以外的人均消费支出金额等于2018年的人均消费总支出金额C.2019年的人均文教支出比例比2018年的人均文教支出比例有提高D.2019年人均各项消费支出中,“其他”消费支出的年增长率最低解析:∵2019年居民人均消费总支出比2018年居民人均消费总支出提高8.5%,∴2019年居民人均消费总支出为(7 000+4 600+2 300+1 700+4 400)×1.085=21 700(元),对于A,2019年的人均衣食支出金额为21 700×34.5%=7 486.5元,∴2019年的人均衣食支出金额比2018年的人均衣食支出金额高,故A正确;对于B,2019年除医疗以外的人均消费支出金额为21 700×(1-8.5%)=19 855.5,2018年的人均消费总支出金额为7 000+4 600+2 300+1 700+4 400=20 000元,2019年除医疗以外的人均消费支出金额不等于2018年的人均消费总支出金额,故B错误;对于C,2019年的人均文教支出比例为12.0%,2018年的人均文教支出比例为×100%=11.5%,∴2019年的人均文教支出比例比2018年的人均文教支出比例有提高,故C正确;对于D,2018年其他支出4 400元,2019年其他支出21 700×21.0%=4 557(元),“其他”消费支出的年增长率为×100%≈3.6%,衣食支出的年增长率为:×100%=6.95%,住支出的年增长率为:×100%≈13.22%,文教支出的年增长率为:×100%≈13.22%,医疗支出的年增长率为:×100%=8.5%,∴2019年人均各项消费支出中,“其他”消费支出的年增长率最低,故D正确.答案:ACD角度2 折线图【例4】 (2021·广西柳州三模)电表度数的“度”用字母“kW·h”表示,比如用电88度,就可用字母88 kW·h表示.电动车的“用电效率”是指电动车每消耗1 kW·h所行驶的里程,图描述了甲、乙、丙三辆汽车在不同速度下的“用电效率”情况.下列叙述中正确的是( )A.消耗1kW·h电,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车中,甲车消耗的电量最多C.甲车以80千米/小时的速度行驶1小时,消耗10 kW·h电D.某城市机动车最高限速80千米/小时.相同条件下,在该市用丙车比用乙车更省电[思维点拨]根据统计图表提供的数据进行判断.注意“用电效率”的定义.解析:对于A,由图象可知当速度大于40 km/h,乙车耗电量大于5 km/kW·h,所以当速度大于40 km/kW·h时,消耗1 kW·h,乙车的行驶距离大于5 km,故选项A错误;对于B,由图象可知,当速度相同时,甲车的耗电量最高,即速度相同时,消耗1 kW·h,甲车的行驶路程最远,所以以相同速度行驶相同路程,三辆车中,甲车消耗的电量最少,故选项B错误;对于C,由图象可知,当速度为80 km/kW·h时,甲车的耗电效率为10 km/kW·h,即甲车行驶10 km时,耗电量1 kW·h,故行驶1小时,路程为 80 km,耗电量为8 kW·h,故选项C错误;对于D,由图象可知,当速度小于80 km/kW·h时,丙车的耗电效率小于乙车的耗电效率,所以用丙车比乙车更省电,故选项D正确.答案:D[思维升华]折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.[对点练] 2.下图是国家统计局发布的2020年2月至2021年2月全国居民消费价格涨跌幅折线图;则给出下列三个结论:①2020年11月居民消费价格低于2019年同期;②2020年3月至7月居民的消费价格持续增长;③2020年7月的消费价格低于2020年3月的消费价格.其中所有正确结论的序号是________.说明:1.在统计学中,同比是指本期统计数据与上一年同期统计数据相比较,例如2021年2月与2020年2月相比较;环比是指本期统计数据与上期统计数据相比较,例如2020年4月与2020年3月相比较.2.同比增长率=×100%,环比增长率=×100%.解析:对于①:由图可知2020年11月同比增长率为-0.5,由同比增长率的计算公式可得,2020年11月居民消费价格低于2019年同期,故①正确;对于②:由图可知,2020年3月至6月的环比增长率为负,由环比增长率的计算公式可得消费价格下降,故②错误;对于③:设2020年3月居民消费价格为a3,4月消费价格为a4,5月消费价格为a5,6月消费价格为a6,7月消费价格为a7,由题意得×100%=-0.9%,解得a4=0.991a3,×100%=×100%=-0.8%,解得a5≈0.983a3,×100%=×100%=-0.1%,解得a6≈0.982a3,×100%=×100%=0.6%,解得a7≈0.988a3,所以a7答案:①③角度3 频率分布直方图【例5】 (2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间解析:因为频率分布直方图中的组距为1,所以各组的频率分布直方图的高度等于频率.样本频率分布直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比率估计值为0.10+0.14+0.20×2=0.64=64%>50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.答案:C[思维升华]在频率分布直方图中,×组距=频率,样本容量×频率=频数,频率和=各小长方形面积之和=1.[对点练] 3.(2021·河北保定二模)某中学为了解学生的数学学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图,根据频率分布直方图,推测这3000名学生在该次数学考试中成绩不低于80分的学生人数是__________.解析:由频率分布直方图成绩不低于80的学生的频率为10×(0.020+0.008)=0.28,所以成绩不低于80分的学生数是3 000×0.28=840.答案:840人 展开更多...... 收起↑ 资源预览