2023届高考数学一轮复习计划第一节 随机抽样、常用统计图表 学案

资源下载
  1. 二一教育资源

2023届高考数学一轮复习计划第一节 随机抽样、常用统计图表 学案

资源简介

第一节 随机抽样、常用统计图表
(1)了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数法.掌握分层随机抽样的样本均值和样本方差;(2)能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性. 
重点一 随机抽样
1.简单随机抽样
(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样;
(2)常用方法:抽签法和随机数法.
2.分层随机抽样
(1)定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配;
(2)分层随机抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样.
[逐点清]
1.(多选)某公司生产三种型号的轿车,产量分别为1 500辆,6 000辆和2 000辆,为检验该公司的产品质量,公司质监部门要抽取57辆进行检验,则下列说法正确的是(  )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次应抽取9辆,36辆,12辆
D.这三种型号的轿车,每一辆被抽到的概率都是相等的
解析:ACD 因为是三种型号的轿车,个体差异明显,所以选择分层随机抽样,故选项A正确;因为个体数目多,用抽签法制签难,搅拌不均匀,抽出的样本不具有好的代表性,故选项B不正确;抽样比为=,三种型号的轿车依次应抽取9辆,36辆,12辆,故选项C正确;分层随机抽样中,每一个个体被抽到的可能性相同,故选项D正确.
重点二 常用统计图表
1.频率分布直方图
(1)纵轴表示,即小长方形的高=;
(2)小长方形的面积=组距×=频率;
(3)各小长方形的面积的总和等于1.
2.频率分布表的画法
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
3.条形图、折线图及扇形图
(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图;
(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图;
(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.
[逐点清]
2.(多选)某地区城乡居民储蓄存款年底余额(单位:亿元)如图所示,下列结论正确的有(  )
A.城乡居民储蓄存款年底余额逐年增长
B.农村居民的存款年底余额所占比重逐年上升
C.到2021年农村居民存款年底总余额已超过了城镇居民存款年底总余额
D.城镇居民存款年底余额所占的比重逐年下降
解析:ABD A项,由城乡居民储蓄存款年底余额条形图可知,正确;B项,由城乡储蓄构成百分比可知,农村居民的存款年底余额所占比重分别为20.7%,26.5%,36.1%逐年上升,正确;C项,由城乡储蓄构成百分比可知,到2021年年底,农村居民存款年底总余额为36.1%×1 523≈549.80,城镇居民存款年底总余额为63.9%×1 523≈973.20,没有超过,错误;D项,由城乡储蓄构成百分比可知,城镇居民存款年底余额所占的比重分别为79.3%,73.5%,63.9%逐年下降,正确.
[记结论]
1.从总体中,逐个不放回地随机抽取n个个体作为样本,一次性批量随机抽取n个个体作为样本,两种方法是等价的.
2.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标;
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
[提速度]
 (多选)为了提升小学生的运算能力,某市举办了“小学生计算大赛”,并从中选出“计算小达人”.现从全市参加比赛的学生中随机抽取1 000人的成绩进行统计,得到如图所示的频率分布直方图,其中成绩的分组区间为[60,70),[70,80),[80,90),[90,100].规定得分在90分及以上的被评为“计算小达人”.下列说法正确的是(  )
A.m的值为0.015
B.该市每个小学生被评为“计算小达人”的概率约为0.01
C.被抽取的1 000名小学生的平均分大约是85分
D.现准备在这1 000名学生中,用分层随机抽样的方法抽取一个容量为20的样本,则须抽取成绩为[80,100]的学生5人
解析:AD 对于A选项,由频率分布直方图可知(0.01+m+0.025+0.05)×10=1,解得m=0.015,A对;对于B选项,该市每个小学生被评为“计算小达人”的概率约为10×0.01=0.1,B错;对于C选项,被抽取的1 000名小学生的平均分大约是65×0.25+75×0.5+85×0.15+95×0.1=76分,C错;对于D选项,现准备在这1 000名学生中,用分层随机抽样的方法抽取一个容量为20的样本,则须抽取成绩为[80,100]的学生人数为20×(0.015+0.01)×10=5,D对.故选A、D.
抽样方法
考向1 简单随机抽样
1.为了了解全校240名高一学生的身高情况,从中随机抽取40名高一学生进行测量,在这个问题中,样本指的是(  )
A.240名高一学生的身高
B.抽取的40名高一学生的身高
C.40名高一学生
D.每名高一学生的身高
解析:B 总体是240名高一学生的身高,则个体是每名高一学生的身高,故样本是抽取的40名高一学生的身高.故选B.
2.假设从高一年级全体同学(500人)中随机抽出60人参加一项活动,利用随机数法抽取样本时,先将500名同学按000,001,…,499进行编号,如果从随机数表第8行第6列的数开始,按三位数连续向右读取,最先抽出的5名同学的号码是(下面摘取了此随机数表第7行和第8行)(  )
75331 57245 50688 77047 44767 21763 35025 83921
37859 16955 56719 98105 07175 12867 35807 44395
A.455 068 047 447 176
B.169 105 071 286 443
C.050 358 074 439 332
D.447 176 335 025 212
解析:B 由随机数表法的随机抽样的过程可知最先抽出的5名同学的号码为169,105,071,286,443.
3.某中学高二年级甲班的学生共有25名女生和35名男生,现以简单随机抽样的方法从甲班全班同学中推选5名学生代表甲班参加全校演讲比赛,则甲班中某女生被抽到的概率是________.
解析:全班共有25+35=60名学生,以简单随机抽样的方法,甲班中某女生被抽到的概率是.
答案:
应用简单随机抽样应注意的问题
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法;
(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去. 
考向2 分层抽样
 (1)(2022·安庆联考)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层随机抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件;
(2)某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示,现在用分层随机抽样的方法从三个分厂生产的产品中抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.
[解析] (1)因为样本容量n=60,总体容量N=200+400+300+100=1 000,所以抽取比例为==.因此应从丙种型号的产品中抽取300×=18(件).
(2)由分层随机抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命约为1 020×50%+980×20%+1 030×30%=1 015(小时).
[答案] (1)18 (2)50 1 015
分层随机抽样问题的类型及解题思路
(1)求某层应抽个体数量:按该层所占总体的比例计算;
(2)已知某层个体数量,求总体容量或反之求解:根据分层随机抽样就是按比例抽样,列比例式进行计算;
(3)分层随机抽样的计算应根据抽样比构造方程求解,其中,抽样比==. 
1.宇通集团生产小、中、大三种型号的客车,产品数量之比为3∶5∶7,现用分层随机抽样的方法抽出样本量为n的样本,其中小型客车18辆,则样本量n等于(  )
A.54         B.90
C.45 D.126
解析:B 依题意得×n=18,解得n=90.即样本量为90.
2.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种,10种,30种,20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层随机抽样的方法抽取样本,则抽取的植物油类与果疏类食品种数之和是________.
解析:抽样比为=,则抽取的植物油类种数是10×=2,抽取的果蔬类食品种数是20×=4,所以抽取的植物油类与果蔬类食品种数之和是2+4=6.
答案:6
统计图表
考向1 扇形图、条形图
已知某市某居民小区户主人数和户主对户型结构的满意率分别如图①和图②所示,为了解该小区户主对户型结构的满意程度,用分层随机抽样的方法抽取30%的户主进行调查,则样本量和抽取的户主对四居室满意的人数分别为(  )
A.240,18 B.200,20
C.240,20 D.200,18
[解析] 样本量n=(250+150+400)×30%=240,抽取的户主对四居室满意的人数为150×30%×40%=18.
[答案] A
1.通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.
2.由条形图可知总体中样本的种类及对应各类样本的数量. 
考向2 频率分布直方图
 为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下频率分布直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
[解] (1)由已知得0.70=a+0.20+0.15,故a=0.35,
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
频率分布直方图的数据特点
(1)频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆;
(2)频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布. 
1.(2022·福州质检)已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本量和抽取的高中生近视人数分别为(  )
A.100,20 B.200,20
C.200,10 D.100,10
解析:B 由题图甲可知学生总数是10 000人,样本量为10 000×2%=200(人),高中生为2 000×2%=40(人),由题图乙可知高中生近视率为50%,所以人数为40×50%=20,故选B.
2.(2022·贵阳模拟)某网站为了了解某“跑团”每月跑步的平均里程,收集并整理了2021年1月至2021年11月期间该“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了下面的折线图.根据折线图,下列结论正确的是(  )
A.月跑步平均里程的中位数为6月份对应的里程数
B.月跑步平均里程逐月增加
C.月跑步平均里程高峰期大致在8、9月份
D.1月至5月的月跑步平均里程相对于6月至11月波动性更小,变化比较平稳
解析:D 由折线图可知月跑步平均里程比6月份高的只有9,10,11,共3个月,比6月份低的有1,2,3,4,5,7,8,共7个月,故6月份对应里程数不是中位数,因此A不正确;月跑步平均里程在1月到2月,6月到7月,7月到8月,10月到11月都是减少的,故不是逐月增加,因此B不正确;月跑步平均里程高峰期大致在9,10,11三个月,8月份是相对较低的,因此C不正确;从折线图来看,1月至5月的跑步平均里程相对于6月至11月,波动性更小,变化比较平稳,因此D正确.
[课时过关检测]
A级——基础达标
1.我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为(  )
A.134石        B.169石
C.338石 D.1 365石
解析:B 由随机抽样的含义,该批米内夹谷约为×1 534≈169(石).
2.某学院A,B,C三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层随机抽样的方法抽取一个容量为120的样本,已知该学院的A专业有380名学生,B专业有420名学生,则应在该学院的C专业抽取的学生人数为(  )
A.30 B.40
C.50 D.60
解析:B C专业的学生有1 200-380-420=400(名),由分层随机抽样知应抽取120×=40(名).
3.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90
若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是(  )
A.10 B.09
C.71 D.20
解析:B 从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09,故选B.
4.某市气象部门根据2021年各月的每天最高气温平均值与最低气温平均值(单位:℃)数据,绘制如下折线图:
那么,下列叙述不正确的是(  )
A.各月最高气温平均值与最低气温平均值总体呈正相关
B.全年中2月份的最高气温平均值与最低气温平均值的差值最大
C.全年中各月最低气温平均值不高于10 ℃的月份有5个
D.从2021年7月至12月该市每天最高气温平均值与最低气温平均值呈下降趋势
解析:D 对于A项,根据折线图可以发现除2月份外,各月最低气温平均值越高,最高气温平均值也越高,总体呈正相关,A项正确;对于B项,通过折线图观察,2月份的两个点距离最大,B项正确;对于C项,各月最低气温平均值不高于10 ℃的有1月,2月,3月,11月,12月,共有5个月,C项正确;对于D项,观察折线图可知,7月份到8月份气温在上升,D项错误.
5.(多选)为了比较甲、乙两名学生的数学学科素养的各项能力指标值(满分为5分,分值高者为优),绘制了如图所示的六维能力雷达图,例如图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下面叙述正确的是(  )
A.甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值
B.甲的数学建模能力指标值优于乙的直观想象能力指标值
C.乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平
D.甲的数学运算能力指标值优于甲的直观想象能力指标值
解析:AC 对于选项A,甲的逻辑推理能力指标值为4,优于乙的逻辑推理能力指标值为3,故A正确;对于选项B,甲的数学建模能力指标值为3,乙的直观想象能力指标值为5,所以乙的直观想象能力指标值优于甲的数学建模能力指标值,故B错误;对于选项C,甲的六维能力指标值的平均值为×(4+3+4+5+3+4)=,乙的六维能力指标值的平均值为×(5+4+3+5+4+3)=4,<4,故C正确;对于选项D,甲的数学运算能力指标值为4,甲的直观想象能力指标值为5,所以甲的数学运算能力指标值不优于甲的直观想象能力指标值,故D错误.故选A、C.
6.(2022·珠海三模)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的,则该组的频数为________.
解析:设除中间一个小矩形外的(n-1)个小矩形面积的和为p,则中间一个小矩形面积为p,p+p=1,p=,则中间一个小矩形的面积等于p=,200×=50,即该组的频数为50.
答案:50
7.某校为了解学生的身体素质情况,采用按年级分层随机抽样的方法,从高一、高二、高三学生中抽取一个300人的样本进行调查,已知高一、高二、高三学生人数之比为k∶5∶4,抽取的样本中高一学生为120人,则k的值为________.
解析:由题意可知,=,解得k=6.
答案:6
8.(2022·深圳模拟)如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布表和频率分布直方图如下,回答下列问题:
分组 人数 频率
[39.5,49.5) a 0.10
[49.5,59.5) 9 x
[59.5,69.5) b 0.15
[69.5,79.5) 18 0.30
[79.5,89.5) 15 y
[89.5,99.5] 3 0.05
合计 60 1.00
(1)分别求出a,b,x,y的值,并补全频率分布直方图;
(2)估计这次环保知识竞赛的平均分.
解:(1)a=6,b=9,x=0.15,y=0.25,
补全频率分布直方图如图,
(2)用各组中值估计平均分为44.5×0.1+54.5×0.15+64.5×0.15+74.5×0.3+84.5×0.25+94.5×0.05=70.5.
故这次环保知识竞赛的平均分约为70.5.
B级——综合应用
9.(多选)某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为1~1 000的1 000名学生进行了调查.调查中使用了两个问题,问题1:您的编号是否为奇数?问题2:您是否吸烟?被调查者随机从设计好的随机装置(内有除颜色外完全相同的白球100个,红球100个)中摸出一个小球:若摸出白球则回答问题1,若摸出红球则回答问题2,共有270人回答“是”,则下述正确的是(  )
A.估计被调查者中约有520人吸烟
B.估计约有20人对问题2的回答为“是”
C.估计该地区约有4%的中学生吸烟
D.估计该地区约有2%的中学生吸烟
解析:BC 随机抽出的1 000名学生中,回答第一个问题的概率是, 其编号是奇数的概率也是, 所以回答问题1且回答是的人数大约为1 000××=250,所以回答第二个问题,且为是的人数大约为270-250=20, 由此估计此地区中学生吸烟人数的百分比为=4%,估计被调查者中约有1 000×4%=40(人)吸烟,故表述正确的是B、C. 故选B、C.
10.(2022·重庆高三模拟)某工厂的三个车间在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层随机抽样的方法进行抽取,若从第一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则第二车间生产的产品数为________.
解析:因为a,b,c成等差数列,所以2b=a+c.所以=.所以第二车间抽取的产品数占抽样产品总数的.根据分层随机抽样的性质,可知第二车间生产的产品数占总数的,即为×3 600=1 200.
答案:1 200
11.2021年7月1日是中国共产党成立100周年纪念日,某市3 000名市民参加“建党100周年”相关知识比赛,成绩统计如图所示.
(1)求a的值,并估计该市参加考试的3 000名市民中,成绩在[80,90)内的人数;
(2)若在本次比赛中前1 500名参加复赛,则进入复赛的市民的分数应当如何制定(结果用分数表示).
解:(1)依题意,(2a+3a+7a+6a+2a)×10=1,
解得a=0.005.
故成绩在[80,90)内的频率为0.3,
故所求人数为3 000×0.3=900.
(2)依题意,要前1 500名市民参加复赛,即求该组数据的中位数,
所以分数为70+(0.5-0.1-0.15)÷0.035=77.
C级——迁移创新
12.为了解户籍性别对生育三胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育三胎与选择不生育三胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育三胎的对应比例,则下列叙述中错误的是(  )
A.是否倾向选择生育三胎与户籍有关
B.是否倾向选择生育三胎与性别无关
C.倾向选择生育三胎的人员中,男性人数与女性人数相同
D.倾向选择不生育三胎的人员中,农村户籍人数少于城镇户籍人数
解析:C 由不同群体中倾向选择生育三胎与倾向选择不生育三胎的人数比例图知:在A中,城镇户籍倾向选择生育三胎的比例为40%,农村户籍倾向选择生育三胎的比例为80%,∴是否倾向选择生育三胎与户籍有关,故A正确;在B中,男性倾向选择生育三胎的比例为60%,女性倾向选择生育三胎的比例为60%,∴是否倾向选择生育三胎与性别无关,故B正确;在C中,男性倾向选择生育三胎的比例为60%,人数为60×60%=36人,女性倾向选择生育三胎的比例为60%,人数为40×60%=24人,∴倾向选择生育三胎的人员中,男性人数比女性人数多,故C错误;在D中,倾向选择不生育三胎的人员中,农村户籍人数为50×(1-80%)=10人,城镇户籍人数为50×(1-40%)=30人,∴倾向选择不生育三胎的人员中,农村户籍人数少于城镇户籍人数,故D正确.故选C.
13.阅读下列材料,回答后面问题:
在2014年12月30日CCTV13播出的“新闻直播间”节目中,主持人说:“……假如此次亚航失联航班QZ8501被证实失事的话,2014年航空事故死亡人数将达到1 320人.尽管如此,航空安全专家还是提醒:飞机仍是相对安全的交通工具.①世界卫生组织去年公布的数据显示,每年大约有124万人死于车祸,而即使在航空事故死亡人数最多的一年,也就是1972年,其死亡数字也仅为3_346人;②截至2014年9月,每百万架次中有2.1次(指飞机失事),乘坐汽车的百万人中其死亡人数在100人左右.”
对上述航空专家给出的①、②两段表述(划线部分),你认为不能够支持“飞机仍是相对安全的交通工具”的所有表述序号为________.
解析:表述①虽是同类数据,但反映不出乘车出行和乘飞机出行的总人数的关系;
表述②两个数据不是同一类数据,这与每架次飞机的乘机人数有关;但是可以做如下大致估算,考虑平均每架次飞机的乘机人数为x,这样每百万人乘机死亡人数2.1人,要远远少于乘车每百万人中死亡人数.
答案:①

展开更多......

收起↑

资源预览