资源简介 第一节 随机抽样、用样本估计总体·最新考纲·1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样的方法.3.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.4.理解样本数据标准差的意义和作用,会计算数据标准差.5.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.6.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.7.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.·考向预测·考情分析:简单随机抽样、系统抽样、分层抽样在高考中极少单独考查,有时与概率问题相结合出现在题目的已知条件中;频率分布直方图、茎叶图等统计图表属于高考的常考内容,题型多为选择题,有时也与概率相结合出现在解答题中.学科素养:通过随机抽样、统计图表、数字特征考查数据分析、数学运算的核心素养.积 累 必备知识——基础落实 赢得良好开端一、必记5个知识点1.简单随机抽样(1)抽取方式:逐个不放回地抽取.(2)特点:每个个体被抽到的概率相等.(3)常用方法:抽签法和随机数法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.4.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.5.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把称为a1,a2,…,an这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是s=,s2=[(x1-)2+(x2-)2+…+(xn-)2].二、必明2个常用结论1.必记结论(1)众数的估计值是最高矩形底边中点的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边小矩形的面积和是相等的.2.常用公式(1)若数据x1,x2,…,xn的平均数是,则mx1+a,mx2+a,…,mxn+a的平均数是m+a.(2)若数据x1,x2,…,xn的方差为s2,则ax1+b,ax2+b,…,axn+b的方差为a2s2,标准差为as.三、必练4类基础题(一)判断正误1.判断下列说法是否正确(请在括号中打“√”或“×”).(1)简单随机抽样是一种不放回抽样.( )(2)在抽签法中,先抽的人抽中的可能性较大.( )(3)一组数据的方差越大,说明这组数据的波动越大.( )(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.( )(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.( )(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.( )(二)教材改编2.[选修3·P64习题T5改编]某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁及50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( )A.33,34,33 B.25,56,19C.20,40,30 D.30,50,203.[必修3·P71练习T1改编]如图所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20]内的频数是________.(三)易错易混4.(忽视系统抽样中可以先剔除部分个体)某学校为了解高一年级1 203名学生对某项教改试验的意见,打算从中抽取一个容量为40的样本,若采用系统抽样,则分段间隔为________.5.(方差的性质不熟致误)若数据x1,x2,x3,…,xn的平均数=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为________.(四)走进高考6.[2021·全国甲卷]为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间提 升 关键能力——考点突破 掌握类题通法考点一 抽样方法 [基础性]1.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为( )A. B. C. D.2.[2022·漳州质检]某公司决定利用随机数表对今年新招聘的800名员工进行抽样调查他们对目前工作的满意程度,先将这800名员工进行编号,编号分别为001,002,…,799,800,从中抽取80名进行调查,下面提供随机数表的第4行到第6行:32 21 18 34 29 78 64 54 07 32 52 42 06 44 3812 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 8623 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 7522 53 55 78 32 43 77 89 23 45若从表中第5行第6列开始向右依次读取3个数据,则抽到的第5名员工的编号是( )A.007 B.253 C.328 D.7363.[2022·蚌埠模拟]某市小学,初中,高中在校学生人数分别为7.5万,4.5万,3万.为了调查全市中小学生的体质健康状况,拟随机抽取1 000人进行体质健康检测,则应抽取的初中生人数为( )A.750 B.500 C.450 D.300反思感悟 1.应用随机数法的两个关键点(1)确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;(2)读数时注意结合编号特点进行读取.若编号为两位数字,则两位两位地读取;若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.2.解决分层抽样的常用公式先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.(1)抽样比==;(2)层1的容量∶层2的容量∶层3的容量=样本中层1的容量∶样本中层2的容量∶样本中层3的容量.考点二 统计图表及应用 [基础性、应用性、创新性]角度1 扇形图[例1] [全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼状图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半听课笔记:角度2 折线图[例2] 空气质量指数AQI是反映空气状况的指数,AQI指数值越小,表明空气质量越好,其对应关系如下表:AQI 指数 0~50 51~100 101~150 151~200 201~300 >300空气 质量 优 良 轻度污染 中度污染 重度污染 严重污染下图是某市10月1日~20日AQI指数变化趋势,则下列叙述不正确的是( )A.这20天中AQI指数值的中位数略高于100B.这20天中的中度污染及以上的天数占C.该市10月的前半个月的空气质量越来越好D.总体来说,该市10月上旬的空气质量比中旬的好听课笔记:角度3 茎叶图[例3] [2022·广东广雅中学、江西南昌二中联考]某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m+n的值是( )A.10 B.11 C.12 D.13听课笔记:角度4 频率分布直方图[例4] [2022·长沙市统一模拟考试]某学校对本校高三500名学生的视力进行了一次调查,随机抽取了100名学生的体检表,得到的频率分布直方图如图所示,若频率分布直方图后四组的频数成等差数列,则估计本校高三这500名学生中视力在4.8以上(含4.8)的人数为( )A.185 B.180 C.195 D.200听课笔记:反思感悟 (1)通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.(4)准确理解频率分布直方图的数据特点:①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.【对点训练】1.已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取30%的户主进行调查,则样本容量和抽取的户主对四居室满意的人数分别为( )A.240,18 B.200,20C.240,20 D.200,182.[2022·德州模拟]港珠澳大桥于2018年10月2日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程,桥隧全长55千米.桥面为双向六车道高速公路,大桥通行限速100 km/h,现对大桥某路段上1 000辆汽车的行驶速度进行抽样调查.画出频率分布直方图(如图),根据直方图估计在此路段上汽车行驶速度在区间[85,90)的车辆数和行驶速度超过90 km/h的频率分别为( )A.300,0.25 B.300,0.35C.60,0.25 D.60,0.353.某院校教师情况如下表所示:类别 年度 老年 中年 青年男 女 男 女 男 女2020 120 60 240 120 100 402021 210 40 320 200 200 1202022 300 150 400 270 320 280关于2020年、2021年、2022年这3年该院校的教师情况,下面说法不正确的是( )A.2021年男教师最多B.该校教师最多的是2022年C.2021年中年男教师比2020年多80人D.2020年到2022年,该校青年年龄段的男教师人数增长率为220%4.某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业者岗位分布条形图,则下列结论中不正确的是( )注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多考点三 用样本的数字特征估计总体的数字特征 [应用性、创新性][例5] [2020·全国卷Ⅰ]某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级 A B C D频数 40 20 20 20乙分厂产品等级的频数分布表等级 A B C D频数 28 17 34 21(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?听课笔记:反思感悟 利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.【对点训练】[2021·全国甲卷]某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.(1)求;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果≥2,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).微专题38 读取统计图表中的数据 数据分析数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,形成知识的过程.主要包括:收集数据,整理数据,提取信息,构建模型对信息进行分析、推断,获得结论.[例] [2022·武汉调研测试]某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图.请根据图中信息,求本次抽查的学生中A类人数是( )A.30 B.40 C.42 D.48解析:由条形统计图知,B—自行乘车上学的有42人,C—家人接送上学的有30人,D—其他方式上学的有18人,采用B,C,D三种方式上学的共90人,设A—结伴步行上学的有x人,由扇形统计图知,A—结伴步行上学与B—自行乘车上学的学生占60%,所以=,解得x=30.答案:A名师点评 本例由条形图可以读出频数,由扇形图可读出频率,从而问题即可解决.第十一章 统计与统计案例第一节 随机抽样、用样本估计总体积累必备知识三、1.答案:(1)√ (2)× (3)√ (4)√ (5)√ (6)√2.解析:因为125∶280∶95=25∶56∶19,所以抽取人数分别为25,56,19.答案:B3.解析:因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]内的频数为0.3×100=30.答案:304.解析:∵1 203除以40不是整数,∴先随机的去掉3个人,再除以40,得到每一段有30个人,则分段的间隔为30.答案:305.解析:∵x1,x2,x3,…,xn的平均数为5,∴=5,∴+1=3×5+1=16,∵x1,x2,x3,…,xn的方差为2,∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.答案:16 186.解析:对于A:根据频率分布直方图知该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1=0.06,正确;对于B:根据频率分布直方图知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1=0.10,正确;对于C:根据频率分布直方图知该地农户家庭年收入的平均值估计为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),错误;对于D:根据频率分布直方图知该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率估计为(0.10+0.14+0.20+0.20)×1=0.64,正确.答案:C提升关键能力考点一1.解析:根据题意,=,解得n=28.故在整个抽样过程中每个个体被抽到的概率为=.答案:C2.解析:由题意知,前五名员工的编号依次为253,313,457,736,007.答案:A3.解析:初中生抽取的人数为×4.5=300.答案:D考点二例1 解析:设新农村建设前,农村的经济收入为a,则新农村建设后,农村经济收入为2a.新农村建设前后,各项收入的对比如下表:新农村建 设前 新农村 建设后 新农村建设后变化情况 结论种植收入 60%a 37%×2a =74%a 增加 A错其他收入 4%a 5%×2a =10%a 增加一倍以上 B对养殖收入 30%a 30%×2a =60%a 增加了一倍 C对养殖收入+第三产业收入 (30%+6%)a =36%a (30%+28%) ×2a=116%a 超过经济收入2a的一半 D对答案:A例2 解析:A项,由题图知排序后第10个数据、第11个数据的平均数大于100,即中位数略高于100;B项,中度污染及以上的天数为5天,占;由题图知C错误;D项,总体来说,该市10月上旬的空气质量比中旬的空气质量好.答案:C例3 解析:∵甲组学生成绩的平均数是88,∴由茎叶图可知78+86+84+88+95+90+m+92=88×7,∴m=3,∵乙组学生成绩的中位数是89,∴n=9,∴m+n=12.答案:C例4 解析:由题意得频率分布直方图前三组的频率依次为0.03,0.07,0.27,所以前三组的频数依次为3,7,27,则后四组的频数和为90,又后四组的频数成等差数列,所以后四组的频数依次为27,24,21,18,所以视力在4.8以上(含4.8)的频率为39%,故本校高三这500名学生中视力在4.8以上(含4.8)的人数约为500×39%=195.答案:C对点训练1.解析:样本容量n=(250+150+400)×30%=240,抽取的户主对四居室满意的人数为150×30%×40%=18.答案:A2.解析:由频率分布直方图得在此路段上汽车行驶速度在区间[85,90)的频率为0.06×5=0.3,∴在此路段上汽车行驶速度在区间[85,90)的车辆数为0.3×1 000=300,行驶速度超过90 km/h的频率为(0.05+0.02)×5=0.35.答案:B3.解析:由题意知,2022年的男教师最多,A错误;将表中各年度人数横向求和可知,2022年共有1 720人,为人数最多的一年,B正确;2021年中年男教师比2020年多320-240=80(人),故C正确;2020~2022青年男教师增加了220人,增长率为220÷100×100%=220%,D正确.答案:A4.解析:由饼状图可知互联网从业人员中90后占56%,一半以上,故A项正确;由条形图知,90后从事技术岗位的人数占互联网行业为39.6%×56%=22.176%>20%,所以互联网行业中从事技术岗位的人数占总人数的百分比大于等于22.176%,B项正确;由条形图知,90后从事运营岗位的人数占互联网行业为17%×56%=9.52%,大于80前互联网从业人数,C项正确;因为技术所占比例80后未知,且90后从事技术岗位的人数比22.176%<41%,所以D项不一定正确.答案:D考点三例5 解析:(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为=0.4;乙分厂加工出来的一件产品为A级品的概率的估计值为=0.28.(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为利润 65 25 -5 -75频数 40 20 20 20因此甲分厂加工出来的100件产品的平均利润为=15.由数据知乙分厂加工出来的100件产品利润的频数分布表为利润 70 30 0 -70频数 28 17 34 21因此乙分厂加工出来的100件产品的平均利润为=10.比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.对点训练解析:(1)由表格中的数据易得:=+10.0=10.0,=+10.0==×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]==×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.(2)由(1)中数据可得=10.3-10.0=0.3,而==,显然有成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高. 展开更多...... 收起↑ 资源预览