资源简介 独立性检验问题是高考常考内容之一,通常利用χ2求值进行独立性检验,常出现在解答题中,与统计知识和概率知识相结合考查,难度中等.主要考查考生的数学抽象、数学建模等数学核心素养. (2024·全国甲卷T17节选改编)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:优级品 合格品 不合格品 合计甲车间 26 24 0 50乙车间 70 28 2 100合计 96 52 2 150填写如下列联表:单位:件车间 产品 合计优级品 非优级品甲车间乙车间合计依据小概率值α=0.05的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?依据小概率值α=0.01的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?附:χ2=,n=a+b+c+d.α 0.05 0.01 0.001xα 3.841 6.635 10.828[阅读与思考] 填写如下列联表:单位:件车间 产品 合计优级品 非优级品甲车间 26 24 50乙车间 70 30 100合计 96 54 150零假设为H0:甲、乙两车间产品的优级品率没有差异.χ2==4.687 5.因为χ2=4.687 5>3.841,所以依据小概率值α=0.05的独立性检验,认为甲、乙两车间产品的优级品率存在差异;因为χ2=4.687 5<6.635,所以依据小概率值α=0.01的独立性检验,不能认为甲、乙两车间产品的优级品率存在差异.归纳总结:概率、统计试题综合性较强,对考生的阅读能力要求较高,解题时需要注意:(1)认真审题,厘清已知条件中的信息;(2)分清所求与已知之间的关系;(3)注重对基本概念的理解,并加强知识间的整合能力,特别是加强对知识点交汇问题的求解能力,提升阅读理解能力. 本题参照人教B版选择性必修第二册第120页练习B第2题命制,教材习题和高考题都考查了“利用2×2列联表的方法,解决独立性检验的简单实际问题”和“χ2的相关性检验”知识.高考题的难度略高于教材,难度中等.试题评价:本题以生产线智能化升级改造为背景,考查列联表、独立性检验,考查阅读理解能力,逻辑推理能力以及分析、解决问题的能力,综合性较强,属于生活实践情境题.附:(人教B版选择性必修第二册P120练习BT2)某企业有甲、乙两个分厂生产同一种产品,在检查产品的优质品率时,从甲、乙两厂各抽取了500件产品,其中甲厂有优质品360件,乙厂有优质品320件.(1)分别估计甲、乙两厂的优质品率;(2)是否有99%的把握认为两厂的优质品率有差异?第1课时 随机抽样、统计图表[考试要求] 1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本,了解分层随机抽样方法,掌握分层随机抽样的均值计算方法.3.理解统计图表的含义.考点一 简单随机抽样1.总体、个体、样本调查对象的全体称为总体,组成总体的每一个调查对象称为个体,在抽样调查中,从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本容量,简称样本量.2.简单随机抽样(1)简单随机抽样分为放回简单随机抽样和不放回简单随机抽样(除非特殊声明,本章所称的简单随机抽样是指不放回简单随机抽样).(2)简单随机抽样的常用方法:抽签法和随机数法.(3)简单随机抽样的抽取方式:逐个不放回抽取.(4)简单随机抽样的特点:每个个体被抽到的概率相等.[典例1] (1)(2024·天津南开区期末)利用简单随机抽样的方法,从n个个体(n≥13)中抽取13个个体,若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( )A. B.C. D.(2)我校高三年级为了解学生某项身体指标,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,…,649,650.从中抽取50个样本,如下提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第7个样本编号是( )32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45A.623 B.328C.072 D.457(1)B (2)C [(1)第二次抽取时,余下的每个个体被抽到的概率为,则=,解得n=37,故在整个抽样过程中,每个个体被抽到的可能性为.故选B.(2)从表中第5行第6列开始向右读取数据,前7个数据分别是253,313,457,007,328,623,072.故选C.]反思领悟 简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)等可能抽取.巩固迁移1 (1)(2024·上海徐汇区期末)下列抽样方法是简单随机抽样的是( )A.某医院从200名医生中,挑选出50名最优秀的医生去参加活动B.从10个手机中逐个不放回地随机抽取2个进行质量检验C.从空间直角坐标系中抽取10个点作为样本D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查(2)(2024·石家庄期末)一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个样本容量为3的样本,则某一个特定个体被抽到的概率为( )A. B.C. D.(1)B (2)A [(1)对于A,从200名医生中,挑选出50名最优秀的医生,不是等可能抽取,所以不是简单随机抽样;对于B,从10个手机中逐个不放回地随机抽取2个,是简单随机抽样;对于C,从空间直角坐标系中抽取10个点作为样本,总体是无限的,不是简单随机抽样;对于D,从仓库中的500箱饮料中一次性抽取前10箱,不是逐个抽取,所以不是简单随机抽样.故选B.(2)因为简单随机抽样中每一个个体被抽到的概率均相等,所以某一个特定个体被抽到的概率为.故选A.]考点二 分层随机抽样1.分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.2.比例分配的分层随机抽样所获得样本的均值与方差利用比例分配的分层(两层)随机抽样获得的样本中,第一层的样本量为n1,均值为,方差为;第二层的样本量为n2,均值为,方差为,则总的样本均值=,总的样本方差s2=.[典例2] (1)(2025·湖北襄阳模拟)一支田径队有男运动员48人,女运动员36人,用分层随机抽样的方法从全体运动员中抽取一个容量为21的样本,抽出的男运动员平均身高为177.5 cm,抽出的女运动员平均身高为168.4 cm,则估计该田径队运动员的平均身高为( )A.173.6 cm B.172.95 cmC.172.3 cm D.176 cm(2)(2023·新高考Ⅱ卷改编)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则在初中部和高中部抽取的人数分别为________.(3)为了解学生的课外阅读情况,某校采用比例分配的分层随机抽样的方法对高中三个年级的学生进行平均每周课外阅读时间(单位:小时)的调查,所得样本数据如下:年级 抽样人数 样本平均数 样本方差高一 40 5 3.5高二 30 2高三已知高中三个年级的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数=________,高三年级学生的样本方差=________.(1)A (2)40,20 (3)4 1.5 [(1)由题意,田径队男运动员、女运动员的人数比例为48∶36=4∶3,用分层随机抽样的方法从全体运动员中抽取一个容量为21的样本,设男运动员4x名,女运动员3x名,故4x+3x=21,解得x=3,即男运动员12名,女运动员9名,故该田径队运动员的平均身高大约为:=173.6(cm).故选A.(2)由题意,初中部和高中部学生人数之比为=,所以抽取60名学生中,初中部应有60×=40(人),高中部应有60×=20(人).(3)由高中三个年级的总样本平均数为4.1,可得=4.1,解得=4,由总样本方差为3.14,可得+(3-4.1)2]=3.14,解得=1.5.]反思领悟 分层随机抽样中有关计算的方法(1)抽样比==.(2)在分层随机抽样中,如果第1层的样本量为m,平均值为x,方差为;第2层的样本量为n,平均值为y,方差为,则样本的平均值为μ==x+y;方差为s2=+(μ-y)2].巩固迁移2 某工厂新、旧两条生产线的产量比为7∶3,为了解该工厂生产的一批产品的质量情况,采用比例分配的分层随机抽样的方法从两条生产线抽取样本并计算得:新生产线生产的产品的质量指标的均值为10,方差为1;旧生产线生产的产品的质量指标的均值为9,方差为2,据此估计该批产品的质量指标的均值为________,方差为________.9.7 1.51 [根据两条生产线的产量比为7∶3,且新生产线质量指标的均值为10,方差为1,旧生产线质量指标的均值为9,方差为2,所以该批产品的质量指标的均值为=×(10×7+9×3)=9.7;则所求的方差s2=×[2+(9-9.7)2]+×[1+(10-9.7)2]=1.51.]考点三 统计图表1.常见的统计图表有条形图、扇形图、折线图、频率分布直方图等.2.频率分布表、频率分布直方图的制作步骤及意义提醒:频率分布直方图中小长方形的高为. 常见的统计图表[典例3] (1)(多选)某中学组织三个年级的学生进行环保知识竞赛.经统计,得到成绩排在前200名学生分布的扇形图(图1)和其中的高一学生排名分布的频率条形图(图2).则下列命题正确的是( ) A.成绩排在前200名的200人中,高二人数比高三人数多10B.成绩排在第1~50名的50人中,高一人数比高二的多C.成绩排在第51~150名的100人中,高三人数占比可能超过D.成绩排在第51~100名的50人中,高二人数肯定多于23(2)(2024·滨州期末)为了研究某市甲、乙两个5G智能手机专卖店的销售状况,厂家统计了去年4月到9月甲、乙两店每月的营业额(单位:万元),得到如图所示的折线图.根据两店的营业额折线图可知,下列说法错误的是( )A.甲店月营业额的平均值在[31,32]内B.乙店月营业额总体呈上升趋势C.7,8,9月份的总营业额甲店比乙店少D.乙店的月营业额极差小于甲店的月营业额极差(1)AC (2)D [(1)对于A,成绩排在前200名的200人中,高二人数比高三人数多200×(30%-25%)=10,故A正确;对于B,成绩排在第1~50名的50人中,高一人数为200×45%×20%=18,高二和高三的总人数为50-18=32,高二的具体人数不知道,故B错误;对于C,成绩排在第51~150名的100人中,高一人数为200×45%×(0.3+0.4)=63,高二和高三的总人数为100-63=37,所以高三人数占比有可能超过,故C正确;对于D,成绩排在第51~100名的50人中,高一人数为200×45%×0.3=27,高二人数最多有50-27=23(人),故D错误.(2)对于A,甲店月营业额的平均值为(14+21+26+30+52+47)≈31.7,31.7∈[31,32],所以A正确;对于B,根据乙店的营业额折线图可知乙店每月的营业额逐月变大,所以总体呈上升趋势,故B正确;对于C,由营业额折线图可知,甲店的7,8,9月份的总营业额为30+52+47=129,乙店的7,8,9月份的总营业额为33+44+53=130,129<130,所以C正确;对于D,根据甲、乙两店的营业额折线图可知甲店的月营业额极差为52-14=38,乙店的月营业额极差为53-7=46,乙店的月营业额极差比甲店的大,所以D错误.故选D.]反思领悟 本例(1)中,扇形图可以很清楚地看出各部分数量与总数之间的关系;条形图可知总体中样本的种类及对应各类样本的数量;本例(2)中,折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于描述数据随时间的变化趋势.巩固迁移3 (2024·乐山三模)为了解某中学三个年级的学生对食堂饭菜的满意程度,用分层随机抽样的方法抽取30%的学生进行调查,已知该中学学生人数和各年级学生的满意率分别如图1和图2所示,则样本容量和抽取的二年级学生中满意的人数分别为( )A.800,360 B.600,108C.800,108 D.600,360B [由扇形图可知,三个年级的学生总人数为400+600+1 000=2 000(人),所以样本容量为2 000×30%=600,因为抽取的二年级学生人数为600×30%=180(人),所以抽取的二年级学生中满意的人数为180×60%=108(人).故选B.] 频率分布直方图[典例4] (1)(2024·大同灵丘县期末)某部门为了了解一批树苗的生长情况,在4 000棵树苗中随机抽取400棵,统计这400棵树苗的高度(单位:cm),将所得数据分成7组:[70,80),[80,90),[90,100),[100,110),[110,120),[120,130),[130,140],并绘制了如图所示的频率分布直方图,那么根据该图可推测,在这4 000棵树苗中高度小于110 cm的树苗棵数约是( )A.1 680 B.1 760C.1 840 D.1 920(2)从某校高三学生中抽取50名参加数学竞赛,成绩(单位:分)分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.①列出样本的频率分布表;②画出频率分布直方图;③估计成绩在[60,90)的学生比例.(1)B [由频率分布直方图可得,小于110 cm的树苗的频率为(0.002+0.006+0.012+0.024)×10=0.44,所以可推测4 000棵树苗中高度小于110 cm的树苗棵数约为4 000×0.44=1 760.故选B.](2)①频率分布表如下:成绩(单位:分)分组 频数 频率[40,50) 2 0.04[50,60) 3 0.06[60,70) 10 0.2[70,80) 15 0.3[80,90) 12 0.24[90,100] 8 0.16合计 50 1.00②频率分布直方图如图所示.③学生成绩在[60,90)的频率为0.2+0.3+0.24=0.74,所以估计成绩在[60,90)的学生比例为74%.反思领悟 本例(1)求解的关键是求出树苗中高度小于110 cm的频率,然后根据频数=样本容量×频率可求出结果;本例(2)中,作频率分布直方图时,纵轴上的数据是各组频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.巩固迁移4 (1)要调查某地区高中学生身体素质,从高中生中抽取100人进行跳远测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)之间的学生中用分层随机抽样的方法抽取5人,应从[120,130)间抽取人数为b,则( )A.a=0.025,b=2 B.a=0.025,b=3C.a=0.030,b=4 D.a=0.030,b=3(2)(2025·江油市模拟)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是( )A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天 B.估计该学生每日完成作业时间超过3小时的概率为0.3 C.估计该学生每日完成作业时间的中位数为2.625小时 D.估计该学生每日完成作业时间的众数为2.3小时(1)D (2)C [(1)由题得10×(0.005+0.035+a+0.020+0.010)=1,所以a=0.030.在[120,130)之间的学生有100×10×0.030=30(人),在[130,140)之间的学生有100×10×0.020=20(人),则在[120,140)之间的学生有50人,又用分层随机抽样的方法在[120,140)之间的学生中抽取5人,即抽样比为,所以成绩在[120,130)之间的学生中抽取的人数应为30×=3,即b=3.(2)对于A,估计该学生每日完成作业的时间在2 h至2.5 h的有100×0.5×0.5=25(天),A错误;对于B,估计该学生每日完成作业的时间超过3 h的概率为(0.3+0.2+0.1+0.1)×0.5=0.35,B错误;对于C,设该学生每日完成作业的时间的中位数为x,则(0.1+0.3+0.5)×0.5+0.4×(x-2.5)=0.5,解得x=2.625,C正确;对于D,估计该学生每日完成作业时间的众数在第三组,为2.25小时,D错误.故选C.]1.(多选)(2024·海林市月考)下列抽样方法是简单随机抽样的是( )A.质检员从50个零件中逐个抽取5个做质量检验B.课堂上,李老师对全班45名学生中点名表扬了3名发言积极的C.老师要求学生从实数集中逐个抽取10个分析奇偶性D.某运动员从8条跑道中随机抽取一条跑道试跑AD [选项A:符合不放回简单随机抽样要求,故A正确;选项B:老师表扬的是发言积极的,对每一个个体而言,不具备“等可能性”,故B错误;选项C:因为总体容量是无限的,不符合简单随机抽样要求,故C错误;选项D:8条跑道,抽取1条,总体有限,每个个体被抽到的机会均等,是简单随机抽样,故D正确.故选AD.]2.(2025·南通模拟)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行、第2行:66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 9057 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是( )A.10 B.09 C.71 D.20B [从表中第1行第9列开始向右依次读取数据,找出4个在01~50内的编号,14,05,11,09,则得到的第4个样本编号为09.故选B.]3.已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用比例分配的分层随机抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.100,10 B.200,10C.100,20 D.200,20D [易知样本容量为(3 500+4 500+2 000)×2%=200,抽取的高中生人数为2 000×2%=40,由于其近视率为50%,所以抽取的高中生近视的人数为40×50%=20.故选D.]4.(2024·福建学业考试)某市政府计划对居民生活用水实施阶梯式水价制度,即确定一户居民月均用水量标准w(单位:t),用水量不超过w的部分按平价收费,超出w的部分按议价收费,该市随机调查了10 000户居民,获得了他们的月均用水量数据,整理得到频率分布直方图(如图).如果要让该市85%的居民用户的月均用水量不超出标准,那么w应为________(单位:t).17.5 [因为(0.06+0.08+0.02)×5=0.8<0.85,(0.06+0.08+0.02+0.02)×5=0.9>0.85,所以w位于[15,20)之间,所以(0.06+0.08+0.02)×5+0.02(w-15)=0.85,解得w=17.5,所以w应为17.5 t.]【教用·备选题】1.(2024·沧州期末)某班级有60名学生,班主任用不放回的简单随机抽样的方法从这60名学生中抽取5人进行家访,则同学a被抽到的可能性为( )A. B.C. D.A [因为班主任用的是不放回的简单随机抽样的方法,所以每个个体被抽到的概率相同,均为=.故选A.]2.(多选)(2024·大同浑源县期末)下列抽样方法是简单随机抽样的有( )A.从20名同学中随机抽取5名同学参加义务劳动B.从20个零件中一次性抽取3个进行质量检验C.某班45名同学,指定个子最高的5名同学参加学校组织的某项活动D.中国福利彩票30选7,得到7个彩票中奖号码AD [B不是“逐个抽取”,所以不是简单随机抽样;C不符合“等可能性”,因为5名同学是指定的,而不是随机抽取的,所以不是简单随机抽样;根据简单随机抽样的定义可知,A,D是简单随机抽样.故选AD.]3.(2024·琼海月考)如图是某校高一年级1 000名男生体检时身高的频率分布直方图,现用分层随机抽样的方法从身高在160~175 cm的男生中抽取130名,则抽取到的身高在165~170 cm的人数为( )A.20 B.30C.40 D.50C [由频率分布直方图可知,高一年级身高在160~175 cm的人数有1 000×5×(0.03+0.04+0.06)=650,高一年级身高在165~170 cm的人数有1 000×5×0.04=200,设抽取到的身高在165~170 cm的人数为n,则=,解得n=40.故选C.]4.(2024·大理州期末)某年级有男生490人,女生510人,为了解学生身高,按性别进行分层,并通过分层随机抽样的方法得到样本容量为100的样本数据,若抽样时在各层中按比例分配样本,并得到样本中男生、女生的平均身高分别为170 cm和160 cm,在这种情况下,可估计该年级全体学生的平均身高为________cm.164.9 [通过分层随机抽样的方法得到样本容量为100的样本数据,男生抽取的人数为100×=49,女生抽取的人数为100×=51.样本中男生、女生的平均身高分别为170 cm和160 cm,可估计该年级全体学生的平均身高为=164.9(cm).]课后习题(六十七) 随机抽样、统计图表1.(人教A版必修第二册P189习题9.1T6改编)数据x1,x2,x3,…,xm的平均数为,数据y1,y2,y3,…,yn的平均数为,则数据x1,x2,x3,…,xm,y1,y2,y3,…,yn的平均数为( )A. B.C. D.D [由题意得x1+x2+x3+…+xm=m,y1+y2+y3+…+yn=n,所以=.故选D.]2.(多选)(北师大版必修第一册P159练习改编)支气管炎患者会咳嗽失眠,给患者日常生活带来严重的影响.某医院老年患者治愈率为20%,中年患者治愈率为30%,青年患者治愈率为40%.该医院共有600名老年患者,500名中年患者,400名青年患者,则( )A.若从该医院所有患者中抽取容量为30的样本,则老年患者应抽取12人B.该医院青年患者所占的比例为C.该医院的平均治愈率约为28.7%D.该医院的平均治愈率约为31.3%ABC [由按比例分配的分层随机抽样可得,老年患者应抽取30×=12(人),故A正确;青年患者所占的比例为=,故B正确;该医院的平均治愈率为≈28.7%,故C正确,D错误.故选ABC.]3.(人教B版必修第二册P92习题5-1CT2改编)为比较甲、乙两名学生的数学素养,对课程标准中规定的六大数学核心素养进行指标测验,指标值满分为5分,分值高者为优,根据测验情况绘制了如图所示的六大数学核心素养指标雷达图,则下面叙述错误的是( )A.甲的数据分析核心素养优于乙B.乙的数学运算核心素养优于数学抽象核心素养C.甲的六大数学核心素养指标值波动性比乙的小D.甲、乙在数学建模核心素养上的差距比在直观想象核心素养上的差距大D [对于A,甲的数据分析核心素养指标值为5,乙的为4,故A正确;对于B,乙的数学运算核心素养指标值为5,数学抽象核心素养指标值为3,故B正确;对于C,甲的六大数学核心素养指标值均为4或5,乙的六大数学核心素养指标值有3,4,5,故甲的波动性较小,故C正确;对于D,甲、乙在数学建模核心素养上的指标值差为1,甲、乙在直观想象核心素养上的指标值差为2,故D错误.故选D.]4.(北师大版必修第一册P181复习题六A组T6改编)某电视台为宣传法律知识,随机在本省内15~65岁的人群中抽取n人回答法律问题,按年龄分组,统计结果如图表所示.组号 分组 回答正确的人数 回答正确的人数占本组的频率第1组 [15,25) a 0.5第2组 [25,35) 18 x第3组 [35,45) b 0.9第4组 [45,55) 9 0.36第5组 [55,65] 3 y(1)分别求出a,b,x,y的值;(2)从第2,3,4组回答正确的人中用按比例分配的分层随机抽样的方法抽取6人,求第2,3,4组抽取的人数.[解] (1)由频率分布表中第4组数据可知,第4组总人数为=25,再结合题中的频率分布直方图可知n==100,所以a=100×0.01×10×0.5=5,b=100×0.03×10×0.9=27,x==0.9,y==0.2.(2)第2,3,4组回答正确的共有18+27+9=54(人).利用按比例分配的分层随机抽样方法在54人中抽取6人,则第2组抽取×6=2(人);第3组抽取×6=3(人);第4组抽取×6=1(人).5.(2025·烟台模拟)白鹤是国家一级重点保护鸟类.我国境内的白鹤每年在鄱阳湖的越冬地与西伯利亚的繁殖地之间迁徙,莫莫格湿地是其迁徙途中重要的停歇地.2024年春季,某研究小组为统计莫莫格湿地停歇的白鹤数量,从该湿地随机选取了200只白鹤并做上标记后放回,一段时间后又从该湿地随机选取了200只白鹤,其中有12只白鹤具有标记,据此估计该湿地内白鹤的数量大致为( )A.2 500 B.3 300C.4 000 D.4 300B [设该湿地有白鹤x只,由题意得=,所以x≈3 333≈3 300.故选B.]6.(2025·成都郫都区模拟)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性和“第二次被抽到”的可能性分别是( )A. B.C. D.A [在抽样过程中,个体a每一次被抽中的概率是相等的,∵总体容量为10,故个体a“第一次被抽到”的可能性和“第二次被抽到”的可能性均为.故选A.]7.(2024·鄂尔多斯市达拉特旗期末)某学校有男生800人,女生600人,为调查该校全体学生每天的睡眠时间,采用分层随机抽样的方法抽取样本,计算得男生每天睡眠时间的平均数为7.7小时,方差为2.1,女生每天睡眠时间的平均数为7小时,方差为1.4.若男、女样本量按比例分配,则可估计总体方差为( )A.1.86 B.1.88C.1.9 D.1.92D [由题意,总体的平均数为7.7×+7×=7.4(小时),根据分层随机抽样的性质,可得总体的方差为:×[2.1+(7.7-7.4)2]+×[1.4+(7-7.4)2]=1.92.故选D.]8.(多选)(2024·北京朝阳区校级开学考试)某学校为了解本校学生上学的交通方式,在全校范围内随机抽样调查部分学生,了解到上学的交通方式主要有:A为家人接送,B为乘坐地铁,C为乘坐公交,D为其他方式.学校把收集到的数据整理绘制成条形图和扇形图,如图只给出了其中部分信息,则下列结论中正确的是( )A.此次抽查的样本量为240B.若该校有学生2 000人,则约有500人是家人接送上学C.扇形图中B的占比为38%D.估计该校学生上学交通方式为乘坐地铁或者其他方式的人数占全校学生的一半ABD [对于A,因为乘坐公交的调查人数为60,所占比例为25%,所以调查的总人数为60÷25%=240,故A正确;对于B,家人接送的学生所占的比例为=,故2 000×=500,所以B正确;对于C,扇形图中B的占比为×100%=35%,所以C错误;对于D,×100%=50%,所以D正确.故选ABD.]9.(2024·北京朝阳区期末)李华统计了他爸爸2024年5月的手机通话明细清单,发现他爸爸该月共通话60次,他按每次通话时间长短进行分组(每组为左闭右开的区间),画出了如图所示的频率分布直方图.则每次通话时长不低于5分钟且小于15分钟的次数为( )A.18 B.21C.24 D.27B [观察频率分布直方图,得每次通话时长不低于5分钟且小于15分钟的频率为:1-5×(0.06+0.03+0.02+0.02)=0.35,则60×0.35=21,所以每次通话时长不低于5分钟且小于15分钟的次数为21.故选B.]10.(2024·银川金凤区期末)甲、乙两名运动员进入男子羽毛球单打决赛,假设比赛打满3局,赢得2局或3局者胜出,用计算机产生1~5之间的随机数,当出现随机数1,2,3时,表示一局比赛甲获胜;否则,乙获胜.由于要比赛3局,所以每3个随机数为一组,产生20组随机数:423 123 423 344 114 453 525 332 152 342534 443 512 541 125 432 334 151 314 354据此估计甲获得冠军的概率为________.0.65 [由题意可知,甲获胜的随机数为:423 123 423 114 332 152 342 512 125 432 334 151 314,共13个,总随机数共有20组,故估计甲获得冠军的概率为=0.65.]11.(2025·宁波北仑区模拟)某陶瓷厂在生产过程中,对仿制的100件工艺品测得质量(单位:kg)数据如下表:分组 [2.20,2.30) [2.30,2.40) [2.40,2.50) [2.50,2.60) [2.60,2.70) [2.70,2.80] 合计频数 4 26 a 28 10 2 100频率 0.04 b(1)求出频率分布表中实数a,b的值;(2)若从质量范围在[2.60,2.80]的工艺品中随机抽选2件,求被抽选2件工艺品质量均在范围[2.70,2.80]中的概率.[解] (1)a=100-(4+26+28+10+2)=30,b==0.28.(2)质量范围在[2.60,2.70)的工艺品有10件,质量范围在[2.70,2.80]的工艺品有2件,所以从质量范围在[2.60,2.80]的12件工艺品中,随机抽选2件的方法数有=66(种),所以被抽选2件工艺品质量均在范围[2.70,2.80]中的概率为P=.1/1 独立性检验问题是高考常考内容之一,通常利用χ2求值进行独立性检验,常出现在解答题中,与统计知识和概率知识相结合考查,难度中等.主要考查考生的数学抽象、数学建模等数学核心素养. (2024·全国甲卷T17节选改编)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:优级品 合格品 不合格品 合计甲车间 26 24 0 50乙车间 70 28 2 100合计 96 52 2 150填写如下列联表:单位:件车间 产品 合计优级品 非优级品甲车间乙车间合计依据小概率值α=0.05的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?依据小概率值α=0.01的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?附:χ2=,n=a+b+c+d.α 0.05 0.01 0.001xα 3.841 6.635 10.828[阅读与思考] 填写如下列联表:单位:件车间 产品 合计优级品 非优级品甲车间 26 24 50乙车间 70 30 100合计 96 54 150零假设为H0:甲、乙两车间产品的优级品率没有差异.χ2==4.687 5.因为χ2=4.687 5>3.841,所以依据小概率值α=0.05的独立性检验,认为甲、乙两车间产品的优级品率存在差异;因为χ2=4.687 5<6.635,所以依据小概率值α=0.01的独立性检验,不能认为甲、乙两车间产品的优级品率存在差异.归纳总结:概率、统计试题综合性较强,对考生的阅读能力要求较高,解题时需要注意:(1)认真审题,厘清已知条件中的信息;(2)分清所求与已知之间的关系;(3)注重对基本概念的理解,并加强知识间的整合能力,特别是加强对知识点交汇问题的求解能力,提升阅读理解能力. 本题参照人教B版选择性必修第二册第120页练习B第2题命制,教材习题和高考题都考查了“利用2×2列联表的方法,解决独立性检验的简单实际问题”和“χ2的相关性检验”知识.高考题的难度略高于教材,难度中等.试题评价:本题以生产线智能化升级改造为背景,考查列联表、独立性检验,考查阅读理解能力,逻辑推理能力以及分析、解决问题的能力,综合性较强,属于生活实践情境题.附:(人教B版选择性必修第二册P120练习BT2)某企业有甲、乙两个分厂生产同一种产品,在检查产品的优质品率时,从甲、乙两厂各抽取了500件产品,其中甲厂有优质品360件,乙厂有优质品320件.(1)分别估计甲、乙两厂的优质品率;(2)是否有99%的把握认为两厂的优质品率有差异? 第1课时 随机抽样、统计图表[考试要求] 1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本,了解分层随机抽样方法,掌握分层随机抽样的均值计算方法.3.理解统计图表的含义.考点一 简单随机抽样1.总体、个体、样本调查对象的全体称为____,组成总体的每一个调查对象称为____,在抽样调查中,从总体中抽取的那部分个体称为____,样本中包含的个体数称为________,简称样本量.2.简单随机抽样(1)简单随机抽样分为放回简单随机抽样和不放回简单随机抽样(除非特殊声明,本章所称的简单随机抽样是指不放回简单随机抽样).(2)简单随机抽样的常用方法:______和随机数法.(3)简单随机抽样的抽取方式:逐个不放回抽取.(4)简单随机抽样的特点:每个个体被抽到的概率____.[典例1] (1)(2024·天津南开区期末)利用简单随机抽样的方法,从n个个体(n≥13)中抽取13个个体,若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( )A. B.C. D.(2)我校高三年级为了解学生某项身体指标,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,…,649,650.从中抽取50个样本,如下提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第7个样本编号是( )32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45A.623 B.328C.072 D.457[听课记录] 反思领悟 简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)等可能抽取.巩固迁移1 (1)(2024·上海徐汇区期末)下列抽样方法是简单随机抽样的是( )A.某医院从200名医生中,挑选出50名最优秀的医生去参加活动B.从10个手机中逐个不放回地随机抽取2个进行质量检验C.从空间直角坐标系中抽取10个点作为样本D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查(2)(2024·石家庄期末)一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个样本容量为3的样本,则某一个特定个体被抽到的概率为( )A. B.C. D.考点二 分层随机抽样1.分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行________抽样,再把所有子总体中抽取的样本________作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为__.2.比例分配的分层随机抽样所获得样本的均值与方差利用比例分配的分层(两层)随机抽样获得的样本中,第一层的样本量为n1,均值为,方差为;第二层的样本量为n2,均值为,方差为,则总的样本均值=,总的样本方差s2=.[典例2] (1)(2025·湖北襄阳模拟)一支田径队有男运动员48人,女运动员36人,用分层随机抽样的方法从全体运动员中抽取一个容量为21的样本,抽出的男运动员平均身高为177.5 cm,抽出的女运动员平均身高为168.4 cm,则估计该田径队运动员的平均身高为( )A.173.6 cm B.172.95 cmC.172.3 cm D.176 cm(2)(2023·新高考Ⅱ卷改编)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则在初中部和高中部抽取的人数分别为________.(3)为了解学生的课外阅读情况,某校采用比例分配的分层随机抽样的方法对高中三个年级的学生进行平均每周课外阅读时间(单位:小时)的调查,所得样本数据如下:年级 抽样人数 样本平均数 样本方差高一 40 5 3.5高二 30 2高三已知高中三个年级的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数=________,高三年级学生的样本方差=________.[听课记录] 反思领悟 分层随机抽样中有关计算的方法(1)抽样比==.(2)在分层随机抽样中,如果第1层的样本量为m,平均值为x,方差为;第2层的样本量为n,平均值为y,方差为,则样本的平均值为μ==x+y;方差为s2=+(μ-y)2].巩固迁移2 某工厂新、旧两条生产线的产量比为7∶3,为了解该工厂生产的一批产品的质量情况,采用比例分配的分层随机抽样的方法从两条生产线抽取样本并计算得:新生产线生产的产品的质量指标的均值为10,方差为1;旧生产线生产的产品的质量指标的均值为9,方差为2,据此估计该批产品的质量指标的均值为________,方差为________.考点三 统计图表1.常见的统计图表有条形图、扇形图、折线图、频率分布直方图等.2.频率分布表、频率分布直方图的制作步骤及意义提醒:频率分布直方图中小长方形的高为. 常见的统计图表[典例3] (1)(多选)某中学组织三个年级的学生进行环保知识竞赛.经统计,得到成绩排在前200名学生分布的扇形图(图1)和其中的高一学生排名分布的频率条形图(图2).则下列命题正确的是( ) A.成绩排在前200名的200人中,高二人数比高三人数多10B.成绩排在第1~50名的50人中,高一人数比高二的多C.成绩排在第51~150名的100人中,高三人数占比可能超过D.成绩排在第51~100名的50人中,高二人数肯定多于23(2)(2024·滨州期末)为了研究某市甲、乙两个5G智能手机专卖店的销售状况,厂家统计了去年4月到9月甲、乙两店每月的营业额(单位:万元),得到如图所示的折线图.根据两店的营业额折线图可知,下列说法错误的是( )A.甲店月营业额的平均值在[31,32]内B.乙店月营业额总体呈上升趋势C.7,8,9月份的总营业额甲店比乙店少D.乙店的月营业额极差小于甲店的月营业额极差[听课记录] 反思领悟 本例(1)中,扇形图可以很清楚地看出各部分数量与总数之间的关系;条形图可知总体中样本的种类及对应各类样本的数量;本例(2)中,折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于描述数据随时间的变化趋势.巩固迁移3 (2024·乐山三模)为了解某中学三个年级的学生对食堂饭菜的满意程度,用分层随机抽样的方法抽取30%的学生进行调查,已知该中学学生人数和各年级学生的满意率分别如图1和图2所示,则样本容量和抽取的二年级学生中满意的人数分别为( )A.800,360 B.600,108C.800,108 D.600,360 频率分布直方图[典例4] (1)(2024·大同灵丘县期末)某部门为了了解一批树苗的生长情况,在4 000棵树苗中随机抽取400棵,统计这400棵树苗的高度(单位:cm),将所得数据分成7组:[70,80),[80,90),[90,100),[100,110),[110,120),[120,130),[130,140],并绘制了如图所示的频率分布直方图,那么根据该图可推测,在这4 000棵树苗中高度小于110 cm的树苗棵数约是( )A.1 680 B.1 760C.1 840 D.1 920(2)从某校高三学生中抽取50名参加数学竞赛,成绩(单位:分)分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.①列出样本的频率分布表;②画出频率分布直方图;③估计成绩在[60,90)的学生比例.[听课记录] 反思领悟 本例(1)求解的关键是求出树苗中高度小于110 cm的频率,然后根据频数=样本容量×频率可求出结果;本例(2)中,作频率分布直方图时,纵轴上的数据是各组频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.巩固迁移4 (1)要调查某地区高中学生身体素质,从高中生中抽取100人进行跳远测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)之间的学生中用分层随机抽样的方法抽取5人,应从[120,130)间抽取人数为b,则( )A.a=0.025,b=2 B.a=0.025,b=3C.a=0.030,b=4 D.a=0.030,b=3(2)(2025·江油市模拟)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是( )A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天 B.估计该学生每日完成作业时间超过3小时的概率为0.3 C.估计该学生每日完成作业时间的中位数为2.625小时 D.估计该学生每日完成作业时间的众数为2.3小时1.(多选)(2024·海林市月考)下列抽样方法是简单随机抽样的是( )A.质检员从50个零件中逐个抽取5个做质量检验B.课堂上,李老师对全班45名学生中点名表扬了3名发言积极的C.老师要求学生从实数集中逐个抽取10个分析奇偶性D.某运动员从8条跑道中随机抽取一条跑道试跑2.(2025·南通模拟)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行、第2行:66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 9057 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是( )A.10 B.09 C.71 D.203.已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用比例分配的分层随机抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.100,10 B.200,10C.100,20 D.200,204.(2024·福建学业考试)某市政府计划对居民生活用水实施阶梯式水价制度,即确定一户居民月均用水量标准w(单位:t),用水量不超过w的部分按平价收费,超出w的部分按议价收费,该市随机调查了10 000户居民,获得了他们的月均用水量数据,整理得到频率分布直方图(如图).如果要让该市85%的居民用户的月均用水量不超出标准,那么w应为________(单位:t). 1/1 展开更多...... 收起↑ 资源列表 第1课时随机抽样、统计图表(教师版).docx 第十章第1课时随机抽样、统计图表(学生版).docx