资源简介 一、随机抽样抽样方法的选取原则:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数法;当总体中个体差异较显著时,可采用分层随机抽样,但是要明确是否按比例分配.【例1】 某学校在校学生有3 000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且a∶b∶c=2∶3∶4,全校参加登山的人数占总人数的.为了了解学生对本次比赛的满意程度,按比例分配的分层随机抽样的方法从中抽取一个容量为300的样本进行调查,则应从高二年级参加跑步的学生中抽取( )A.15人 B.30人C.45人 D.60人反思感悟抽样方法的比较简单随机抽样 分层随机抽样共同点 在抽样过程中,每个个体被抽取的概率相等各自 特点 从总体中逐个抽取;在抽样中易出现“极端”的样本 将总体分成几层,分层进行抽取;在抽样中,不易出现“极端”的样本相互 联系 分层随机抽样中,在各层抽样时,采用简单随机抽样适用 范围 总体的个体数较少 总体由差异明显的几部分组成 通过比较这两种抽样方法可以看出,在这两种抽样方法中,简单随机抽样是基础.无论哪种抽样方法,在抽取样本的过程中,都会应用至少一次简单随机抽样(抽签法或随机数法).【跟踪训练】1.以下抽样方法是简单随机抽样的是( )A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的是三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签法从10件产品中选取3件进行质量检验2.(2024·连云港质检)假设要考查某公司生产的狂犬疫苗的剂量是否达标,现从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001,…,499进行编号,如果从随机数表第1行第8列的数开始向右读,请写出第3支疫苗的编号 .8442175331 5724550688 77047447672176335025 8392120676 63016378591695566719 9810507175 12867358074439523879 3321123429 7864560782二、总体取值规律的估计根据样本容量的大小,我们可以选择利用样本的频率分布表、频率分布直方图、频率折线图等对总体情况作出估计.【例2】 为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间反思感悟1.绘制频率分布直方图时需注意的两点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是,而不是频率.2.与频率分布直方图计算有关的两个关系式(1)×组距=频率;(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.【跟踪训练】1.(多选)空气质量指数AQI是反映空气质量状况的指数,AQI指数的值越小,表明空气质量越好,AQI指数不超过50,空气质量为“优”;AQI指数大于50且不超过100,空气质量为“良”;AQI指数大于100,空气质量为“污染”.如图是某市2023年空气质量指数(AQI)的月折线图.下列关于该市2023年空气质量的叙述中,正确的是( )A.全年的平均AQI指数对应的空气质量等级为优或良B.每月都至少有一天空气质量为优C.2月,8月,9月和12月均出现污染天气D.空气质量为“污染”的天数最多的月份是2月份2.(2024·济源月考)某电子商务公司对10 000名网络购物者2023年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)求直方图中a的值;(2)在这些购物者中,求消费金额在区间[0.5,0.9]内的购物者的人数.三、总体百分位数的估计 一组数据的第p百分位数是估计该组数据取值规律的依据.用样本数据的第p百分位数估计总体的第p百分位数可能存在偏差,但样本容量越大,偏差会越小.另外,百分位数只是研究一组数据取值规律的一个统计量.【例3】 下表为某市2023年月平均降水量:月份 1 2 3 4 5 6月平均降 水量/cm 5.8 4.8 5.3 4.6 5.6 5.6月份 7 8 9 10 11 12月平均降 水量/cm 5.1 7.1 5.6 5.3 6.4 6.6则该市2023年月平均降水量的四分位数分别为 , , .反思感悟1.求一组n个数据的第p百分位数的步骤第1步:按从小到大排列原始数据;第2步:计算i=n×p%;第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.2.由频率分布直方图求第p百分位数的方法确定要求的p%分位数所在分组[A,B),由频率分布直方图可知,样本中小于A的频率为a,小于B的频率为b,所以p%分位数=A+组距×.【跟踪训练】 将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班的模拟考试成绩的80%分位数是 .(结果保留两位小数)四、用样本的集中趋势估计总体为了从整体上更好地把握总体规律,我们还可以通过样本数据的众数、中位数、平均数估计总体的集中趋势.【例4】 (1)某班全体学生数学测试成绩(单位:分)的频率分布直方图如图所示,则估计该班数学测试成绩的众数、中位数、平均数分别是( )A.70,70,70 B.70,70,68C.70,68,70 D.68,70,70(2)(多选)(2023·新高考Ⅰ卷9题)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差反思感悟求众数、中位数、平均数的方法(1)众数:由定义知,一组数据中出现次数最多的数,即为众数,若有两个或几个数据出现的次数最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数;(2)中位数:若一组数据为奇数个,按照从小到大(或从大到小)的顺序排列,位于中间位置的数据就是这组数据的中位数;若一组数据为偶数个,按照从小到大(或从大到小)的顺序排列,位于中间位置的两个数据的平均数就是这组数据的中位数;(3)平均数:利用=xi求解.【跟踪训练】1.(多选)(2021·新高考Ⅰ卷9题)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同2.(多选)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则( )A.甲同学体温的极差为0.4 ℃B.乙同学体温的众数为36.4 ℃,中位数与平均数相等C.乙同学的体温比甲同学的体温稳定D.甲同学体温的第60百分位数为36.4 ℃五、用样本的离散程度估计总体为了从整体上更好地把握总体规律,通过样本数据的方差或标准差估计总体的离散程度.【例5】 (2023·全国乙卷17题)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:试验序号i 1 2 3 4 5伸缩率xi 545 533 551 522 575伸缩率yi 536 527 543 530 560试验序号i 6 7 8 9 10伸缩率xi 544 541 568 596 548伸缩率yi 533 522 550 576 536记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.(1)求,s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).反思感悟1.标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.2.计算分层随机抽样的方差的步骤(1)确定,,,;(2)确定;(3)应用公式s2=[+(-)2]+·[+(-)2],计算s2.【跟踪训练】 为调查高一年级学生期中考试数学成绩的情况,从(1)班抽取了12名学生的成绩,他们的平均分为91分,方差为3,从(2)班抽取了8名学生的成绩,他们的平均分为89分,方差为5,则合在一起后的样本均值为 ,样本方差为 .章末复习与总结【例1】 D 由题意,可知全校参加跑步的人数为3 000×=1 800,所以a+b+c=1 800.因为a∶b∶c=2∶3∶4,所以b=1 800×=600.因为按比例分配的分层随机抽样的方法从中抽取一个容量为300的样本,所以应从高二年级参加跑步的学生中抽取的人数为600×=60.跟踪训练1.D 选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.2.068 解析:从随机数表第1行第8列的数开始向右读,编号分别为331,455,068,则第3支疫苗的编号为068.【例2】 C 对于A,根据频率分布直方图可知,家庭年收入低于4.5万元的农户比率约为(0.02+0.04)×1×100%=6%,故A正确;对于B,根据频率分布直方图可知,家庭年收入不低于10.5万元的农户比率约为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;对于C,根据频率分布直方图可知,该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C错误;对于D,根据频率分布直方图可知,家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.跟踪训练1.ABC 对于A,根据AQI指数月折线图可知,全年的平均AQI指数都小于100,故全年的平均AQI指数对应的空气质量等级为优或良,故A正确;对于B,每月中AQI指数的最小值都不超过50,故B正确;对于C,2月,8月,9月和12月的AQI指数的最大值都超过了100,故C正确;对于D,从折线图只能知道,2月AQI指数的最大值最大,不能说明2月的空气质量为“污染”的天数最多,故D不正确.2.解:(1)由0.1×1.5+0.1×2.5+0.1×a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)消费金额在区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故在[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.【例3】 5.2 5.6 6.1 解析:将12个月的月平均降水量的数据由小到大排列得4.6,4.8,5.1,5.3,5.3,5.6,5.6,5.6,5.8,6.4,6.6,7.1,那么①i=12×0.25=3,∴第25百分位数为=5.2;②i=12×0.50=6,∴第50百分位数为=5.6;③i=12×0.75=9,∴第75百分位数为=6.1.跟踪训练 124.44 解析:由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.022 5)×10×100%=92.5%,因此80%分位数一定位于[120,130)内.因为120+×10≈124.44,所以此班的模拟考试成绩的80%分位数约为124.44.【例4】 (1)B (2)BD 解析:(1)由题意知众数为=70;因为(0.005+0.010)×20=0.3<0.5,(0.005+0.010+0.020)×20=0.7>0.5,所以中位数位于[60,80)中,设中位数为x,则(0.005+0.010)×20+(x-60)×0.020=0.5,解得x=70;平均数为30×0.1+50×0.2+70×0.4+90×0.3=68.(2)若该组样本数据为1,2,3,4,5,8,则2,3,4,5的平均数为,1,2,3,4,5,8的平均数为,两组数据的平均数不相等,故A错误;不妨设x1≤x2≤x3≤x4≤x5≤x6,则x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数,故B正确;若该组样本数据为1,2,2,2,2,8,则2,2,2,2的标准差为0,而1,2,2,2,2,8的标准差大于0,故C错误;由对选项B的分析可知,x2,x3,x4,x5的极差为x5-x2,x1,x2,x3,x4,x5,x6的极差为x6-x1,且易得x6-x1≥x5-x2,故D正确.故选B、D.跟踪训练1.CD 设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为+c,m+c,σ,t,因为c≠0,所以C、D正确,故选C、D.2.ABC 对于A,甲同学体温的极差为36.6-36.2=0.4(℃),故A正确;对于B,乙同学体温为36.4,36.3,36.5,36.4,36.4,36.3,36.5,其众数为36.4 ℃,中位数、平均数均为36.4 ℃,故B正确;对于C,根据图中数据,甲同学体温的平均数为36.4 ℃,与乙同学体温的平均数相同,但甲同学体温的极差为0.4 ℃,大于乙同学体温的极差0.2 ℃,而且从图中容易看出乙同学的数据更集中,故乙同学的体温比甲同学的体温稳定,故C正确;对于D,甲同学的体温从小到大排序为36.2,36.2,36.4,36.4,36.5,36.5,36.6,7×60%=4.2,故甲同学体温的第60百分位数为36.5 ℃,故D错误.【例5】 解:(1)由题意,求出zi的值如表所示,试验序号i 1 2 3 4 5 6 7 8 9 10zi 9 6 8 -8 15 11 19 18 20 12则=×(9+6+8-8+15+11+19+18+20+12)=11,s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)因为2=2=,=11=>,所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.跟踪训练 90.2 4.76 解析:样本均值==90.2,样本方差s2=×[3+(91-90.2)2]+×[5+(89-90.2)2]=4.76.7 / 7(共44张PPT)章末复习与总结一、随机抽样抽样方法的选取原则:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数法;当总体中个体差异较显著时,可采用分层随机抽样,但是要明确是否按比例分配.【例1】 某学校在校学生有3 000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且a∶b∶c=2∶3∶4,全校参加登山的人数占总人数的 .为了了解学生对本次比赛的满意程度,按比例分配的分层随机抽样的方法从中抽取一个容量为300的样本进行调查,则应从高二年级参加跑步的学生中抽取( )A. 15人 B. 30人C. 45人 D. 60人解析: 由题意,可知全校参加跑步的人数为3 000× =1 800,所以a+b+c=1 800.因为a∶b∶c=2∶3∶4,所以b=1 800×=600.因为按比例分配的分层随机抽样的方法从中抽取一个容量为300的样本,所以应从高二年级参加跑步的学生中抽取的人数为600× =60.反思感悟抽样方法的比较简单随机抽样 分层随机抽样共同点 在抽样过程中,每个个体被抽取的概率相等各自特点 从总体中逐个抽取;在抽样中易出现“极端”的样本 将总体分成几层,分层进行抽取;在抽样中,不易出现“极端”的样本相互联系 分层随机抽样中,在各层抽样时,采用简单随机抽样适用范围 总体的个体数较少 总体由差异明显的几部分组成 通过比较这两种抽样方法可以看出,在这两种抽样方法中,简单随机抽样是基础.无论哪种抽样方法,在抽取样本的过程中,都会应用至少一次简单随机抽样(抽签法或随机数法).【跟踪训练】1. 以下抽样方法是简单随机抽样的是( )A. 在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的是三等奖B. 某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C. 某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D. 用抽签法从10件产品中选取3件进行质量检验解析: 选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.2. (2024·连云港质检)假设要考查某公司生产的狂犬疫苗的剂量是否达标,现从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001,…,499进行编号,如果从随机数表第1行第8列的数开始向右读,请写出第3支疫苗的编号 .8442175331 5724550688 7704744767 21763350258392120676 6301637859 1695566719 98105071751286735807 4439523879 3321123429 7864560782解析:从随机数表第1行第8列的数开始向右读,编号分别为331,455,068,则第3支疫苗的编号为068.068二、总体取值规律的估计根据样本容量的大小,我们可以选择利用样本的频率分布表、频率分布直方图、频率折线图等对总体情况作出估计.【例2】 为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )A. 该地农户家庭年收入低于4.5万元的农户比率估计为6%B. 该地农户家庭年收入不低于10.5万元的农户比率估计为10%C. 估计该地农户家庭年收入的平均值不超过6.5万元D. 估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间解析: 对于A,根据频率分布直方图可知,家庭年收入低于4.5万元的农户比率约为(0.02+0.04)×1×100%=6%,故A正确;对于B,根据频率分布直方图可知,家庭年收入不低于10.5万元的农户比率约为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;对于C,根据频率分布直方图可知,该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C错误;对于D,根据频率分布直方图可知,家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.反思感悟1. 绘制频率分布直方图时需注意的两点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是 ,而不是频率.2. 与频率分布直方图计算有关的两个关系式(1) ×组距=频率;(2) =频率,此关系式的变形为 =样本容量,样本容量×频率=频数.【跟踪训练】1. (多选)空气质量指数AQI是反映空气质量状况的指数,AQI指数的值越小,表明空气质量越好,AQI指数不超过50,空气质量为“优”;AQI指数大于50且不超过100,空气质量为“良”;AQI指数大于100,空气质量为“污染”.如图是某市2023年空气质量指数(AQI)的月折线图.A. 全年的平均AQI指数对应的空气质量等级为优或良B. 每月都至少有一天空气质量为优C. 2月,8月,9月和12月均出现污染天气D. 空气质量为“污染”的天数最多的月份是2月份下列关于该市2023年空气质量的叙述中,正确的是( )解析: 对于A,根据AQI指数月折线图可知,全年的平均AQI指数都小于100,故全年的平均AQI指数对应的空气质量等级为优或良,故A正确;对于B,每月中AQI指数的最小值都不超过50,故B正确;对于C,2月,8月,9月和12月的AQI指数的最大值都超过了100,故C正确;对于D,从折线图只能知道,2月AQI指数的最大值最大,不能说明2月的空气质量为“污染”的天数最多,故D不正确.2. (2024·济源月考)某电子商务公司对10 000名网络购物者2023年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)求直方图中a的值;解:由0.1×1.5+0.1×2.5+0.1×a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)在这些购物者中,求消费金额在区间[0.5,0.9]内的购物者的人数.解:消费金额在区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故在[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.三、总体百分位数的估计 一组数据的第p百分位数是估计该组数据取值规律的依据.用样本数据的第p百分位数估计总体的第p百分位数可能存在偏差,但样本容量越大,偏差会越小.另外,百分位数只是研究一组数据取值规律的一个统计量.月份 1 2 3 4 5 6月平均降水量/cm 5.8 4.8 5.3 4.6 5.6 5.6月份 7 8 9 10 11 12月平均降水量/cm 5.1 7.1 5.6 5.3 6.4 6.6则该市2023年月平均降水量的四分位数分别为 , , .5.25.66.1【例3】 下表为某市2023年月平均降水量:解析:将12个月的月平均降水量的数据由小到大排列得4.6,4.8,5.1,5.3,5.3,5.6,5.6,5.6,5.8,6.4,6.6,7.1,那么①i=12×0.25=3,∴第25百分位数为 =5.2;②i=12×0.50=6,∴第50百分位数为 =5.6;③i=12×0.75=9,∴第75百分位数为 =6.1.反思感悟1. 求一组n个数据的第p百分位数的步骤第1步:按从小到大排列原始数据;第2步:计算i=n×p%;第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.2. 由频率分布直方图求第p百分位数的方法确定要求的p%分位数所在分组[A,B),由频率分布直方图可知,样本中小于A的频率为a,小于B的频率为b,所以p%分位数=A+组距× .【跟踪训练】 将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班的模拟考试成绩的80%分位数是 .(结果保留两位小数)124.44解析:由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.022 5)×10×100%=92.5%,因此80%分位数一定位于[120,130)内.因为120+ ×10≈124.44,所以此班的模拟考试成绩的80%分位数约为124.44.四、用样本的集中趋势估计总体为了从整体上更好地把握总体规律,我们还可以通过样本数据的众数、中位数、平均数估计总体的集中趋势.【例4】 (1)某班全体学生数学测试成绩(单位:分)的频率分布直方图如图所示,则估计该班数学测试成绩的众数、中位数、平均数分别是( B )A. 70,70,70 B. 70,70,68C. 70,68,70 D. 68,70,70B解析:由题意知众数为 =70;因为(0.005+0.010)×20=0.3<0.5,(0.005+0.010+0.020)×20=0.7>0.5,所以中位数位于[60,80)中,设中位数为x,则(0.005+0.010)×20+(x-60)×0.020=0.5,解得x=70;平均数为30×0.1+50×0.2+70×0.4+90×0.3=68.(2)(多选)(2023·新高考Ⅰ卷9题)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( BD )A. x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B. x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C. x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D. x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差BD解析:若该组样本数据为1,2,3,4,5,8,则2,3,4,5的平均数为 ,1,2,3,4,5,8的平均数为 ,两组数据的平均数不相等,故A错误;不妨设x1≤x2≤x3≤x4≤x5≤x6,则x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数,故B正确;若该组样本数据为1,2,2,2,2,8,则2,2,2,2的标准差为0,而1,2,2,2,2,8的标准差大于0,故C错误;由对选项B的分析可知,x2,x3,x4,x5的极差为x5-x2,x1,x2,x3,x4,x5,x6的极差为x6-x1,且易得x6-x1≥x5-x2,故D正确.故选B、D.反思感悟求众数、中位数、平均数的方法(1)众数:由定义知,一组数据中出现次数最多的数,即为众数,若有两个或几个数据出现的次数最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数;(2)中位数:若一组数据为奇数个,按照从小到大(或从大到小)的顺序排列,位于中间位置的数据就是这组数据的中位数;若一组数据为偶数个,按照从小到大(或从大到小)的顺序排列,位于中间位置的两个数据的平均数就是这组数据的中位数;(3)平均数:利用 = xi求解.【跟踪训练】1. (多选)(2021·新高考Ⅰ卷9题)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )A. 两组样本数据的样本平均数相同B. 两组样本数据的样本中位数相同C. 两组样本数据的样本标准差相同D. 两组样本数据的样本极差相同解析: 设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为 ,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为 +c,m+c,σ,t,因为c≠0,所以C、D正确,故选C、D.2. (多选)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则( )A. 甲同学体温的极差为0.4 ℃B. 乙同学体温的众数为36.4 ℃,中位数与平均数相等C. 乙同学的体温比甲同学的体温稳定D. 甲同学体温的第60百分位数为36.4 ℃解析: 对于A,甲同学体温的极差为36.6-36.2=0.4(℃),故A正确;对于B,乙同学体温为36.4,36.3,36.5,36.4,36.4,36.3,36.5,其众数为36.4 ℃,中位数、平均数均为36.4 ℃,故B正确;对于C,根据图中数据,甲同学体温的平均数为36.4 ℃,与乙同学体温的平均数相同,但甲同学体温的极差为0.4 ℃,大于乙同学体温的极差0.2 ℃,而且从图中容易看出乙同学的数据更集中,故乙同学的体温比甲同学的体温稳定,故C正确;对于D,甲同学的体温从小到大排序为36.2,36.2,36.4,36.4,36.5,36.5,36.6,7×60%=4.2,故甲同学体温的第60百分位数为36.5 ℃,故D错误.五、用样本的离散程度估计总体为了从整体上更好地把握总体规律,通过样本数据的方差或标准差估计总体的离散程度.【例5】 (2023·全国乙卷17题)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:试验序号i 1 2 3 4 5伸缩率xi 545 533 551 522 575伸缩率yi 536 527 543 530 560试验序号i 6 7 8 9 10伸缩率xi 544 541 568 596 548伸缩率yi 533 522 550 576 536记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.(1)求 ,s2;解:由题意,求出zi的值如表所示,试验序号i 1 2 3 4 5 6 7 8 9 10zi 9 6 8 -8 15 11 19 18 20 12则 = ×(9+6+8-8+15+11+19+18+20+12)=11,s2= ×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果 ≥2 ,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).解:因为2 =2 = , =11= > ,所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.反思感悟1. 标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.2. 计算分层随机抽样的方差的步骤(1)确定 , , , ;(2)确定 ;(3)应用公式s2= [+( - )2]+ ·[+( -)2],计算s2.【跟踪训练】为调查高一年级学生期中考试数学成绩的情况,从(1)班抽取了12名学生的成绩,他们的平均分为91分,方差为3,从(2)班抽取了8名学生的成绩,他们的平均分为89分,方差为5,则合在一起后的样本均值为 ,样本方差为 .解析:样本均值 = =90.2,样本方差s2= ×[3+(91-90.2)2]+ ×[5+(89-90.2)2]=4.76.90.24.76谢 谢 观 看! 展开更多...... 收起↑ 资源列表 章末复习与总结.docx 章末复习与总结.pptx