资源简介 第4讲 统 计1.(2025·全国Ⅱ卷,T1)样本数据2,8,14,16,20的平均数为( )A.8 B.9 C.12 D.18答案 C解析 样本数据2,8,14,16,20的平均数为=12.2.(2023·新课标Ⅱ卷,T3)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( )A.·种 B.·种C.·种 D.·种答案 D解析 根据比例分配的分层随机抽样的定义知,初中部共抽取60×=40(人),高中部共抽取60×=20(人),根据组合公式和分步乘法计数原理知,不同的抽样结果共有·种.3.(2024·新课标Ⅱ卷,T4)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:亩产量 [900,950) [950,1 000) [1 000,1 050) [1 050,1 100) [1 100, 1 150) [1 150,1 200)频数 6 12 18 30 24 10根据表中数据,下列结论中正确的是( )A.100块稻田亩产量的中位数小于1 050 kgB.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200 kg至300 kg之间D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间答案 C解析 对于A,根据频数分布表可知,6+12+18=36<50,所以亩产量的中位数不小于1 050 kg, 故A错误;对于B,亩产量不低于1 100 kg的频数为24+10=34,所以低于1 100 kg的稻田占比为×100%=66%,故B错误;对于C,因为1 200-900=300,1 150-950=200,故C正确;对于D,由频数分布表可得,平均值为×(6×925+12×975+18×1 025+30×1 075+24×1 125+10×1 175)=1 067,故D错误.4.(多选)(2023·新课标Ⅰ卷,T9)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差答案 BD解析 取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为=故A,C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.命题热度:本讲是历年高考命题必考的内容,属于中低档题目,三种题型都有所考查,分值约为5~13分.考查方向:一是统计图表的识别,主要考查利用统计图表对变化趋势的预测;二是样本的数字特征,主要考查中位数、众数、平均数、百分位数及方差和标准差;三是利用频率分布直方图求数字特征、估计总体的数字特征,常与概率相结合考查.考点一 统计图表例1 (1)某市教育局对全市高三年级的学生身高进行抽样调查,随机抽取了200名学生,他们的身高分成A,B,C,D,E五个组,根据抽样结果得到统计图表,则样本中( )A.女生人数和男生人数一样多B.D组中男生人数多于女生人数C.B组男生人数为24人D.A组人数最少答案 C解析 对于A,样本中的女生,A组中有18人,B组中有48人,C组中有30人,D组中有18人,E组中有6人,女生共有18+48+30+18+6=120(人),男生有200-120=80(人),因此样本中女生人数多于男生人数,A错误;对于B,由扇形图,D组中有男生80×20%=16(人),女生18人,因此D组中女生多于男生,B错误;对于C,B组中有男生80×(1-20%-25%-15%-10%)=24(人),C正确;对于D,A组有18+80×10%=26(人),E组有6+80×15%=18(人),A组人数不是最少的,D错误.(2)(多选)为了研究某城市甲、乙两个5G智能手机专卖店的销售状况,统计了2023年4月到9月甲、乙两店每月的营业额(单位:万元),得到如下的折线图,则下列说法正确的是( )A.根据甲店的营业额折线图可知,该店月营业额的平均值在[31,33]内B.根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势C.根据甲、乙两店的营业额折线图可知,乙店的月营业额极差比甲店小D.根据甲、乙两店的营业额折线图可知,7,8,9月份的总营业额甲店比乙店少答案 ABD解析 对于A,甲店月营业额的平均值为×(14+21+26+30+52+47)≈31.7,31.7∈[31,33],所以A正确;对于B,根据乙店的营业额折线图可知,乙店每月的营业额逐月变大,所以总体呈上升趋势,所以B正确;对于C,根据甲、乙两店的营业额折线图可知甲店的月营业额极差为52-14=38,乙店的月营业额极差为53-7=46,乙店的月营业额极差比甲店大,所以C错误;对于D,由营业额折线图可知,甲店的7,8,9月份的总营业额为30+52+47=129,乙店的7,8,9月份的总营业额为33+44+53=130,129<130,所以D正确.[规律方法] 统计图表的主要应用(1)扇形图:直观描述各类数据占总数的比例.(2)折线图:描述数据随时间的变化趋势.(3)条形图:直观描述不同类别或分组数据的频数和频率.跟踪演练1 肠胃病的严重程度,一般可体现在排便量、排便时长上.某高中为了了解学生肠胃病占比和严重程度,对2024年高一、高二年级的学生单日单次的排便时长进行了统计,记排便10分钟内为正常,排便10~20分钟为轻度肠胃病,排便20分钟以上为重度肠胃病,并将结果制成统计图(如图所示),若高一年级有学生1 000人,高二年级有学生1 200人,占比百分数均保留整数,下列说法正确的是( )A.高二年级肠胃病学生人数比高一年级的少B.高一年级的各肠胃病区间的学生人数占比都比高二年级的少C.高一年级重度肠胃病学生人数占比比高二年级的少D.高一年级学生的肠胃质量参数比高二年级的高答案 C解析 由扇形图可得高一年级肠胃病学生人数为1 000×55%=550,高一年级轻度肠胃病学生人数占比为42%,高一年级重度肠胃病学生人数占比为13%,高一年级学生的肠胃质量参数为=<1;由条形图可得高二年级肠胃病学生人数为389+165=554,高二年级轻度肠胃病学生人数占比为≈32%,高二年级重度肠胃病学生人数占比为≈14%,高二年级学生的肠胃质量参数为=>1,所以高二年级肠胃病学生人数比高一年级的多,A错误;高一年级轻度肠胃病学生人数占比比高二年级的多,B错误;高一年级重度肠胃病学生人数占比比高二年级的少,C正确;高一年级学生的肠胃质量参数比高二年级的低,D错误.考点二 样本的数字特征1.众数:在样本数据中,出现次数最多的那个数据.2.中位数:在样本数据中,将数据按大小依次排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.3.平均数:样本数据的算术平均数=(x1+x2+…+xn).4.百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.5.方差与标准差方差:s2=[(x1-)2+(x2-)2+…+(xn-)2].标准差:s=.例2 (1)为备战某次运动会,已知某运动员某次特训的成绩分别为4,8,9,3,3,5,7,9,则下列说法错误的是( )A.这组数据的极差为6B.这组数据的众数为3C.这组数据的平均数为6D.这组数据的方差为答案 B解析 这组数据由小到大排列为3,3,4,5,7,8,9,9,极差为9-3=6,众数为3,9,所以A正确,B错误;平均数==6,所以C正确;方差s2=×[(3-6)2+(3-6)2+(4-6)2+(5-6)2+(7-6)2+(8-6)2+(9-6)2+(9-6)2]=所以D正确.(2)(2025·绵阳模拟)某家电公司生产了A,B两种不同型号的空调,公司统计了某地区2024年的前6个月这两种型号的空调的销售情况,得到销售量的折线图如图所示,分析这6个月的销售数据,下列说法不正确的是( )A.A型号空调月销售量的极差比B型号空调月销售量的极差大B.A型号空调月平均销售量比B型号空调月平均销售量大C.A型号空调月销售量的上四分位数比B型号空调销售量的上四分位数大D.A型号空调月销售量的方差比B型号空调月销售量的方差小答案 D解析 由图可知,A型号空调月销售量的极差为50-25=25,B型号空调月销售量的极差为45-22=23,故A正确;A型号空调月平均销售量为×(25+28+27+42+38+50)=35,B型号空调月平均销售量为×(22+25+30+37+40+45)≈33,故B正确;将A型号空调月销售量数据从小到大排列为25,27,28,38,42,50,由6×75%=4.5,则A型号空调月销售量的上四分位数为42,将B型号空调月销售量数据从小到大排列为22,25,30,37,40,45,由6×75%=4.5,则B型号空调月销售量的上四分位数为40,故C正确;A型号空调月销售量的方差为×[(25-35)2+(28-35)2+(27-35)2+(42-35)2+(38-35)2+(50-35)2]≈83,B型号空调月销售量的方差约为×[(22-33)2+(25-33)2+(30-33)2+(37-33)2+(40-33)2+(45-33)2]≈67,故D错误.[规律方法] 计算一组n个数据第p百分位数的步骤跟踪演练2 (1)(多选)随机抽取6位影迷对某电影的评分,得到一组样本数据如下:92,93,95,95,97,98,则下列关于该样本的说法中正确的有( )A.平均数为95 B.极差为6C.方差为26 D.第80百分位数为97答案 ABD解析 由题意得92,93,95,95,97,98的平均数为=95,A正确;极差为98-92=6,B正确;方差为×[(92-95)2+(93-95)2+(95-95)2+(95-95)2+(97-95)2+(98-95)2]=C错误;由于80%×6=4.8,故第80百分位数为第5个数,即97,D正确.(2)(多选)如图是我国在第九届到第十七届夏季残奥会(编号分别为9,10,…,17)获得的金牌数和奖牌数的折线图,则( )A.金牌数增长最快的一届是第十二届B.奖牌数增长最快的一届是第十二届C.这9届我国获得的金牌数的中位数为89D.这9届我国获得的奖牌数的第70百分位数为220答案 ACD解析 对于A,由折线图可得,金牌数增长较快的有第十一届、第十二届、第十三届,其中第十一届比第十届增长的金牌数为34-16=18,第十二届比第十一届增长的金牌数为63-34=29,第十三届比第十二届增长的金牌数为89-63=26,所以金牌数增长最快的一届是第十二届,所以A正确;对于B,由折线图可得,奖牌数增长较快的有第十一届、第十二届、第十三届,其中第十一届比第十届增长的奖牌数为73-39=34,第十二届比第十一届增长的奖牌数为141-73=68,第十三届比第十二届增长的奖牌数为211-141=70,所以奖牌数增长最快的一届是第十三届,所以B错误;对于C,将这9届我国获得的金牌数按从小到大排序,得11,16,34,63,89,94,95,96,107,数据的中位数为89,所以C正确;对于D,将这9届我国获得的奖牌数按从小到大排序,得25,39,73,141,207,211,220,231,239,因为9×70%=6.3,所以这9届我国获得的奖牌数的第70百分位数是上述数据的第7个数,所以第70百分位数为220,所以D正确.考点三 频率分布直方图1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率=组距×.2.在频率分布直方图中各小长方形的面积之和为1.例3 (1)(多选)某校对120名学生的数学竞赛成绩进行统计,分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,得到如图所示的频率分布直方图,则下列说法中正确的是( )A.a=0.010B.估计该校学生竞赛成绩的众数为75C.该校学生竞赛成绩的中位数大于80D.估计该校学生竞赛成绩的平均数落在[70,80)内答案 ABD解析 由于组距为10,所以有a+0.020+0.035+0.025+a=0.1,得a=0.010,故A正确;竞赛成绩在[70,80)内的学生最多,可以将该区间的中点值75作为众数的估计值,故B正确;[50,60),[60,70)两组的频率之和为0.3,[70,80)的频率为0.35,所以中位数一定落在[70,80)内,即中位数小于80,故C错误;0.1×55+0.2×65+0.35×75+0.25×85+0.1×95=75.5,落在[70,80)内,故D正确.(2)某中学举办电脑知识竞赛,满分为100分,80分以上(含80分)为优秀.现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如图所示,已知图中从左到右的第一、三、四、五小组的频率分别为0.30,0.15,0.10,0.05,而第二小组的频数是40,则参赛的人数是 ,成绩优秀的频率是 . 答案 100 0.15解析 设参赛的人数为n,第二小组的频率为1-0.30-0.15-0.10-0.05=0.4,由=0.4,解得n=100.由题意,知第四、五两组成绩优秀,故成绩优秀的频率为0.10+0.05=0.15.[规律方法] 利用频率分布直方图求众数、中位数与平均数(1)最高的小长方形底边中点的横坐标即众数.(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.跟踪演练3 2005年,康百万庄园被授予国家AAAA级旅游景区.近年来康百万庄园成为越来越多人选的旅游之地,现为更好地提升旅游品质,庄园风景区的工作人员随机选择100名游客对景区进行满意度评分(满分100分),根据评分制成如图所示的频率分布直方图.(1)估计这100名游客对景区满意度评分的平均数;(以区间中点值作为代表)(2)估计这100名游客对景区满意度评分的中位数;(保留两位小数)(3)庄园景区的工作人员采用按比例分配的分层随机抽样的方法从评分在[70,80),[80,90)的两组中抽取6人,再从6人中随机抽取2人进行交流,求抽取的2人评分分别在[70,80)和[80,90)内的概率.解 (1)由频率分布直方图可知,平均数为55×0.05+65×0.1+75×0.15+85×0.3+95×0.4=84.(2)∵0.05+0.1+0.15=0.3<0.5,0.05+0.1+0.15+0.3=0.6>0.5,∴中位数落在[80,90)内,令中位数为m,则0.3+(m-80)×0.03=0.5,解得m≈86.67,即中位数为86.67.(3)∵评分在[70,80),[80,90)内的频率分别是0.15,0.3,∴在[70,80)中抽取×6=2(人),记为a,b;在[80,90)中抽取×6=4(人),记为A,B,C,D.从6人中随机抽取2人,则有(a,b),(a,A),(a,B),(a,C),(a,D),(b,A),(b,B),(b,C),(b,D),(A,B),(A,C),(A,D),(B,C),(B,D),(C,D),共15个可能结果,设“抽取的2人评分分别在[70,80),[80,90)内”为事件M,则满足事件M的可能结果有(a,A),(a,B),(a,C),(a,D),(b,A),(b,B),(b,C),(b,D),共8个,∴P(M)=.∴选取的2人评分分别在[70,80)和[80,90)内的概率为.专题突破练[分值:80分]一、单项选择题(每小题5分,共30分)1.(2025·萍乡模拟)已知一组数据为:123,117,117,121,122,120,116,114,120,119,则这组数据的75%分位数是( )A.114 B.115 C.120.5 D.121答案 D解析 共10个数据,按从小到大的顺序排列为114,116,117,117,119,120,120,121,122,123,10×0.75=7.5,则75%分位数是第8个数据121.2.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66 67 40 37 14 64 05 71 11 05 6509 95 86 68 76 83 20 37 9057 16 03 11 63 14 90 84 45 21 7573 88 05 90 52 23 59 43 10若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本的编号是( )A.10 B.09 C.71 D.20答案 B解析 从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,20,所以选出来的第4个样本的编号为09.3.(2025·东三省四市教研联合体模拟)为了了解学校质量监测成绩,现随机抽取该校200名学生的成绩作为样本进行分析,并绘制频率分布直方图,若该频率分布直方图的组距为10,且样本中成绩在区间[92.5,102.5)这一组内的学生有40人,则在频率分布直方图中该组数据对应的矩形高度为( )A.0.02 B.0.2 C.0.04 D.0.4答案 A解析 由题意成绩在区间[92.5,102.5)内学生的频率为=0.2=0.02,即所求矩形高度为0.02.4.(2025·安康联考)有一组样本数据x1,x2,…,xn,其平均数为方差为若样本数据-x1+1,-x2+1,…,-xn+1的平均数为方差为则( )A.=-1 B.=C.= D.>答案 C解析 根据样本数据平均数公式可知=-+1,方差=(-1)2=.5.小亮记录了自己一周内每天校外锻炼的时间(单位:分),并制作了如图所示的统计图.根据统计图,下列关于小亮该周每天校外锻炼时间的描述,正确的是( )A.平均数为70分钟 B.众数为67分钟C.中位数为67分钟 D.方差为0答案 B解析 平均数为=73(分钟),把这组数据按照从小到大的顺序排列为65,67,67,70,75,79,88,故中位数为70分钟,这组数据中67出现了2次,出现的次数最多,故众数是67分钟,由于这7个数不完全相等,故方差不为0.6.在如图所示的两种分布形态中,下列说法正确的是( )A.图(1)中的中位数大于平均数B.图(1)中的众数大于平均数C.图(2)中的众数小于中位数D.图(2)中的中位数大于平均数答案 D解析 众数是最高的矩形的中点横坐标,因此图(1)中的众数在第二列矩形的中点处,数据第二、三列较多,且右侧拖尾,所以平均数大于中位数,即在图(1)中,众数<中位数<平均数;同理在图(2)中,平均数<中位数<众数.二、多项选择题(每小题6分,共12分)7.(2025·江苏新高考基地联考)赋分是根据考生原始分数在全体考生中的排名比例进行转化的,在一次模拟考试中,某班5名同学的地理科目的原始分与赋分如表.学号 1 2 3 4 5原始分 93 85 78 52 x赋分 100 96 92 70 82记这5名同学在这次模拟考试中的地理科目的原始分为数据甲,赋分为数据乙,则( )A.甲的平均数小于乙的平均数B.甲的中位数小于乙的中位数C.甲的极差小于乙的极差D.甲的方差小于乙的方差答案 AB解析 根据题意得,赋分后,学生成绩提高了,平均数和中位数都会增加,故A,B正确;根据赋分,知学号5的原始分满足78>x>52,则甲的极差为93-52=41,乙的极差为100-70=30,41>30,故C错误;赋分后,结合极差可知,数据乙更集中,方差更小,故D错误.8.(2025·攀枝花模拟)某校高三年级共有1 000名学生,为了解学生的身体发育情况,随机抽取了100名学生的体重数据,将数据整理得到如图所示的频率分布直方图,则( )A.a=0.04B.样本的众数估计值为55C.样本的第75百分位数约为61.25D.该校高三年级学生中体重高于65千克的学生大约为200人答案 AC解析 对于A,0.01×5+0.07×5+0.06×5+a×5+0.02×5=1,解得a=0.04,故A正确;对于B,由图可知体重在[50,55)的样本最多,则样本的众数估计值为52.5,故B错误;对于C,由0.01×5+0.07×5+0.06×5+0.04×5=0.9>0.75,0.01×5+0.07×5+0.06×5=0.7<0.75,则设第75百分位数为x,0.01×5+0.07×5+0.06×5+0.04×(x-60)=0.75,解得x=61.25,故C正确;对于D,由图可得学生体重高于65千克的概率P=0.02×5=0.1,则该校高三年级学生中体重高于65千克的学生大约为1 000×0.1=100(人),故D错误.三、填空题(每小题5分,共10分)9.(2025·湖南名校联合体模拟)高三某班第一组学生的数学期末考试成绩分别为138,130,120,122,120,130,110,130,则该组成绩的中位数与平均数之差的绝对值为 . 答案 1解析 将成绩从小到大排列为110,120,120,122,130,130,130,138,所以该组成绩的中位数为=126,平均数为=125,所以该组成绩的中位数与平均数之差的绝对值为|126-125|=1.10.某校采用按比例分配的分层随机抽样采集了高一年级学生的身高情况,部分统计数据如下:性别 样本量 样本平均数 样本方差男 100 170 22女 100 160 38则估计该校高一年级的全体学生的身高的平均数为 ,方差为 . 答案 165 55解析 由题意可得,该校高一年级全体学生的身高的平均数为×(100×170+100×160)=165,由结论可得,方差为s2=×{100×[22+(170-165)2]+100×[38+(160-165)2]}=55.四、解答题(共28分)11.(13分)2025年4月24日,神舟二十号载人飞船在长征二号F遥二十运载火箭的托举下,成功发射升空.为发扬并传承中国航天精神,我市随机抽取600名学生进行航天知识竞赛并记录学生的成绩(满分100分),将学生的成绩整理后分成五组,从左到右依次记为[50,60),[60,70),[70,80),[80,90),[90,100],并绘制成如图所示的频率分布直方图.(1)求n的值;(4分)(2)求第70百分位数;(4分)(3)求这600名学生成绩的平均数(同一组数据用该组区间的中点值作代表).(5分)解 (1)由(0.005+n+0.015+0.030+0.040)×10=1,得n=0.010.(2)因为0.1+0.3=0.4<0.7,0.1+0.3+0.4=0.8>0.7,所以设第70百分位数为x,则0.4+×0.4=0.7,解得x=77.5.所以第70百分位数为77.5.(3)这600名学生成绩的平均数为(55×0.010+65×0.030+75×0.040+85×0.015+95×0.005)×10=72.5.12.(15分)移动端的美颜拍摄类APP主要有两类:A类是以自拍人像、美颜美妆为核心功能的APP;B类是图片编辑、精修等图片美化类APP.某机构为调查市民对上述A,B两类APP的使用情况,随机调查了部分市民.已知被调查的市民中使用过A类APP的占60%,使用过B类APP的占50%,设个人对美颜拍摄类APP类型的选择及各人的选择之间相互独立.(1)从样本人群中任选1人,求该人使用过美颜拍摄类APP的概率;(4分)(2)从样本人群中任选5人,记X为5人中使用过美颜拍摄类APP的人数,设X的数学期望为E(X),求P(X=E(X));(5分)(3)在单独使用过A,B两类APP的样本人群中,按类型分甲、乙两组,并在各组中随机抽取8人,甲组对A类APP,乙组对B类APP分别评分如下:甲组评分 94 86 92 96 87 93 90 82乙组评分 85 83 85 91 75 90 83 80记甲、乙两组评分的平均数分别为标准差分别为s1,s2,试判断哪组评价更合理.(设Vi=(i=1,2),Vi越小,则认为对应组评价更合理)(6分)参考数据:≈0.439≈0.482.解 (1)设事件A表示“使用过A类APP”,事件B表示“使用过B类APP”,由题意知P(A)=0.6,P(B)=0.5.任选一人,该人使用过美颜拍摄类APP的概率P=1-P()=1-P()P()=1-0.4×0.5=0.8.(2)由题意知X~B则X的数学期望E(X)=5×=4.P(X=E(X))=P(X=4)=×=.(3)==90,==84,s1==≈4.39,s2==≈4.82,V1=≈故甲组对A类APP的评价更合理.第4讲 统 计1.(2025·全国Ⅱ卷,T1)样本数据2,8,14,16,20的平均数为( )A.8 B.9 C.12 D.182.(2023·新课标Ⅱ卷,T3)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( )A.·种 B.·种C.·种 D.·种3.(2024·新课标Ⅱ卷,T4)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:亩产量 [900,950) [950,1 000) [1 000,1 050) [1 050,1 100) [1 100, 1 150) [1 150,1 200)频数 6 12 18 30 24 10根据表中数据,下列结论中正确的是( )A.100块稻田亩产量的中位数小于1 050 kgB.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200 kg至300 kg之间D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间4.(多选)(2023·新课标Ⅰ卷,T9)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差命题热度:本讲是历年高考命题必考的内容,属于中低档题目,三种题型都有所考查,分值约为5~13分.考查方向:一是统计图表的识别,主要考查利用统计图表对变化趋势的预测;二是样本的数字特征,主要考查中位数、众数、平均数、百分位数及方差和标准差;三是利用频率分布直方图求数字特征、估计总体的数字特征,常与概率相结合考查.考点一 统计图表例1 (1)某市教育局对全市高三年级的学生身高进行抽样调查,随机抽取了200名学生,他们的身高分成A,B,C,D,E五个组,根据抽样结果得到统计图表,则样本中( )A.女生人数和男生人数一样多B.D组中男生人数多于女生人数C.B组男生人数为24人D.A组人数最少(2)(多选)为了研究某城市甲、乙两个5G智能手机专卖店的销售状况,统计了2023年4月到9月甲、乙两店每月的营业额(单位:万元),得到如下的折线图,则下列说法正确的是( )A.根据甲店的营业额折线图可知,该店月营业额的平均值在[31,33]内B.根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势C.根据甲、乙两店的营业额折线图可知,乙店的月营业额极差比甲店小D.根据甲、乙两店的营业额折线图可知,7,8,9月份的总营业额甲店比乙店少[规律方法] 统计图表的主要应用(1)扇形图:直观描述各类数据占总数的比例.(2)折线图:描述数据随时间的变化趋势.(3)条形图:直观描述不同类别或分组数据的频数和频率.跟踪演练1 肠胃病的严重程度,一般可体现在排便量、排便时长上.某高中为了了解学生肠胃病占比和严重程度,对2024年高一、高二年级的学生单日单次的排便时长进行了统计,记排便10分钟内为正常,排便10~20分钟为轻度肠胃病,排便20分钟以上为重度肠胃病,并将结果制成统计图(如图所示),若高一年级有学生1 000人,高二年级有学生1 200人,占比百分数均保留整数,下列说法正确的是( )A.高二年级肠胃病学生人数比高一年级的少B.高一年级的各肠胃病区间的学生人数占比都比高二年级的少C.高一年级重度肠胃病学生人数占比比高二年级的少D.高一年级学生的肠胃质量参数比高二年级的高考点二 样本的数字特征1.众数:在样本数据中,出现次数最多的那个数据.2.中位数:在样本数据中,将数据按大小依次排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.3.平均数:样本数据的算术平均数=(x1+x2+…+xn).4.百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.5.方差与标准差方差:s2=[(x1-)2+(x2-)2+…+(xn-)2].标准差:s=.例2 (1)为备战某次运动会,已知某运动员某次特训的成绩分别为4,8,9,3,3,5,7,9,则下列说法错误的是( )A.这组数据的极差为6B.这组数据的众数为3C.这组数据的平均数为6D.这组数据的方差为(2)(2025·绵阳模拟)某家电公司生产了A,B两种不同型号的空调,公司统计了某地区2024年的前6个月这两种型号的空调的销售情况,得到销售量的折线图如图所示,分析这6个月的销售数据,下列说法不正确的是( )A.A型号空调月销售量的极差比B型号空调月销售量的极差大B.A型号空调月平均销售量比B型号空调月平均销售量大C.A型号空调月销售量的上四分位数比B型号空调销售量的上四分位数大D.A型号空调月销售量的方差比B型号空调月销售量的方差小[规律方法] 计算一组n个数据第p百分位数的步骤跟踪演练2 (1)(多选)随机抽取6位影迷对某电影的评分,得到一组样本数据如下:92,93,95,95,97,98,则下列关于该样本的说法中正确的有( )A.平均数为95 B.极差为6C.方差为26 D.第80百分位数为97(2)(多选)如图是我国在第九届到第十七届夏季残奥会(编号分别为9,10,…,17)获得的金牌数和奖牌数的折线图,则( )A.金牌数增长最快的一届是第十二届B.奖牌数增长最快的一届是第十二届C.这9届我国获得的金牌数的中位数为89D.这9届我国获得的奖牌数的第70百分位数为220考点三 频率分布直方图1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率=组距×.2.在频率分布直方图中各小长方形的面积之和为1.例3 (1)(多选)某校对120名学生的数学竞赛成绩进行统计,分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,得到如图所示的频率分布直方图,则下列说法中正确的是( )A.a=0.010B.估计该校学生竞赛成绩的众数为75C.该校学生竞赛成绩的中位数大于80D.估计该校学生竞赛成绩的平均数落在[70,80)内(2)某中学举办电脑知识竞赛,满分为100分,80分以上(含80分)为优秀.现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如图所示,已知图中从左到右的第一、三、四、五小组的频率分别为0.30,0.15,0.10,0.05,而第二小组的频数是40,则参赛的人数是 ,成绩优秀的频率是 . [规律方法] 利用频率分布直方图求众数、中位数与平均数(1)最高的小长方形底边中点的横坐标即众数.(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.跟踪演练3 2005年,康百万庄园被授予国家AAAA级旅游景区.近年来康百万庄园成为越来越多人选的旅游之地,现为更好地提升旅游品质,庄园风景区的工作人员随机选择100名游客对景区进行满意度评分(满分100分),根据评分制成如图所示的频率分布直方图.(1)估计这100名游客对景区满意度评分的平均数;(以区间中点值作为代表)(2)估计这100名游客对景区满意度评分的中位数;(保留两位小数)(3)庄园景区的工作人员采用按比例分配的分层随机抽样的方法从评分在[70,80),[80,90)的两组中抽取6人,再从6人中随机抽取2人进行交流,求抽取的2人评分分别在[70,80)和[80,90)内的概率.专题突破练[分值:80分]一、单项选择题(每小题5分,共30分)1.(2025·萍乡模拟)已知一组数据为:123,117,117,121,122,120,116,114,120,119,则这组数据的75%分位数是( )A.114 B.115 C.120.5 D.1212.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66 67 40 37 14 64 05 71 11 05 6509 95 86 68 76 83 20 37 9057 16 03 11 63 14 90 84 45 21 7573 88 05 90 52 23 59 43 10若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本的编号是( )A.10 B.09 C.71 D.203.(2025·东三省四市教研联合体模拟)为了了解学校质量监测成绩,现随机抽取该校200名学生的成绩作为样本进行分析,并绘制频率分布直方图,若该频率分布直方图的组距为10,且样本中成绩在区间[92.5,102.5)这一组内的学生有40人,则在频率分布直方图中该组数据对应的矩形高度为( )A.0.02 B.0.2 C.0.04 D.0.44.(2025·安康联考)有一组样本数据x1,x2,…,xn,其平均数为方差为若样本数据-x1+1,-x2+1,…,-xn+1的平均数为方差为则( )A.=-1 B.=C.= D.>5.小亮记录了自己一周内每天校外锻炼的时间(单位:分),并制作了如图所示的统计图.根据统计图,下列关于小亮该周每天校外锻炼时间的描述,正确的是( )A.平均数为70分钟 B.众数为67分钟C.中位数为67分钟 D.方差为06.在如图所示的两种分布形态中,下列说法正确的是( )A.图(1)中的中位数大于平均数B.图(1)中的众数大于平均数C.图(2)中的众数小于中位数D.图(2)中的中位数大于平均数二、多项选择题(每小题6分,共12分)7.(2025·江苏新高考基地联考)赋分是根据考生原始分数在全体考生中的排名比例进行转化的,在一次模拟考试中,某班5名同学的地理科目的原始分与赋分如表.学号 1 2 3 4 5原始分 93 85 78 52 x赋分 100 96 92 70 82记这5名同学在这次模拟考试中的地理科目的原始分为数据甲,赋分为数据乙,则( )A.甲的平均数小于乙的平均数B.甲的中位数小于乙的中位数C.甲的极差小于乙的极差D.甲的方差小于乙的方差8.(2025·攀枝花模拟)某校高三年级共有1 000名学生,为了解学生的身体发育情况,随机抽取了100名学生的体重数据,将数据整理得到如图所示的频率分布直方图,则( )A.a=0.04B.样本的众数估计值为55C.样本的第75百分位数约为61.25D.该校高三年级学生中体重高于65千克的学生大约为200人三、填空题(每小题5分,共10分)9.(2025·湖南名校联合体模拟)高三某班第一组学生的数学期末考试成绩分别为138,130,120,122,120,130,110,130,则该组成绩的中位数与平均数之差的绝对值为 . 10.某校采用按比例分配的分层随机抽样采集了高一年级学生的身高情况,部分统计数据如下:性别 样本量 样本平均数 样本方差男 100 170 22女 100 160 38则估计该校高一年级的全体学生的身高的平均数为 ,方差为 . 四、解答题(共28分)11.(13分)2025年4月24日,神舟二十号载人飞船在长征二号F遥二十运载火箭的托举下,成功发射升空.为发扬并传承中国航天精神,我市随机抽取600名学生进行航天知识竞赛并记录学生的成绩(满分100分),将学生的成绩整理后分成五组,从左到右依次记为[50,60),[60,70),[70,80),[80,90),[90,100],并绘制成如图所示的频率分布直方图.(1)求n的值;(4分)(2)求第70百分位数;(4分)(3)求这600名学生成绩的平均数(同一组数据用该组区间的中点值作代表).(5分)12.(15分)移动端的美颜拍摄类APP主要有两类:A类是以自拍人像、美颜美妆为核心功能的APP;B类是图片编辑、精修等图片美化类APP.某机构为调查市民对上述A,B两类APP的使用情况,随机调查了部分市民.已知被调查的市民中使用过A类APP的占60%,使用过B类APP的占50%,设个人对美颜拍摄类APP类型的选择及各人的选择之间相互独立.(1)从样本人群中任选1人,求该人使用过美颜拍摄类APP的概率;(4分)(2)从样本人群中任选5人,记X为5人中使用过美颜拍摄类APP的人数,设X的数学期望为E(X),求P(X=E(X));(5分)(3)在单独使用过A,B两类APP的样本人群中,按类型分甲、乙两组,并在各组中随机抽取8人,甲组对A类APP,乙组对B类APP分别评分如下:甲组评分 94 86 92 96 87 93 90 82乙组评分 85 83 85 91 75 90 83 80记甲、乙两组评分的平均数分别为标准差分别为s1,s2,试判断哪组评价更合理.(设Vi=(i=1,2),Vi越小,则认为对应组评价更合理)(6分)参考数据:≈0.439≈0.482. 展开更多...... 收起↑ 资源列表 专题四 第4讲 统 计.docx 专题四 第4讲 统 计无答案.docx