资源简介 单元检测卷(九) 统计与成对数据的统计分析分值:150分一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.[2025·连云港模拟]已知小明参加某项比赛,8位评委给出的分数为:13,14,15,18,18,21,22,23,按照比赛规则,现去掉一个最高分和一个最低分,则这组分数发生变化的是( )A.平均数 B.中位数C.极差 D.众数2.[2025·长沙模拟]已知某地区中小学生人数和近视情况分别如图(1)和图(2)所示,为了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则在抽取的高中生中,近视人数约为( )A.1 000 B.40C.27 D.203.[2025·武汉模拟]如图所示,下列频率分布直方图显示了三种不同的形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图做出以下判断,不正确的是( )A.图(1)的平均数=中位数=众数 B.图(2)的众数<中位数<平均数C.图(2)的平均数<众数<中位数 D.图(3)的平均数<中位数<众数4.[2024·六安模拟]某学校一同学研究温差x(℃)与本校当天新增感冒人数y(人)的关系,该同学记录了5天的数据(如表),经过拟合,发现基本符合经验回归方程=2.6x+,则下列结论错误的是( )x 5 6 8 9 12y 17 20 25 28 35A.样本点中心为(8,25)B.=4.2C.x=5时,残差为-0.2D.若去掉样本点(8,25),则样本的相关系数r增大5.[2024·山东省实验中学模拟]某调查机构抽取了部分关注济南地铁建设的市民作为样本,分析其年龄和性别结构,并制作出如图等高条形图.根据图中(35岁以上含35岁)的信息,关于该样本的结论不一定正确的是( )A.男性比女性更关注地铁建设B.关注地铁建设的女性多数是35岁以上C.35岁以下的男性人数比35岁以上的女性人数多D.35岁以上的人对地铁建设关注度更高6.[2025·成都模拟]甲、乙两名运动员在一次射击训练中各射靶20次,命中环数的频率分布条形图如图.设甲、乙命中环数的众数分别为Z甲,Z乙,方差分别为s,s,则( )A.Z甲=Z乙,s>sB.Z甲=Z乙,sC.Z甲>Z乙,s>sD.Z甲s7.[2025·盐城模拟]根据分类变量Ⅰ与Ⅱ的统计数据,计算得到χ2=2.954,则( )α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828A.变量Ⅰ与Ⅱ相关B.变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1C.变量Ⅰ与Ⅱ不相关D.变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.18.[2024·广州模拟]为调查某地区中学生每天睡眠时间,采用样本量按比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1 200人,其每天睡眠时间均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为( )A.0.96 B.0.94C.0.79 D.0.75二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的四个选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.9.[2025·粤湘赣冀四省联考]某部门30名员工一年中请假天数(未请假则请假天数为0)与对应人数的柱形图(图中只有请假天数为0的未显示)如图所示,则( )A.该部门一年中请假天数为0的人数为10B.该部门一年中请假天数大于5的人数为10C.这30名员工一年中请假天数的第40百分位数为4D.这30名员工一年中请假天数的平均数小于410.[2025·开封模拟]为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如图所示频率分布直方图:根据此频率分布直方图,下列结论中正确的是( )A.该地农户家庭年收入的极差为12B.估计该地农户家庭年收入的75%分位数为9C.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间D.估计该地农户家庭年收入的平均值超过6.5万元11.[2025·南平模拟]某地医院出现较多的支原体肺炎感染患者,患者多以儿童为主.某研究所在某小学随机抽取了46名儿童,得到他们是否接种流感疫苗和是否感染支原体肺炎的情况的相关数据,如表所示,则( )感染支原体肺炎 未感染支原体肺炎 合计接种流感疫苗 a=12 b a+b未接种流感疫苗 c d=13 c+d合计 a+c b+d=28 46附:χ2=,n=a+b+c+d.α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828A.>B.χ2>2.706C.认为是否接种流感疫苗与是否感染支原体肺炎有关联,此推断犯错的概率不大于0.1D.没有充分的证据推断是否接种流感疫苗与是否感染支原体肺炎有关联三、填空题:本题共3小题,每小题5分,共15分.12.[2025·太原模拟]某农业科研所在5块面积相同的长方形试验田中均种植了同一种农作物,每一块试验田的施肥量x(单位:kg)与产量y(单位:kg)之间有如下关系:施肥量x/kg 20 40 50 60 80产量y/kg 600 800 1 200 1 000 1 400已知y与x满足经验回归方程=13x+,则当施肥量为80 kg时,残差为________ kg.13.(2025·上海金山区模拟)为了考察某种药物预防疾病的效果,进行动物试验,得到列联表:药物 疾病 合计未患病 患病服用 m 50-m 50未服用 80-m m-30 50合计 80 20 100根据小概率值α=0.05的独立性检验,若本次考察结果支持“药物对疾病预防有显著效果”,则m(m≥40,m∈N)的最小值为________.(参考公式:χ2=);参考值:P(χ2≥3.841)≈0.05)14.[2025·广州模拟]某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与心率f(单位:次/分钟)的对应数据(Wi,fi)(i=1,2,…,8).根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=ln Wi,yi=ln fi,计算得=8,=5,y=214.由最小二乘法得经验回归方程为=x+7.4,则k的值为________;为判断拟合效果,通过经验回归方程求得预测值i(i=1,2,…,8),若残差平方和 (yi-i)2≈0.28,则决定系数R2≈________.(参考公式:决定系数R2=1-)四、解答题:本题共5小题,共77分,解答应写出文字说明、证明过程或演算步骤.15.(13分)[2025·九江模拟]车胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎胎面磨损.某实验室通过实验测得轿车行驶里程与某品牌轮胎凹槽深度的数据,如表所示:行驶里程x/万km 0.0 0.4 1.0 1.6 2.4 2.8 3.4 4.4轮胎凹槽深度h/mm 8.0 7.8 7.2 6.2 5.6 4.8 4.4 4.0xihi=79.68, (xi-)2=16.24,≈16.56.(1)求该品牌轮胎凹槽深度h与行驶里程x的相关系数r,并判断二者之间是否具有很强的线性相关性;(结果保留两位有效数字)(2)根据我国国家标准规定:轿车轮胎凹槽安全深度为1.6 mm(当凹槽深度低于1.6 mm时刹车距离增大,驾驶风险增加,必须更换新轮胎).某人在保养汽车时将小轿车的轮胎全部更换成了该品牌的新轮胎,请问在正常行驶情况下,更换新轮胎后继续行驶约多少公里需对轮胎再次更换?附:变量x与y的样本相关系数r=;对于一组数据(x1,y1),(x2,y2),……,(xn,yn),其线性回归方程=x+的斜率和截距的最小二乘估计分别为:=,=-.16.(15分)[2025·武汉模拟]热干面是湖北武汉最出名的小吃之一.某热干面店铺连续10天的销售情况如表(单位:份):天数 1 2 3 4 5 6 7 8 9 10套餐一 120 100 140 140 120 70 150 120 110 130套餐二 80 90 90 60 50 90 70 80 90 100(1)分别求套餐一、套餐二的均值、方差,并判断两种套餐销售的稳定情况;顾客性别 套餐类别 合计套餐一 套餐二男顾客 400女顾客 500合计(2)假定在连续10天中每位顾客只购买了一份,根据图表内容填写下列2×2列联表,依据小概率值α=0.05的独立性检验,分析顾客性别与套餐选择是否有关?附:χ2=α 0.10 0.05 0.025 0.010xα 2.706 3.841 5.024 6.63517.(15分)[2024·泉州模拟]中国茶文化博大精深,饮茶深受大众喜爱.茶水的口感与茶叶类型和水的温度有关.某数学建模小组为了获得茶水温度y(单位:℃)关于时间x(单位:min)的回归方程模型,通过实验收集在25 ℃室温,用同一温度的水冲泡的条件下,茶水温度随时间变化的数据,并对数据做初步处理得到如图所示散点图以及如表所示数据.(xi-)(yi-) (xi-)(wi-)73.5 3.85 -95 -2.24其中:wi=ln(yi-25),=wi.(1)根据散点图判断,①y=a+bx与②y=d·cx+25哪一个更适宜作为该茶水温度y关于时间x的经验回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立该茶水温度y关于时间x的经验回归方程;(3)已知该茶水温度降至60 ℃口感最佳,根据(2)中的经验回归方程,求在相同条件下冲泡的茶水,大约需要放置多长时间才能达到最佳饮用口感.附:①对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+的斜率和截距的最小二乘估计分别为=,=-;②参考数据:e-0.08≈0.92,e4.09≈60,ln 7≈1.9,ln 3≈1.1,ln 2≈0.7.18.(17分)[2025·宁波模拟]在现实生活中,每个人都有一定的心理压力,压力随着现代生活节奏的加快、社会竞争日趋激烈等逐渐增大.某市研究组为了解该市市民压力的情况,随机邀请本市200名市民进行心理压力测试评估,得到一个压力分值,绘制如图样本数据频率分布直方图.(1)求a的值,并估计该市市民压力分值位于区间[70,100]的概率;(2)估计该市市民压力分值的平均值;(同一组数据用该区间的中点值作代表)(3)若市民的压力分值不低于70,则称为“高压市民”.研究组对“高压市民”按年龄段进行研究,发现年龄在30岁到50岁的“高压市民”有35人,年龄在30岁到50岁的“非高压市民”有25人,剩余“高压市民”的年龄分散在其它年龄段.为研究方便,记年龄在30岁到50岁为年龄段A,其余为年龄段B.根据所给数据,完成下面的2×2列联表,并试根据小概率值α=0.001的独立性检验,分析该市“高压市民”与其年龄在30岁到50岁是否有关.年龄段 压力市民 合计高压市民 非高压市民年龄段A年龄段B合计注:χ2= α 0.050 0.010 0.001xα 3.841 6.635 10.82819.(17分)[2025·郑州模拟]PM 2.5是指环境空气中直径小于或等于2.5微米的颗粒物.它能较长时间悬浮于空气中,其在空气中含量越高,说明空气污染越严重.城市中的PM 2.5成分除扬尘等自然因素外,燃料的燃烧也是一个重要来源.某市环境检测部门为检测燃油车流量对空气质量的影响,在一个检测点统计每日过往的燃油车流量x(单位:辆)和空气中的PM 2.5的平均浓度y(单位:μg/m3).检测人员采集了50天的数据,制成2×2列联表(部分数据缺失):PM2.5的平均浓度 燃油车日流量 合计燃油车日流量x<1 500 燃油车日流量x≥1 500PM 2.5的平均浓度y<100 16 24PM 2.5的平均浓度y≥100 20合计 22(1)完成上面的2×2列联表,并根据小概率值α=0.005的独立性检验,能否认为PM 2.5的平均浓度小于100μg/m3与燃油车日流量小于1 500辆有关联?(2)经计算得y与x之间的经验回归方程为=0.12x-73.86,且这50天的燃油车的日流量x的标准差sx=249,PM 2.5的平均浓度y的标准差sy=36.若相关系数r满足|r|≥0.75,则判定所求经验回归方程有价值;否则判定其无价值.①判断该经验回归方程是否有价值;②若这50天的燃油车的日流量x满足x=1.23×108,试求这50天的PM2.5的平均浓度y的平均数 (利用四舍五入法精确到0.1).参考公式:χ2=,其中n=a+b+c+d.α 0.01 0.005 0.001xα 6.636 7.879 10.828经验回归方程=+x,其中==,=-;相关系数r=.参考数据:×1.23=0.024 6,2492=62 001,≈1 548.55.单元检测卷(九) 统计与成对数据的统计分析1.C [原来的平均数为=18,中位数为18,极差为23-13=10,众数为18,去掉一个最高分和一个最低分后,平均数为=18,中位数为18,极差为22-14=8,众数为18,所以这组分数发生变化的是极差.故选C.]2.D [由题图(1)知高中生的总人数为2 000,所以应抽取的高中生为2 000×2%=40人,抽取的高中生中,近视人数约为40×50%=20,故选D.]3.C [图(1)的分布直方图是对称的,所以平均数=中位数=众数,故A正确;图(2)中众数最小,右拖尾平均数大于中位数,故B正确,C错误;图(3)左拖尾众数最大,平均数小于中位数,故D正确.故选C.]4.D [对于A项,因为==8,==25,所以样本点中心为(8,25),故A项正确;对于B项,由回归直线必过样本点中心可得:25=2.6×8+,解得=4.2,故B项正确;对于C项,由B项知,=2.6x+4.2,令x=5,则=2.6×5+4.2=17.2,所以残差为17-17.2=-0.2,故C项正确;对于D项,由相关系数公式可知,去掉样本点(8,25)后,x与y的样本相关系数r不变,故D项错误.故选D.]5.C [对于A:由题中左图知,样本中关注地铁建设的男性数量多于女性数量,从而男性比女性更关注地铁建设,故A正确;对于B:由题中右图知女性中35岁以上的占多数,从而样本中多数女性是35岁以上,从而得到关注地铁建设的女性多数是35岁以上,故B正确;对于C:由题中左图知男性人数大于女性人数,由题中右图知35岁以下的男性占男性人数比35岁以上的女性占女性人数的比例少,无法判断35岁以下的男性人数与35岁以上的女性人数的多少,故C不一定正确;对于D:由题中右图知样本中35岁以上的人对地铁建设关注度更高,故D正确.故选C.]6.A [根据图表知,甲、乙命中环数的众数均为7环,则Z甲=Z乙;甲运动员命中的环数比较分散,乙运动员命中的环数比较集中,则s>s.故选A.]7.B [零假设为H0:变量Ⅰ与Ⅱ不相关,因为χ2=2.954>2.706,依据α=0.1得独立性检验可知,推断H0不成立,即认为变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1,故选B.]8.B [初中生人数m=800,每天睡眠时间的平均数=9,方差s=1;高中生人数n=1 200,每天睡眠时间的平均数=8,方差s=0.5.总的样本平均数a==8.4,总的样本方差s2==0.94,故选B.]9.ACD [该部门一年中请假天数为0的人数为30-6-3-4-4-3=10,A正确.该部门一年中请假天数大于5的人数为4+4+3=11,B错误.因为30×40%=12,且请假天数为0的人数为10,请假天数为4的人数为6,所以这30名员工一年中请假天数的第40百分位数为4,C正确.这30名员工一年中请假天数的平均数为×(4×6+5×3+6×4+7×4+8×3)=<4,D正确.]10.BCD [设极差为t,由题中频率分布直方图可知,组距为1,共有12组,所以t≤1×12=12,且不是一定取等号,所以A不正确;前6组频率之和为0.02+0.04+0.1+0.14+0.2+0.2=0.7,前7组频率之和为0.7+0.1=0.8,所以75%分位数应位于[8.5,9.5)内,由8.5+1×=9,可以估计75%分位数为9,所以B正确;家庭年收入介于4.5万元至8.5万元之间的频率为0.1+0.14+0.2+0.2=0.64>0.5,所以C正确;由题中频率分布直方图可知,该地农户家庭年收入的平均值为3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+(12+13+14)×0.02=7.68(万元),又7.68>6.5,所以D正确.综上,选BCD.]11.AD [由表中数据易得a=12,b=15,c=6,d=13,a+b=27,c+d=19,a+c=18,b+d=28,对于A,=>=.故A正确;对于B,χ2=≈0.775<2.706=x0.1,故B错误;对于C,D,依据α=0.1的独立性检验,没有充分的证据推断是否接种流感疫苗与是否感染支原体肺炎有关联,故C错误,D正确.故选AD.]12.10 [由题意得==50,==1 000,所以1 000=13×50+,解得=350,所以=13x+350,则当x=80时,=13×80+350=1 390,残差为1 400-1 390=10 kg.]13.44 [由题意可知χ2=≥3.841,则(100m-4 000)2≥502×42×3.841,解得m≥43.92或m≤36.08,而m≥40,m∈N,故m的最小值为44.]14.-0.3 0.98 [(1)将=8,=5代入经验回归方程=x+7.4,得5=8 +7.4,解得=-0.3,所以k=-0.3.(2) (yi-)2=(y1-)2+(y2-)2+…+(y8-)2=y+y+…+y-2 (y1+y2+…+y8)+82=y+y+…+y-2·8+82=y-82,所以R2=1-=1-≈1-=0.98.]15.解 (1)计算得=(0.4+1+1.6+2.4+2.8+3.4+4.4)=2,=(8+7.8+7.2+6.2+5.6+4.8+4.4+4)=6,由公式知,r==≈≈-0.99,∴二者之间具有很强的线性关系.(2)设轮胎凹槽深度h与行驶里程x的经验回归方程为=+x,则===-≈-1,a=-=6+1×2=8.∴经验回归方程为=8-x,令=1.6,得x=6.4.即更换新轮胎后继续行驶约6.4万公里需要对轮胎再次更换.16.解 (1)套餐一:均值为120+=120,方差为(0+400+400+400+0+2500+900+0+100+100)=480;套餐二:均值为80+=80,方差为(0+100+100+400+900+100+100+0+100+400)=220.因为220<480,所以套餐二销量相对稳定.(2)列联表如下:顾客性别 套餐类别 合计套餐一 套餐二男顾客 400 300 700女顾客 800 500 1 300合计 1 200 800 2 000零假设为H0:顾客性别与套餐选择无关,根据列联表中的数据,计算可得χ2==≈3.663<3.841=x0.05,根据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为顾客性别与套餐选择无关.17.解 (1)由散点图知,更适宜的经验回归方程类型为②y=d·cx+25.(2)由y=d·cx+25,可得y-25=d·cx,对等式两边取自然对数,得ln(y-25)=ln d+x·ln c,令w=ln(y-25),则w=ln d+x·ln c,计算,得=xi=3, (xi-)2=28,结合题表中数据,可得ln c===-0.08,结合参考数据可得c=e-0.08≈0.92,由ln d=-·ln c,得ln d=4.09,结合参考数据可得d=e4.09≈60,所以该茶水温度y关于时间x的经验回归方程为=60·0.92x+25.(3)在25 ℃室温下,茶水温度降至60 ℃口感最佳,由60=60·0.92x+25,得0.92x==,对等式两边取自然对数,得x·ln 0.92=ln =ln 7-2ln 2-ln 3≈-0.6,则x≈==7.5,所以在相同条件下,刚泡好的茶水大约需要放置7.5 min才能达到最佳饮用口感.18.解 (1)依题意,0.04+0.02+0.05+0.10+10a+0.16+0.15+0.18+10a+0.04=1,解得a=0.013.记“该市市民的压力分值在区间[70,100]”为事件C,则P(C)=(0.018+0.013+0.004)×10=0.35.故所求的概率为0.35.(2)由频率分布直方图及(1)知,压力分值在各分组区间内的频率依次为:0.04,0.02,0.05,0.10,0.13,0.16,0.15,0.18,0.13,0.04,所以=5×0.04+15×0.02+25×0.05+35×0.1+45×0.13+55×0.16+65×0.15+75×0.18+85×0.13+95×0.04=58.所以估计该市民压力分值的平均值为58.(3)由(1)知,高压市民有200×0.35=70人,年龄段A的人数有35人,年龄段B的人数为35人,所以2×2列联表为:年龄段 压力市民 合计高压市民 非高压市民年龄段A 35 25 60年龄段B 35 105 140合计 70 130 200零假设为H0:该市“高压市民”与其年龄在30岁到50岁无关.根据列联表中的数据经计算得到χ2==≈20.51>10.828=x0.001,根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为该市“高压市民”与其年龄在30岁到50岁有关,此推断犯错误的概率不大于0.001.19.解 (1)2×2列联表如下:PM2.5的平均浓度 燃油车日流量 合计燃油车日流量x<1 500 燃油车日流量x≥1 500PM 2.5的平均浓度y<100 16 8 24PM 2.5的平均浓度y≥100 6 20 26合计 22 28 50零假设H0:PM 2.5的平均浓度小于100 μg/m3与燃油车日流量小于1 500辆无关联.根据列联表中的数据,计算得χ2=≈9.624>7.879=x0.005,所以根据小概率值α=0.005的独立性检验,推断H0不成立,所以可以认为PM 2.5的平均浓度小于100 μg/m3与燃油车日流量小于1 500辆有关联,此推断犯错误的概率不大于0.005.(2)①由题意,得==0.12,得 (xi-)(yi-)=0.12 (xi-)2,由sx==249,sy==36,得r===0.12×=0.12×=0.83>0.75,所以该经验回归方程有价值.②因为sx==249,即=249,所以=≈1 548.55,又=0.12-73.86≈0.12×1 548.55-73.86=111.966≈112.0.故可推算出这50天PM 2.5平均浓度y的平均数约为112.0. 展开更多...... 收起↑ 资源预览