资源简介 第05讲 第九章 统计与成对数据的统计分析(综合测试)一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1.(2022·全国·高一课时练习)“中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )A.通过调查获取数据 B.通过试验获取数据 C.通过观察获取数据 D.通过查询获得数据【答案】C【详解】“中国天眼”主要是通过观察获取数据.故选:C.2.(2022·黑龙江·大庆市东风中学高一期末)嫦娥五号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第5个个体的编号为( )45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 2932 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81A.23 B.20 C.15 D.12【答案】C【详解】根据随机数表法可得选出的个体编号依次为:12,02,01,04,15,第5个个体编号为15,故选:C.3.(2022·全国·高一单元测试)电影《长津湖之水门桥》于2022年2月1日上映.某新闻机构想了解市民对《长津湖之水门桥》的评价,决定从某市3个区按人口数用分层随机抽样的方法抽取一个样本.若3个区人口数之比为2:3:5,且人口最多的一个区抽出了100人,则这个样本的容量为( ).A.100 B.160 C.200 D.240【答案】C【详解】解:由3个区人口数之比为2:3:5,得第三个区所抽取的人数最多,所占比例为50%.又因为此区抽取了100人,所以3个区所抽取的总人数为100÷50%=200,即这个样本的容量为200.故选: C.4.(2022·重庆·高二阶段练习)下表是某饮料专卖店一天卖出奶茶的杯数与当天气温(单位:)的对比表,已知表中数据计算得到关于的线性回归方程为,则据此模型预计时卖出奶茶的杯数为( )气温 5 10 15 20 25杯数 26 20 16 14 14A.4 B.5 C.6 D.7【答案】C【详解】由题可知,,由,可得,则则据此模型预计时卖出奶茶的杯数为6.故选:C5.(2022·福建·莆田一中高二期末)某高中调查学生对2022年冬奥会的关注是否与性别有关,随机抽样调查150人,进行独立性检验,经计算得,临界值表如下:0.15 0.10 0.05 0.025 0.0102.072 2.076 3.841 5.024 6.635则下列说法中正确的是:( )A.有97.5%的把握认为“学生对2022年冬奥会的关注与性别无关”B.有99%的把握认为“学生对2022 年冬奥会的关注与性别有关”C.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别有关”D.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别无关”【答案】C【详解】由题意可知,,所以在犯错误的概率不超过的前提下可认为“学生对2022 年冬奥会的关注与性别有关”.故选:C.6.(2022·广西河池·高二期末(文))一只红铃虫的产卵数y和温度x有关,现收集了6组观测数据,y(单位:个)与温度x(单位:℃)得到样本数据(,2,3,4,5,6),令,并将绘制成如图所示的散点图.若用方程对y与x的关系进行拟合,则( )A., B.,C., D.,【答案】A【详解】因为,令,则z与x的回归方程为.根据散点图可知z与x正相关,所以.由回归直线图象可知:回归直线的纵截距大于0,即,所以,故选:A.7.(2022·全国·高一单元测试)2022年国务院《政府工作报告》中指出,有序推进碳达峰碳中和工作,落实碳达峰行动方案.汽车行业是碳排放量比较大的行业之一,某检测单位对甲 乙两类MI型品牌的新车各抽取了5辆进行排放量检测,记录如下(单位:g/km),则甲 乙两品牌汽车的排放量稳定性更好的是( )甲 80 110 120 140 150乙 100 120 100 120 160A.甲 B.乙 C.甲 乙相同 D.无法确定【答案】B【详解】甲类品牌汽车的排放量的平均值,甲类品牌汽车的,排放量的方差.乙类品牌汽车的排放量的平均值,乙类品牌汽车的排放量的方差,所以.故选:B.8.(2022·全国·高一单元测试)期末考试后,高二某班50名学生物理成绩的平均分为85,方差为8.2,则下列四个数中不可能是该班物理成绩的是( )A.60 B.78 C.85 D.100【答案】A【详解】根据题意,平均数,方差,所以,若存在,则,则方差必然大于8.2,不符合题意,所以60不可能是所有成绩中的一个数据.又,,.故B,C,D错误.故选:A.二、多选题(本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.)9.(2022·福建南平·高一期末)关于用统计方法获取数据,分析数据,下列结论正确的是( )A.某食品加工企业为了解生产的产品是否合格,合理的调查方式为抽样调查B.为了解高一学生的视力情况,现有高一男生人,女生人,按性别进行分层抽样,样本量按比例分配,若从女生中抽取的样本量为,则样本容量为C.若甲、乙两组数据的标准差满足,则可以估计乙比甲更稳定D.若数据的平均数为,则数据的平均数为【答案】ABD【详解】对于A:了解生产的产品是否合格,合理的调查方式为抽样调查,故A正确;对于B,根据分层抽样的抽样比可知样本容量为,故B对对于C:因为,所以甲的数据更稳定,故C错误,对于D:根据平均数的性质:的平均数为,故D 对故选:ABD10.(2022·全国·高一单元测试)下图是甲、乙两个工厂的轮胎宽度的雷达图(虚线代表甲,实线代表乙).根据图中的信息,下列说法正确的是( )A.甲厂轮胎宽度的平均数大于乙厂轮胎宽度的平均数B.甲厂轮胎宽度的众数大于乙厂轮胎宽度的众数C.甲厂轮胎宽度的中位数与乙厂轮胎宽度的中位数相同D.甲厂轮胎宽度的极差小于乙厂轮胎宽度的极差【答案】ACD【详解】甲厂轮胎宽度分别为194, 194,194,195,196, 197,乙厂轮胎宽度分别为191, 193,194,195,195,196,甲厂轮胎宽度平均数为,乙厂轮胎宽度平均数为,,故A正确;甲厂轮胎宽度的众数是194,乙厂轮胎宽度的众数是195,,故B错误;甲厂轮胎宽度的中位数为,乙厂轮胎宽度的中位数为,故C正确;甲厂轮胎宽度的极差为,乙厂轮胎宽度极差为,,故D正确.故选:ACD.11.(2022·云南省下关第一中学高三开学考试)自2020年初,新型冠状病毒引起的肺炎疫情爆发以来,各地医疗机构采取了各种有针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示,由表格可得y关于x的二次回归方程为,则下列说法正确的是( )周数(x) 1 2 3 4 5治愈人数(y) 2 17 36 93 142A.B.C.此回归模型第4周的残差(实际值与预报值之差)为5D.估计第6周治愈人数为220【答案】BC【详解】解:设,则,由已知得所以,故选项A错误,选项B正确;在中,令,得,所以此回归模型第4周的残差.故选项C正确;在中,令,得,故选项D错误.故选:BC.12.(2022·广东汕头·高二期末)已知由样本数据组成的一个样本,得到回归直线方程为,且,去除两个歧义点和后,得到新的回归直线的斜率为3.则下列说法正确的是( )A.相关变量x,y具有正相关关系B.去除两个歧义点后的回归直线方程为C.去除两个歧义点后,样本(4,8.9)的残差为D.去除两个歧义点后,随x值增加相关变量y值增加速度变小【答案】ABC【详解】对A,因为回归直线的斜率大于0,即相关变量x,y具有正相关关系,故A正确;对B,将代入得,则去掉两个歧义点后,得到新的相关变量的平均值分别为,,此时的回归直线方程为,故B正确;对C,x=4时,,残差为8.9-9=-0.1,故C正确;对D,斜率3>1,此时随x值增加相关变量y值增加速度变大,D错误.故选:ABC.三、填空题:(本题共4小题,每小题5分,共20分,其中第16题第一空2分,第二空3分.)13.(2022·陕西渭南·高一期末)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x 2 4 5 6 8y 30 40 50 60 70根据上表可得线性回归方程,据此估计,当投入15万元广告费时,销售额为_______万元.【答案】120【详解】由上表可知:.得样本点的中心为,代入回归方程,得.所以回归方程为,将代入可得:.故答案为:14.(2022·重庆十八中高二期末)某篮球联赛期间,某一电视台对年龄高于30岁和不高于30岁的人是否喜欢甲队进行调查,对高于30岁的调查了45人,不高于30岁的调查了55人,所得数据绘制成如下列联表:年龄 是否喜欢甲队 合计不喜欢甲队 喜欢甲队高于30岁 45不高于30岁 15 40 55合计 100若工作人员从调查的所有人中任取一人,取到喜欢甲队的人的概率为,依据小概率值的独立性检验,推断年龄与是否喜欢甲队______(填“有”“无”)关联.附:,.0.050 0.010 0.005 0.0013.841 6.635 7.879 10.828【答案】有【详解】由题知,解得所以所以有的把握认为年龄与是否喜欢甲队有关.故答案为:有15.(2022·福建厦门·高一期末)某电池厂有A,B两条生产线制造同一型号可充电电池.现采用样本量比例分配的分层随机抽样,从某天两条生产线上的成品中随机抽取样本,并测量产品可充电次数的均值及方差,结果如下:项目 抽取成品数 样本均值 样本方差A生产线产品 8 210 4B生产线产品 12 200 4则20个产品组成的总样本的方差为_____.【答案】【详解】依题意得,,,解得:,,又,20个产品组成的总样本的方差为28.故答案为:.16.(2022·天津津衡高级中学有限公司高三阶段练习)对正在横行全球的“新冠病毒”,某科研团队研发了一款新药用于治疗,为检验药效,该团队从“新冠”感染者中随机抽取若干名患者,检测发现其中感染了“普通型毒株”、“奥密克戎型毒株”、“其他型毒株”的人数占比为.对他们进行治疗后,统计出该药对“普通型毒株”、“奥密克戎毒株”、“其他型毒株”的有效率分别为、、,那么你预估这款新药对“新冠病毒”的总体有效率是________;若已知这款新药对“新冠病毒”有效,求该药对“奥密克戎毒株”的有效率是________.【答案】 72%## 25%##【详解】(1)(2)故答案为: 72%; 25%四、解答题(本题共6小题,共70分,其中第17题10分,其它每题12分,解答应写出文字说明 证明过程或演算步骤.)17.(2022·全国·高一课时练习)某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h)可以把这批电子元件分成六组.由于工作中不慎将部分数据丢失,现有以下部分图表:分组频数 30 20频率 0.2 0.4(1)求图2中A的值;(2)补全图2频率分布直方图,并求图2中阴影部分的面积;(3)为了某次展销会,用分层抽样的方法在寿命位于内的产品中抽取5个作为样本,那么在内应抽取多少个?【答案】(1)(2)频率分布直方图见解析,阴影部分的面积为(3)4个(1)由题意可知,所以.(2)补全后的频率分布直方图如图所示,阴影部分的面积为.(3)由分层抽样的性质,知在内应抽取(个).18.(2022·全国·高一单元测试)在①样本容量为190,②抽取的高一学生人数为36这两个条件中任选一个,补充在下面问题中,并解答问题.某校为了解学生课外阅读情况,将每周阅读时间超过10小时的学生称为“阅读者”,在“阅读者”中按年级用分层随机抽样的方法抽取部分学生进行问卷调查.已知该校高一、高二、高三的学生人数和“阅读者”情况分别如图(1)和图(2)所示,且______.(1)求抽取的“阅读者”中高三学生的人数;(2)为了深入了解高三学生阅读情况,利用随机数表法抽取样本时,先对被抽取的高三“阅读者”按01,02,03,…进行编号,然后从随机数表第8行第5列的数字开始从左向右读,依次抽取5个编号,写出被选出的5个学生的编号.(注:如下为随机数表的第8行至第11行)63 01 63 78 59 16 95 59 4719 98 50 71 75 12 86 73 5833 21 12 34 29 78 64 56 0782 52 07 44 38 15 51 00 13注:如果选择多个条件分别解答,按第一个解答计分.【答案】(1)条件选择见解析,高三学生的人数为(2)依次选出的编号是63,78,59,16,47(1)由题图知,该校“阅读者”中,高一、高二、高三学生人数分别为,,.选①,因为样本容量为190,所以抽取的“阅读者”中高三学生的人数为.选②,因为抽取的高一学生人数为36,所以抽取的“阅读者”中高三学生的人数为.(2)根据题意,从随机数表第8行第5列的数字开始从左向右读,依次选出的编号是63,78,59,16,47.19.(2022·河南信阳·高二期末(文))随着人们生活水平的提高,国家倡导绿色安全消费,菜篮子工程从数量保障型转向质量效益型.为了测试甲、乙两种不同有机肥料的使用效果,某科研单位用西红柿做了对比实验,分别在两片实验区各摘取100个,对其质量的某项指标值进行检测,质量指数值达到35及以上的为“质量优等”,由测量结果绘成如下频率分布直方图,其中质量指数值分组区间是:,,,,.(1)分别求甲片实验区西红柿的质量指数的平均值和中位数,并从统计学的角度说明平均值、中位数哪一个更能代表甲片实验区西红柿的质量指数;(2)请根据题中信息完成下面的列联表,并判断是否有99.9%的把握认为“质量优等”与使用不同的肥料有关;甲有机肥料 乙有机肥料 合计质量优等质量非优等合计.0.100 0.050 0.010 0.005 0.0012.706 3.841 6.635 7.879 10.828【答案】(1)平均值为,中位数为35.91,中位数更能代表甲片实验区西红柿的质量指数;(2)表格见解析,有99.9%的把握认为,“质量优等”与使用不同的肥料有关(1)解:甲片实验区西红柿的质量指数的平均值为,设甲片实验区西红柿的质量指数的中位数为x,则,所以,故甲片实验区西红柿的质量指数的中位数为35.91,从统计学的角度中位数更能代表甲片实验区西红柿的质量指数.(2)由题意可得列联表为甲有机肥料 乙有机肥料 合计质量优等 60 30 90质量非优等 40 70 110合计 100 100 200,因为,所以有99.9%的把握认为,“质量优等”与使用不同的肥料有关.20.(2022·陕西·宝鸡市金台区教育体育局教研室高二期末(理))如图是某采矿厂的污水排放量单位:吨与矿产品年产量单位:吨的折线图:(1)依据折线图计算相关系数精确到,并据此判断是否可用线性回归模型拟合y与x的关系?若,则线性相关程度很高,可用线性回归模型拟合(2)若可用线性回归模型拟合与的关系,请建立关于的线性回归方程,并预测年产量为10吨时的污水排放量.相关公式:,参考数据:.回归方程中,【答案】(1)相关系数,可用线性回归模型拟合y与x的关系(2),吨(1)由折线图得如下数据计算得:,,,所以相关系数,因为,所以可用线性回归模型拟合y与x的关系(2),所以回归方程为,当时,,所以预测年产量为10吨时的污水排放量为吨21.(2022·全国·高一单元测试)2022年“中国航天日”线上启动仪式在4月24日上午举行,为普及航天知识,某校开展了“航天知识竞赛”活动,现从参加该竞赛的学生中随机抽取了60名,统计他们的成绩(满分100分),其中成绩不低于80分的学生被评为“航天达人”,将数据整理后绘制成如图所示的频率分布直方图.(1)若该中学参加这次竞赛的共有2000名学生,试估计全校这次竞赛中“航天达人”的人数;(2)估计参加这次竞赛的学生成绩的80%分位数;(3)若在抽取的60名学生中,利用分层随机抽样的方法从成绩不低于70分的学生中随机抽取6人,则从成绩在[70,80),[80,90),[90,100]内的学生中分别抽取了多少人?【答案】(1)600人;(2)85;(3)3人,2人,1人.(1)由频率分布直方图可知,成绩在[80,100]内的频率为0.020×10+0.010×10=0.3,则估计全校这次竞赛中“航天达人”的人数约为2000×0.3=600人.(2)由频率分布直方图可知,成绩在[40,50)内的频率为0.005×10=0.05,成绩在[50,60)内的频率为0.015×10=0.15,成绩在[60,70)内的频率为0.020×10=0.2,成绩在[70,80)内的频率为0.030×10=0.3,成绩在[80,90)内的频率为0.020×10=0.2,所以成绩在80分以下的学生所占的比例为70%,成绩在90分以下的学生所占的比例为90%,所以成绩的80%分位数一定在[80,90)内,而,因此估计参加这次竞赛的学生成绩的80%分位数约为85.(3)因为,,,所以从成绩在[70,80),[80,90),[90,100]内的学生中分别抽取了3人,2人,1人.22.(2022·宁夏·石嘴山市第三中学模拟预测(文))新型冠状病毒肺炎COVID-19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.下表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.日期代码x 1 2 3 4 5 6 7 8累计确诊人数y . 4 8 16 31 51 71 97 122为了分析该国累计感染人数的变化趋势,小王同学分别用两杆模型:①,②对变量x和y的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差):经过计算得,,,,其中,.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型 并简要说明理由;(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少 附:回归直线的斜率和截距的最小二乘估计公式分别为:,.【答案】(1)选择模型①,理由见解析(2)(3)157(1)选择模型①.理由如下:根据残差图可以看出,模型①的估计值和真实值相对比较接近,模型②的残差相对较大一些,所以模型①的拟合效果相对较好(2)由(1),知y关于x的回归方程为,令,则.由所给数据得:,,.,∴y关于x的回归方程为,(3)将代入上式,得(人),所以预测该地区第9天新型冠状病毒感染确诊的累计人数为157人.第05讲 第九章 统计与成对数据的统计分析(综合测试)一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1.(2022·全国·高一课时练习)“中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )A.通过调查获取数据 B.通过试验获取数据 C.通过观察获取数据 D.通过查询获得数据2.(2022·黑龙江·大庆市东风中学高一期末)嫦娥五号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第5个个体的编号为( )45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 2932 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81A.23 B.20 C.15 D.123.(2022·全国·高一单元测试)电影《长津湖之水门桥》于2022年2月1日上映.某新闻机构想了解市民对《长津湖之水门桥》的评价,决定从某市3个区按人口数用分层随机抽样的方法抽取一个样本.若3个区人口数之比为2:3:5,且人口最多的一个区抽出了100人,则这个样本的容量为( ).A.100 B.160 C.200 D.2404.(2022·重庆·高二阶段练习)下表是某饮料专卖店一天卖出奶茶的杯数与当天气温(单位:)的对比表,已知表中数据计算得到关于的线性回归方程为,则据此模型预计时卖出奶茶的杯数为( )气温 5 10 15 20 25杯数 26 20 16 14 14A.4 B.5 C.6 D.75.(2022·福建·莆田一中高二期末)某高中调查学生对2022年冬奥会的关注是否与性别有关,随机抽样调查150人,进行独立性检验,经计算得,临界值表如下:0.15 0.10 0.05 0.025 0.0102.072 2.076 3.841 5.024 6.635则下列说法中正确的是:( )A.有97.5%的把握认为“学生对2022年冬奥会的关注与性别无关”B.有99%的把握认为“学生对2022 年冬奥会的关注与性别有关”C.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别有关”D.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别无关”6.(2022·广西河池·高二期末(文))一只红铃虫的产卵数y和温度x有关,现收集了6组观测数据,y(单位:个)与温度x(单位:℃)得到样本数据(,2,3,4,5,6),令,并将绘制成如图所示的散点图.若用方程对y与x的关系进行拟合,则( )A., B.,C., D.,7.(2022·全国·高一单元测试)2022年国务院《政府工作报告》中指出,有序推进碳达峰碳中和工作,落实碳达峰行动方案.汽车行业是碳排放量比较大的行业之一,某检测单位对甲 乙两类MI型品牌的新车各抽取了5辆进行排放量检测,记录如下(单位:g/km),则甲 乙两品牌汽车的排放量稳定性更好的是( )甲 80 110 120 140 150乙 100 120 100 120 160A.甲 B.乙 C.甲 乙相同 D.无法确定8.(2022·全国·高一单元测试)期末考试后,高二某班50名学生物理成绩的平均分为85,方差为8.2,则下列四个数中不可能是该班物理成绩的是( )A.60 B.78 C.85 D.100二、多选题(本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.)9.(2022·福建南平·高一期末)关于用统计方法获取数据,分析数据,下列结论正确的是( )A.某食品加工企业为了解生产的产品是否合格,合理的调查方式为抽样调查B.为了解高一学生的视力情况,现有高一男生人,女生人,按性别进行分层抽样,样本量按比例分配,若从女生中抽取的样本量为,则样本容量为C.若甲、乙两组数据的标准差满足,则可以估计乙比甲更稳定D.若数据的平均数为,则数据的平均数为10.(2022·全国·高一单元测试)下图是甲、乙两个工厂的轮胎宽度的雷达图(虚线代表甲,实线代表乙).根据图中的信息,下列说法正确的是( )A.甲厂轮胎宽度的平均数大于乙厂轮胎宽度的平均数B.甲厂轮胎宽度的众数大于乙厂轮胎宽度的众数C.甲厂轮胎宽度的中位数与乙厂轮胎宽度的中位数相同D.甲厂轮胎宽度的极差小于乙厂轮胎宽度的极差11.(2022·云南省下关第一中学高三开学考试)自2020年初,新型冠状病毒引起的肺炎疫情爆发以来,各地医疗机构采取了各种有针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示,由表格可得y关于x的二次回归方程为,则下列说法正确的是( )周数(x) 1 2 3 4 5治愈人数(y) 2 17 36 93 142A.B.C.此回归模型第4周的残差(实际值与预报值之差)为5D.估计第6周治愈人数为22012.(2022·广东汕头·高二期末)已知由样本数据组成的一个样本,得到回归直线方程为,且,去除两个歧义点和后,得到新的回归直线的斜率为3.则下列说法正确的是( )A.相关变量x,y具有正相关关系B.去除两个歧义点后的回归直线方程为C.去除两个歧义点后,样本(4,8.9)的残差为D.去除两个歧义点后,随x值增加相关变量y值增加速度变小三、填空题:(本题共4小题,每小题5分,共20分,其中第16题第一空2分,第二空3分.)13.(2022·陕西渭南·高一期末)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x 2 4 5 6 8y 30 40 50 60 70根据上表可得线性回归方程,据此估计,当投入15万元广告费时,销售额为_______万元.14.(2022·重庆十八中高二期末)某篮球联赛期间,某一电视台对年龄高于30岁和不高于30岁的人是否喜欢甲队进行调查,对高于30岁的调查了45人,不高于30岁的调查了55人,所得数据绘制成如下列联表:年龄 是否喜欢甲队 合计不喜欢甲队 喜欢甲队高于30岁 45不高于30岁 15 40 55合计 100若工作人员从调查的所有人中任取一人,取到喜欢甲队的人的概率为,依据小概率值的独立性检验,推断年龄与是否喜欢甲队______(填“有”“无”)关联.附:,.0.050 0.010 0.005 0.0013.841 6.635 7.879 10.82815.(2022·福建厦门·高一期末)某电池厂有A,B两条生产线制造同一型号可充电电池.现采用样本量比例分配的分层随机抽样,从某天两条生产线上的成品中随机抽取样本,并测量产品可充电次数的均值及方差,结果如下:项目 抽取成品数 样本均值 样本方差A生产线产品 8 210 4B生产线产品 12 200 4则20个产品组成的总样本的方差为_____.16.(2022·天津津衡高级中学有限公司高三阶段练习)对正在横行全球的“新冠病毒”,某科研团队研发了一款新药用于治疗,为检验药效,该团队从“新冠”感染者中随机抽取若干名患者,检测发现其中感染了“普通型毒株”、“奥密克戎型毒株”、“其他型毒株”的人数占比为.对他们进行治疗后,统计出该药对“普通型毒株”、“奥密克戎毒株”、“其他型毒株”的有效率分别为、、,那么你预估这款新药对“新冠病毒”的总体有效率是________;若已知这款新药对“新冠病毒”有效,求该药对“奥密克戎毒株”的有效率是________.四、解答题(本题共6小题,共70分,其中第17题10分,其它每题12分,解答应写出文字说明 证明过程或演算步骤.)17.(2022·全国·高一课时练习)某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h)可以把这批电子元件分成六组.由于工作中不慎将部分数据丢失,现有以下部分图表:分组频数 30 20频率 0.2 0.4(1)求图2中A的值;(2)补全图2频率分布直方图,并求图2中阴影部分的面积;(3)为了某次展销会,用分层抽样的方法在寿命位于内的产品中抽取5个作为样本,那么在内应抽取多少个?18.(2022·全国·高一单元测试)在①样本容量为190,②抽取的高一学生人数为36这两个条件中任选一个,补充在下面问题中,并解答问题.某校为了解学生课外阅读情况,将每周阅读时间超过10小时的学生称为“阅读者”,在“阅读者”中按年级用分层随机抽样的方法抽取部分学生进行问卷调查.已知该校高一、高二、高三的学生人数和“阅读者”情况分别如图(1)和图(2)所示,且______.(1)求抽取的“阅读者”中高三学生的人数;(2)为了深入了解高三学生阅读情况,利用随机数表法抽取样本时,先对被抽取的高三“阅读者”按01,02,03,…进行编号,然后从随机数表第8行第5列的数字开始从左向右读,依次抽取5个编号,写出被选出的5个学生的编号.(注:如下为随机数表的第8行至第11行)63 01 63 78 59 16 95 59 4719 98 50 71 75 12 86 73 5833 21 12 34 29 78 64 56 0782 52 07 44 38 15 51 00 13注:如果选择多个条件分别解答,按第一个解答计分.19.(2022·河南信阳·高二期末(文))随着人们生活水平的提高,国家倡导绿色安全消费,菜篮子工程从数量保障型转向质量效益型.为了测试甲、乙两种不同有机肥料的使用效果,某科研单位用西红柿做了对比实验,分别在两片实验区各摘取100个,对其质量的某项指标值进行检测,质量指数值达到35及以上的为“质量优等”,由测量结果绘成如下频率分布直方图,其中质量指数值分组区间是:,,,,.(1)分别求甲片实验区西红柿的质量指数的平均值和中位数,并从统计学的角度说明平均值、中位数哪一个更能代表甲片实验区西红柿的质量指数;(2)请根据题中信息完成下面的列联表,并判断是否有99.9%的把握认为“质量优等”与使用不同的肥料有关;甲有机肥料 乙有机肥料 合计质量优等质量非优等合计.0.100 0.050 0.010 0.005 0.0012.706 3.841 6.635 7.879 10.82820.(2022·陕西·宝鸡市金台区教育体育局教研室高二期末(理))如图是某采矿厂的污水排放量单位:吨与矿产品年产量单位:吨的折线图:(1)依据折线图计算相关系数精确到,并据此判断是否可用线性回归模型拟合y与x的关系?若,则线性相关程度很高,可用线性回归模型拟合(2)若可用线性回归模型拟合与的关系,请建立关于的线性回归方程,并预测年产量为10吨时的污水排放量.相关公式:,参考数据:.回归方程中,21.(2022·全国·高一单元测试)2022年“中国航天日”线上启动仪式在4月24日上午举行,为普及航天知识,某校开展了“航天知识竞赛”活动,现从参加该竞赛的学生中随机抽取了60名,统计他们的成绩(满分100分),其中成绩不低于80分的学生被评为“航天达人”,将数据整理后绘制成如图所示的频率分布直方图.(1)若该中学参加这次竞赛的共有2000名学生,试估计全校这次竞赛中“航天达人”的人数;(2)估计参加这次竞赛的学生成绩的80%分位数;(3)若在抽取的60名学生中,利用分层随机抽样的方法从成绩不低于70分的学生中随机抽取6人,则从成绩在[70,80),[80,90),[90,100]内的学生中分别抽取了多少人?22.(2022·宁夏·石嘴山市第三中学模拟预测(文))新型冠状病毒肺炎COVID-19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.下表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.日期代码x 1 2 3 4 5 6 7 8累计确诊人数y . 4 8 16 31 51 71 97 122为了分析该国累计感染人数的变化趋势,小王同学分别用两杆模型:①,②对变量x和y的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差):经过计算得,,,,其中,.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型 并简要说明理由;(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少 附:回归直线的斜率和截距的最小二乘估计公式分别为:,. 展开更多...... 收起↑ 资源列表 第05讲 第九章 统计与成对数据的统计分析(综合测试)(原卷版).docx 第05讲 第九章 统计与成对数据的统计分析(综合测试)(解析版).docx