资源简介 中小学教育资源及组卷应用平台专题10 线性回归分析和独立性检验(2大考点20题)2大高频考点概览考点01 线性回归分析考点02独立性检验一、单选题1.(24-25高二下·江苏南京六校联合体·期中)已知两个变量与对应关系如下表:若与满足一元线性回归模型,且经验回归方程为,则( )A.与负相关B.在处的残差为C.经验回归直线过点D.变量每增加一个单位,实际值一定增加个单位【答案】C【分析】根据回归直线的斜率可判断A选项;利用残差的定义可判断B选项;求出的值,代入回归直线方程,可判断C选项;根据经验回归方程的意义可判断D选项.【详解】对于A选项,因为回归直线的斜率为,所以与正相关,A错;对于B选项,当处的残差为,B错;对于C选项,,则,故经验回归直线过点,C对;对于D选项,变量每增加一个单位,实际值增加个单位左右,D错.故选:C.2.(24-25高二下·江苏盐城五校联考·期中)在研究线性回归模型时,样本数据所对应的点均在直线上,用r表示解释变量对于反应变量变化的线性相关度,则( )A. B.1 C. D.2【答案】A【分析】根据线性相关系数的定义直接得解.【详解】由已知样本数据所对应的点均在直线上,则,又,所以满足负相关,即.故选:A.3.(24-25高二下·江苏淮安九校·期中)已知甲、乙、丙、丁四组数据变量间对应的样本相关系数分别为-0.92,0.46,0.79,0.85,则( )A.甲组数据变量间的线性相关程度最强 B.乙组数据变量间的线性相关程度最强C.丙组数据变量间的线性相关程度最强 D.丁组数据变量间的线性相关程度最强【答案】A【分析】根据相关系数的性质进行判断,越接近1时,相关程度越强.【详解】设变量间的线性相关系数为,当越接近1时,相关程度越强,因为,所以甲组数据变量间的线性相关程度最强,乙组数据变量间的线性相关程度最弱.故选:A.4.(24-25高二下·江苏无锡天一中学·期中)下列说法不正确的是( )A.在做回归分析时,可以用决定系数刻画模型的回归效果,若越大,则说明模型拟合的效果越好B.若随机变量,且,则C.若随机变量,则方差D.若甲、乙两组数据的相关系数分别为和0.89,则乙组数据的线性相关性更强【答案】D【分析】根据决定系数的概念判断A;根据正态分布的对称性判断B;根据二项分布的方差公式判断C;根据相关系数的定义判断D.【详解】对于A,决定系数越大,说明模型拟合的效果越好,故A正确;对于B,随机变量,则,则,故B正确;对于C,因为随机变量,则方差,故C正确;对于D,因为甲、乙两组数据的相关系数分别为和0.89,且,所以甲组数据的线性相关性更强,故D不正确.故选:D5.(24-25高二下·江苏通州高级中学·期中)某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得(为人的年龄,为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )A.年龄为岁的人体内脂肪含量一定为B.年龄为岁的人体内脂肪含量约为C.年龄为岁的人群中的体内脂肪含量平均为D.年龄为岁的人群中的大部分人的体内脂肪含量约为【答案】C【分析】根据回归直线的定义,结合所给函数即可得出结论.【详解】由题意,在中,当时,,表示的是年龄为37岁的人群中体内脂肪含量平均为,故选:C.6.(24-25高二下·江苏锡山高级中学·期中)稀土被誉为工业的维生素,具有无法取代的优异磁、光、电性能,对改善产品性能,增加产品品种,提高生产效率起到了巨大的作用.右表是2024年前5个月某国稀土出口均价(单位:万元吨)与月份的统计数据.若与的线性回归方程为,则的值为( )1 2 3 4 51.7 2.4 2.0 1.6A.1.4 B.1.5 C.1.6 D.1.7【答案】B【分析】根据线性回归方程为过样本中心点求解即可.【详解】由题意可知,,因为线性回归方程为过样本中心点,所以,所以,解得.故选:7.(24-25高二下·江苏镇江中学·期中)下列说法中错误的是( )A.样本数据3,4,5,6,7,8,9的第80百分位数是8B.线性回归直线一定经过样本点的中心C.两个随机变量相关系数越小,表明两个变量相关性越弱D.两个模型中残差平方和越小的模型拟合的效果越好【答案】C【分析】根据百分位数的定义求解判断A;根据线性回归直线的定义判断B;根据相关系数的定义判断C;根据残差的定义判断D.【详解】对于A,因为,所以第80百分位数是8,故A正确;对于B,根据线性回归直线的定义,线性回归直线一定经过样本点的中心,故B正确;对于C,两个随机变量相关系数的绝对值越小,表明两个变量相关性越弱,故C错误;对于D,根据残差意义可知,两个模型中残差平方和越小的模型拟合的效果越好,故D正确.故选:C.二、多选题8.(24-25高二下·江苏镇江·期中)下列有关线性回归分析的问题中,正确的是( )A.回归直线至少经过点、、、、中的一个点B.若线性回归方程为,则当变量增加个单位时,平均增加个单位C.两个具有线性相关关系的变量的相关性越强,则线性相关系数的值越接近于D.对具有线性相关关系的变量、,其线性回归方程为,若样本点的中心为,则实数的值是【答案】BD【分析】利用回归直线相关知识可判断ABD选项;利用线性相关系数可判断C选项.【详解】对于A选项,回归直线不一定经过样本点,但一定经过样本中心点,A错;对于B选项,若线性回归方程为,则当变量增加个单位时,平均增加个单位,B对;对于C选项,两个具有线性相关关系的变量的相关性越强,则线性相关系数的值越接近于或,C错;对于D选项,对具有线性相关关系的变量、,其线性回归方程为,若样本点的中心为,则,解得,D对.故选:BD.9.(23-24高二下·江苏新海高级中学·期中)某种产品的价格x(单位:元/kg)与需求量y(单位:kg)之间的对应数据如下表所示:x 10 15 20 25 30y 12 11 9 7 6根据表中的数据可得回归直线方程,则以下正确的是( )A.相关系数B.第一个样本点对应的残差为-0.2C.D.若该产品价格为35元/kg,则日需求量大约为4.2kg【答案】BCD【分析】首先根据相关数据的变化关系,即可判断相关系数,计算样本点中心,代入回归直线方程,求解,并根据残差公式,求解残差,并根据回归直线方程,进行预测.【详解】由对应数据可知,增大,减小,所以相关系数,,由,得,所以,即,所以相关系数,故A错误,C正确;由回归直线方程,当时,,所以第一个样本点对应的残差为,故B正确;当时,,故D正确.故选:BCD三、解答题10.(24-25高二下·江苏镇江中学·期中)根据统计,某蔬菜基地西红柿亩产量的增加量(单位:百千克)与某种液体肥料每亩使用量(单位:千克)之间的对应数据的散点图如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合与的关系,请计算相关系数,并说明线性相关性的强弱(相关系数精确到小数点后2位,若,则线性相关程度很高);(2)求关于的线性回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少百千克.附:数据和公式:;回归方程:,其中.相关系数:.【答案】(1)0.95,与线性相关性很强.(2),6.1【分析】(1)根据题意,结合相关系数的公式,求得,即可得到结论;(2)根据最小二乘法的公式,求得,得出的值,求得回归方程,令,求得的值,即可得到预测值.【详解】(1)根据题意,可得,且,,,可得,因为时线性相关程度很高,所以与线性相关性很强.(2)由,则,所以线性回归方程为,当时,,即当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为6.1百千克.11.(24-25高二下·江苏南京六校联合体·期中)某地区大型服装店对在该店购买衣服的客户进行满意度调研以便能更好地服务客户,统计了2024年1月至5月对该家服装店不满意的客户人数如下:月份x 1 2 3 4 5不满意的人数y 120 105 100 95 80(1)通过散点图可知对该服装店服务不满意的客户人数y与月份x之间存在线性相关关系,求y关于x的经验回归方程,并预测2024年8月对该大型服装店服务不满意的客户人数;(2)工作人员从这5个月内的调查表所记录的客户中随机抽查100人,调查满意度与性别的关系,得到下表,能否有99%的把握认为满意度与性别有关 满意 不满意 合计女客户 48 12男客户 22 18合计附:经验回归方程为,其中.,其中.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828【答案】(1),客户人数为55;(2)有把握.【分析】(1)根据给定数据,利用最小二乘法求出经验回归方程,再预测结果.(2)根据给定的数据求出的观测值,再与临界值比对即可.【详解】(1)由表中的数据知,,,,,,,不满意人数y与月份x之间的经验回归方程为,当x=8时,,所以预测2024年8月对该大型服装店服务不满意的客户人数为55.(2)零假设:服务满意度与性别无关,由表中的数据得,所以有99%的把握认为满意度与性别有关.12.(24-25高二下·江苏盐城五校联考·期中)2025年4月24日我国成功发射了神舟二十号载人飞船,我校航天社团于次日对本校学生进行了问卷调查,其中关于是否收看了现场直播的统计数据如下表所示(单位:人),已知从被访谈的同学中随机抽取1人,抽到看现场直播的女同学的概率为.看现场直播 未看现场直播男同学 x女同学 150 250(1)求x的值;(2)是否有99.9%以上的把握认为,观看现场直播与学生性别有关?(3)为进一步调研,现从看现场直播的同学中按照性别比例采用分层随机抽样的方法抽取9人,再从这9人中随机抽取2人,记这2人中女同学的人数为,求的分布列以及.参考公式:.参考数据:0.1 0.01 0.001k 2.706 6.635 10.828【答案】(1);(2)有99.9%以上的把握认为观看现场直播与学生性别有关;(3)分布列见解析,期望为.【分析】(1)应用频率估计概率,列方程求参数;(2)由(1)写出列联表,求出卡方值,结合独立检验基本思想得结论即可;(3)由题设9人中有4名女同学、5名男同学,从9人任取2人,抽到女同学的人数,应用超几何分布的概率求法求对应概率,写出分布列并求期望.【详解】(1)由题设,可得;(2)由(1)得列联表如下:看现场直播 未看现场直播男同学 200 500女同学 150 250 400450 450 900,所以有99.9%以上的把握认为观看现场直播与学生性别有关;(3)由题设及列联表知,抽取的9人中有3名女同学、6名男同学,从9人任取2人,抽到女同学的人数,则,,,所以的分布列如下,0 1 2.13.(24-25高二下·江苏无锡天一中学·期中)为适应社会化安全宣传新形势新要求,充分发挥区域特色和示范效应,深入推进安全宣传进企业、进农村、进社区、进学校、进家庭,普及安全知识、培育安全文化,某单位用简单随机抽样的方法从A,B两个社区中抽取居民进行满意度调查,调查中有“满意”和“不满意”两个选项,调查的部分数据如下表所示:社区 居民意见 合计满意 不满意A社区 30 45B社区 55合计 25(1)完成列联表,根据小概率值的独立性检验,能否认为居民满意度与所在社区有关?(2)现从已抽取的“不满意”的居民中随机抽取2位居民进行深入调研,用X表示抽取的“不满意”的居民来自A社区的人数,求随机变量X的分布列及数学期望.附:参考公式:,其中.0.10 0.05 0.025 0.0102.706 3.841 5.024 6.635【答案】(1)列联表见解析,居民满意度与所在社区无关.(2)分布列见解析,【分析】(1)根据列联表,计算值并根据其与的大小比较得出结论;(2)由题意,可分析得出变量服从超几何分布,按照其概率公式写出分布列,计算数学期望即得.【详解】(1)根据题目数据可完善列联表:社区 居民意见 合计满意 不满意A社区 30 15 45B社区 45 10 55合计 75 25 100零假设为:居民满意度与所在社区不具有相关性.根据列联表中的数据,得,根据小概率值的独立性检验,没有充分证据推断不成立,即认为居民满意度与所在社区无关.(2)已抽取的“不满意”的居民中,A社区有15人,B社区有10人,所以随机变量的所有可能取值为0,1,2,则,,,所以的分布列为0 1 2所以.14.(24-25高二下·江苏锡山高级中学·期中)甲、乙两家公司到某大学进行招聘,通过对毕业生进行笔试、面试、模拟演练这三项程序后直接签约一批毕业生.已知三项程序分别由三个部门独立依次考核,且互不影响,当三项程序全部通过即可签约.假设该大学100名毕业生参加甲公司招聘的具体情况如下表(不存在通过三项程序考核后放弃签约的现象).性别 参加考核但未能签约的人数 参加考核并能签约的人数 合计男生 20女生 50合计 30 100该校的小张准备参加两家公司的招聘,小张通过甲公司的每项程序的概率均为,通过乙公司的每项程序的概率依次为,,,其中.(1)完成列联表,根据小概率值的独立性检验,判断这100名毕业生参加甲公司的招聘能否签约与性别是否有关;(2)若小张通过甲、乙两公司程序的项数分别记为,.当时,求小张参加乙公司招聘并能成功签约的概率.附:,其中.0.100 0.050 0.025 0.0012.706 3.841 5.024 10.828【答案】(1)列联表见解析,能否签约与性别有关(2)【分析】(1)完善列联表,计算出卡方,即可判断;(2)依题意,即可求出,再由的可能取值为0,1,2,3,求出相应的概率,即可求出,通过即可求出的值,从而求出结果.【详解】(1)依题意可得列联表如下性别 参加考核但未能签约的人数 参加考核并能签约的人数 合计男生 20 20 40女生 50 10 60合计 70 30 100所以,所以根据小概率值的独立性检验,这100名毕业生参加甲公司的招聘能否签约与性别有关;(2)因为小张通过甲公司各程序的结果相互不影响,所以,则,依题意的可能取值为0,1,2,3.所以,,,,所以随机变量Y的分布列:0 1 2 3所以,因为,所以,即,所以小张参加乙公司招聘并能成功签约的概率.15.(24-25高二下·江苏镇江·期中)某学校举行了一次数学有奖竞赛,对考试成绩优秀(成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为. (1)求的值和样本容量;(2)用每个区间的组中值作为相应学生的成绩,估计所有参赛学生的平均成绩;(3)假设在抽取的样本中,男生比女生多人,且女生的获奖率为,问:能否有的把握认为获奖与性别有关?附:.【答案】(1),样本容量为(2)分(3)没有,理由见解析【分析】(1)利用频率分布直方图中所有矩形面积之和为可求得的值,利用样本容量、频数与频率之间的关系可求出样本容量;(2)将每个矩形底边的中点值乘以对应矩形的面积,再将所得结果全部相加,可得出所有参赛学生的平均成绩;(3)列出列联表,计算出的观测值,结合临界值表可得出结论.【详解】(1)在频率分布直方图中,所有矩形的面积之和为,则,解得,因为第一小组的频数为,则样本容量为.(2)由频率分布直方图可知,所有参赛学生的平均成绩为分.(3)提出零假设获奖与性别无关,由题意可知,抽取的样本中,男生人数为人,女生人数为,且女生的获奖人数为人,成绩优秀的学生人数为人,则男生获奖人数为人,可得出如下列联表:获奖 不获奖 合计男生女生合计所以,,所以,没有的把握认为获奖与性别有关.16.(23-24高二下·江苏南京南京外国语学校·期中)某航天公司研发一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:飞行距离(km) 56 63 71 79 90 102 110 117损坏零件数(个) 61 73 90 105 119 136 149 163(1)建立关于的回归模型,根据所给数据及回归模型,求关于回归方程;(精确到0.1,精确到1)(2)该公司进行了第二次测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,飞行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的推进器占比30%,请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?\ 保养 未保养 合计报废 20未报废合计 60 100参考数据、公式如下:,,,,,其中.0.25 0.1 0.05 0.025 0.01 0.0011.323 2.706 3.841 5.024 6.635 10.828【答案】(1);(2)表格见解析,有关.【分析】(1)利用最小二乘法求出,即可得出回归方程,(2)根据题意可将列联表补充完整,根据公式可求得,再对照临界值表即可得出结论.【详解】(1)由题意可得,,又由,,所以,,所以变量关于的线性回归方程为.(2)设零假设:是否报废与是否保养无关.由题意,报废推进器中保养过得共台,未保养的推进器共台,补充列联表如下:\ 保养 未保养 合计报废 6 14 20未报废 54 26 80合计 60 40 100则,根据小概率值的独立性检验,我们推断不成立,即认为是否报废与保养有关.17.(23-24高二下·江苏宿迁青华中学·期中)“每天跑步一小时,幸福生活一辈子.”青华中学工会为了解师生员工的爱好慢跑是否与性别有关,从学校随机抽取100名老师男女各半进行了问卷调查,得到了如下列联表:男性 女性 总计爱好 30不爱好 10总计 100(1)请将上面的列联表补充完整,试根据小概率值的独立性检验,分析爱好运动与性别是否有关;(2)若从这100人中的不爱好运动的人中随机抽取2人参加体育培训,记抽到的男性人数为,求的分布列 数学期望.附:0.10 0.05 0.010 0.005 0.0012.706 3.841 6.635 7.879 10.828参考公式:,其中.【答案】(1)列联表见解析,爱好运动与性别无关;(2)分布列见解析,【分析】(1)列出列联表,计算卡方的值进行判断;(2)的取值可能为,求出对应的概率写出分布表,再利用数学期望公式求解.【详解】(1)列联表如下:男性 女性 总计爱好 40 30 70不爱好 10 20 30总计 50 50 100零假设为:爱好运动与性别相互独立,即爱好运动与性别无关,由已知数据可求得:,根据小概率值的独立性检验,我们推断成立,即爱好运动与性别无关.(2)的取值可能为,则,,所以的分布列为:则的数学期望为:.18.(23-24高二下·江苏新海高级中学·期中)航天行业拥有广阔的发展前景,有越来越多的公司开始从事航天研究.某航天公司研发了一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:飞行距离x(千公里) 54 62 69 78 88 100 109损坏零件数y(个) 61 73 88 100 118 142 160参考数据:,,,(1)建立y关于x的回归模型,根据所给数据及回归模型,求;(精确到0.1)(2)该公司进行了第二项测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,对其中60台进行飞行前保养,测试结束后,100台推进器中有20台报废,其中保养过的推进器占比35%.请根据统计数据完成2×2列联表,并根据小概率值的独立性检验,能否认为推进器报废与保养有关 保养 未保养 合计报废 20未报废合计 60 100附:回归方程中斜率和截距的最小二乘估计公式分别为,,;0.10 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828【答案】(1)(2)列联表见解析,认为推进器报废与保养有关【分析】(1)根据参考数据和公式,即可求解;(2)由题意补全列联表,再计算,再和参考数据比较,即可判断结论.【详解】(1)由题意;(2)其中保养过的推进器为台,列联表如下,保养 未保养 合计报废 7 13 20未报废 53 27 80合计 60 40 100设零假设为推进器报废与保养无关,,所以根据小概率值的独立性检验,推断不成立,即认为推进器报废与保养有关.19.(23-24高二下·江苏如皋中学·调研)某社区为了推动全民健身,增加人们对体育运动的兴趣,随机抽取了男,女各 200 人做 统计调查. 统计显示,被调查的人中,喜欢运动的男性有 100 人,不喜欢运动的女性有 50 人.(1)完成下面列联表,并判断能否在犯错误概率不超过 0.005的情况下认为人们喜欢运动与性别有关;喜欢 不喜欢 合计男性女性合计(2)为了鼓励全民运动,社区开展一次趣味体育比赛,并设置3个奖项,每个奖项有且仅有 一人获取,每人最多只能获得 1 个奖项; 现从这 400 人中选出男性4人,女性4人参加 比赛,记为获奖的男性人数,求的分布列和数学期望.附:0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828【答案】(1)表格见解析,能(2)分布列见解析,【分析】(1)根据题意,完成列联表,计算值并根据其与的大小比较得出结论;(2)由题意,可分析得出变量服从超几何分布,按照其概率公式写出分布列,计算数学期望即得.【详解】(1)喜欢 不喜欢 合计男性 100 100 200女性 150 50 200合计 250 150 400零假设为:人们喜欢运动与性别无关.根据列联表数据计算可得:,根据小概率值的独立性检验,我们推断不成立,即认为人们喜欢运动与性别有关,此推断犯错误的概率不大于0.005,即能在犯错误概率不超过 0.005的情况下认为人们喜欢运动与性别有关.(2)记为获奖男性的人数可能为0,1,2,3,;;;,随机变量的分布列如下:0 1 2 3所以.20.(23-24高二下·江苏盐城中学、南京二十九中联考·期中)某学校号召学生参加“每天锻炼1小时”活动,为了解学生参加活动的情况,统计了全校所有学生在假期每周锻炼的时间,现随机抽取了60名同学在某一周参加锻炼的数据,整理如下列联表:性别 不经常锻炼 经常锻炼 合计男生 7女生 16 30合计 21注:将一周参加锻炼时间不小于3小时的称为“经常锻炼”,其余的称为“不经常锻炼”.(1)请完成上面列联表,并依据小概率值的独立性检验,能否认为性别因素与学生锻炼的经常性有关系;(2)将一周参加锻炼为0小时的称为“极度缺乏锻炼”.在抽取的60名同学中有5人“极度缺乏锻炼”.以样本频率估计概率.若在全校抽取20名同学,设“极度缺乏锻炼”的人数为X,求X的数学期望和方差;(3)将一周参加锻炼6小时以上的同学称为“运动爱好者”.在抽取的60名同学中有10名“运动爱好者”,其中有7名男生,3名女生.为进一步了解他们的生活习惯,在10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为Y,求Y的分布列和数学期望.附:,0.1 0.05 0.012.706 3.841 6.635【答案】(1)表格见解析,性别因素与学生体育锻炼的经常性有关系(2),(3)分布列见解析,【分析】(1)先根据题意完成列联表,代入公式可得,即可得到结论;(2)依题意可得X近似服从二项分布,先求出随机抽取一人为“极度缺乏锻炼”者的概率为,从而可得,即可求得和;(3)依题意可得Y的所有可能取值为0,1,2,3,利用超几何分布公式求得概率,进而即可得到Y的分布列和期望值.【详解】(1)根据题意可得列联表如下;性别 不经常锻炼 经常锻炼 合计男生 7 23 30女生 14 16 30合计 21 39 60零假设为:性别与锻炼情况独立,即性别因素与学生体育锻炼的经常性无关;根据列联表的数据计算可得,根据小概率值的独立性检验,推断不成立,即性别因素与学生体育锻炼的经常性有关系,此推断犯错误的概率不超过0.1.(2)因学校总学生数远大于所抽取的学生数,故X近似服从二项分布,易知随机抽取一人为“极度缺乏锻炼”者的概率,即可得,故,.(3)易知10名“运动爱好者”有7名男生,3名女生,所以Y的所有可能取值为0,1,2,3,且Y服从超几何分布:,,,故所求分布列为Y 0 1 2 3P可得21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台专题10 线性回归分析和独立性检验(2大考点20题)(答案版)1.C2.A3.A4.D5.C6.B7.C8.BD9.BCD10.(1)0.95,与线性相关性很强.(2),6.111.(1),客户人数为55;(2)有把握.12.(1);(2)有99.9%以上的把握认为观看现场直播与学生性别有关;(3)由题设及列联表知,抽取的9人中有3名女同学、6名男同学,从9人任取2人,抽到女同学的人数,则,,,所以的分布列如下,0 1 2.期望为.13.(1)列联表:社区 居民意见 合计满意 不满意A社区 30 15 45B社区 45 10 55合计 75 25 100居民满意度与所在社区无关.(2)分布列的分布列为0 1 2,14.(1)依题意可得列联表如下性别 参加考核但未能签约的人数 参加考核并能签约的人数 合计男生 20 20 40女生 50 10 60合计 70 30 100所以,所以根据小概率值的独立性检验,这100名毕业生参加甲公司的招聘能否签约与性别有关;(2)15.(1),样本容量为(2)分(3)提出零假设获奖与性别无关,由题意可知,抽取的样本中,男生人数为人,女生人数为,且女生的获奖人数为人,成绩优秀的学生人数为人,则男生获奖人数为人,可得出如下列联表:获奖 不获奖 合计男生女生合计所以,,所以,没有的把握认为获奖与性别有关.16.(1);(2)设零假设:是否报废与是否保养无关.由题意,报废推进器中保养过得共台,未保养的推进器共台,补充列联表如下:\ 保养 未保养 合计报废 6 14 20未报废 54 26 80合计 60 40 100则,根据小概率值的独立性检验,我们推断不成立,即认为是否报废与保养有关.17.(1)列联表如下:男性 女性 总计爱好 40 30 70不爱好 10 20 30总计 50 50 100零假设为:爱好运动与性别相互独立,即爱好运动与性别无关,由已知数据可求得:,根据小概率值的独立性检验,我们推断成立,即爱好运动与性别无关.(2)分布列期望:18.(1)(2)其中保养过的推进器为台,列联表如下,保养 未保养 合计报废 7 13 20未报废 53 27 80合计 60 40 100设零假设为推进器报废与保养无关,,所以根据小概率值的独立性检验,推断不成立,即认为推进器报废与保养有关.19.(1)喜欢 不喜欢 合计男性 100 100 200女性 150 50 200合计 250 150 400零假设为:人们喜欢运动与性别无关.根据列联表数据计算可得:,根据小概率值的独立性检验,我们推断不成立,即认为人们喜欢运动与性别有关,此推断犯错误的概率不大于0.005,即能在犯错误概率不超过 0.005的情况下认为人们喜欢运动与性别有关.(2)记为获奖男性的人数可能为0,1,2,3,;;;,随机变量的分布列如下:0 1 2 3所以.20.(1)根据题意可得列联表如下;性别 不经常锻炼 经常锻炼 合计男生 7 23 30女生 14 16 30合计 21 39 60零假设为:性别与锻炼情况独立,即性别因素与学生体育锻炼的经常性无关;根据列联表的数据计算可得,根据小概率值的独立性检验,推断不成立,即性别因素与学生体育锻炼的经常性有关系,此推断犯错误的概率不超过0.1.(2),(3)分布列为Y 0 1 2 3P,啊21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台,专题10 线性回归分析和独立性检验(2大考点20题)2大高频考点概览考点01 线性回归分析考点02独立性检验一、单选题1.(24-25高二下·江苏南京六校联合体·期中)已知两个变量与对应关系如下表:若与满足一元线性回归模型,且经验回归方程为,则( )A.与负相关B.在处的残差为C.经验回归直线过点D.变量每增加一个单位,实际值一定增加个单位2.(24-25高二下·江苏盐城五校联考·期中)在研究线性回归模型时,样本数据所对应的点均在直线上,用r表示解释变量对于反应变量变化的线性相关度,则( )A. B.1 C. D.23.(24-25高二下·江苏淮安九校·期中)已知甲、乙、丙、丁四组数据变量间对应的样本相关系数分别为-0.92,0.46,0.79,0.85,则( )A.甲组数据变量间的线性相关程度最强 B.乙组数据变量间的线性相关程度最强C.丙组数据变量间的线性相关程度最强 D.丁组数据变量间的线性相关程度最强4.(24-25高二下·江苏无锡天一中学·期中)下列说法不正确的是( )A.在做回归分析时,可以用决定系数刻画模型的回归效果,若越大,则说明模型拟合的效果越好B.若随机变量,且,则C.若随机变量,则方差D.若甲、乙两组数据的相关系数分别为和0.89,则乙组数据的线性相关性更强5.(24-25高二下·江苏通州高级中学·期中)某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得(为人的年龄,为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )A.年龄为岁的人体内脂肪含量一定为B.年龄为岁的人体内脂肪含量约为C.年龄为岁的人群中的体内脂肪含量平均为D.年龄为岁的人群中的大部分人的体内脂肪含量约为6.(24-25高二下·江苏锡山高级中学·期中)稀土被誉为工业的维生素,具有无法取代的优异磁、光、电性能,对改善产品性能,增加产品品种,提高生产效率起到了巨大的作用.右表是2024年前5个月某国稀土出口均价(单位:万元吨)与月份的统计数据.若与的线性回归方程为,则的值为( )1 2 3 4 51.7 2.4 2.0 1.6A.1.4 B.1.5 C.1.6 D.1.77.(24-25高二下·江苏镇江中学·期中)下列说法中错误的是( )A.样本数据3,4,5,6,7,8,9的第80百分位数是8B.线性回归直线一定经过样本点的中心C.两个随机变量相关系数越小,表明两个变量相关性越弱D.两个模型中残差平方和越小的模型拟合的效果越好二、多选题8.(24-25高二下·江苏镇江·期中)下列有关线性回归分析的问题中,正确的是( )A.回归直线至少经过点、、、、中的一个点B.若线性回归方程为,则当变量增加个单位时,平均增加个单位C.两个具有线性相关关系的变量的相关性越强,则线性相关系数的值越接近于D.对具有线性相关关系的变量、,其线性回归方程为,若样本点的中心为,则实数的值是9.(23-24高二下·江苏新海高级中学·期中)某种产品的价格x(单位:元/kg)与需求量y(单位:kg)之间的对应数据如下表所示:x 10 15 20 25 30y 12 11 9 7 6根据表中的数据可得回归直线方程,则以下正确的是( )A.相关系数B.第一个样本点对应的残差为-0.2C.D.若该产品价格为35元/kg,则日需求量大约为4.2kg三、解答题10.(24-25高二下·江苏镇江中学·期中)根据统计,某蔬菜基地西红柿亩产量的增加量(单位:百千克)与某种液体肥料每亩使用量(单位:千克)之间的对应数据的散点图如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合与的关系,请计算相关系数,并说明线性相关性的强弱(相关系数精确到小数点后2位,若,则线性相关程度很高);(2)求关于的线性回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少百千克.附:数据和公式:;回归方程:,其中.相关系数:.11.(24-25高二下·江苏南京六校联合体·期中)某地区大型服装店对在该店购买衣服的客户进行满意度调研以便能更好地服务客户,统计了2024年1月至5月对该家服装店不满意的客户人数如下:月份x 1 2 3 4 5不满意的人数y 120 105 100 95 80(1)通过散点图可知对该服装店服务不满意的客户人数y与月份x之间存在线性相关关系,求y关于x的经验回归方程,并预测2024年8月对该大型服装店服务不满意的客户人数;(2)工作人员从这5个月内的调查表所记录的客户中随机抽查100人,调查满意度与性别的关系,得到下表,能否有99%的把握认为满意度与性别有关 满意 不满意 合计女客户 48 12男客户 22 18合计附:经验回归方程为,其中.,其中.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.82812.(24-25高二下·江苏盐城五校联考·期中)2025年4月24日我国成功发射了神舟二十号载人飞船,我校航天社团于次日对本校学生进行了问卷调查,其中关于是否收看了现场直播的统计数据如下表所示(单位:人),已知从被访谈的同学中随机抽取1人,抽到看现场直播的女同学的概率为.看现场直播 未看现场直播男同学 x女同学 150 250(1)求x的值;(2)是否有99.9%以上的把握认为,观看现场直播与学生性别有关?(3)为进一步调研,现从看现场直播的同学中按照性别比例采用分层随机抽样的方法抽取9人,再从这9人中随机抽取2人,记这2人中女同学的人数为,求的分布列以及.参考公式:.参考数据:0.1 0.01 0.001k 2.706 6.635 10.828看现场直播 未看现场直播男同学 200 500女同学 150 250 400450 450 9000 1 213.(24-25高二下·江苏无锡天一中学·期中)为适应社会化安全宣传新形势新要求,充分发挥区域特色和示范效应,深入推进安全宣传进企业、进农村、进社区、进学校、进家庭,普及安全知识、培育安全文化,某单位用简单随机抽样的方法从A,B两个社区中抽取居民进行满意度调查,调查中有“满意”和“不满意”两个选项,调查的部分数据如下表所示:社区 居民意见 合计满意 不满意A社区 30 45B社区 55合计 25(1)完成列联表,根据小概率值的独立性检验,能否认为居民满意度与所在社区有关?(2)现从已抽取的“不满意”的居民中随机抽取2位居民进行深入调研,用X表示抽取的“不满意”的居民来自A社区的人数,求随机变量X的分布列及数学期望.附:参考公式:,其中.0.10 0.05 0.025 0.0102.706 3.841 5.024 6.635社区 居民意见 合计满意 不满意A社区 30 15 45B社区 45 10 55合计 75 25 1000 1 214.(24-25高二下·江苏锡山高级中学·期中)甲、乙两家公司到某大学进行招聘,通过对毕业生进行笔试、面试、模拟演练这三项程序后直接签约一批毕业生.已知三项程序分别由三个部门独立依次考核,且互不影响,当三项程序全部通过即可签约.假设该大学100名毕业生参加甲公司招聘的具体情况如下表(不存在通过三项程序考核后放弃签约的现象).性别 参加考核但未能签约的人数 参加考核并能签约的人数 合计男生 20女生 50合计 30 100该校的小张准备参加两家公司的招聘,小张通过甲公司的每项程序的概率均为,通过乙公司的每项程序的概率依次为,,,其中.(1)完成列联表,根据小概率值的独立性检验,判断这100名毕业生参加甲公司的招聘能否签约与性别是否有关;(2)若小张通过甲、乙两公司程序的项数分别记为,.当时,求小张参加乙公司招聘并能成功签约的概率.附:,其中.0.100 0.050 0.025 0.0012.706 3.841 5.024 10.828性别 参加考核但未能签约的人数 参加考核并能签约的人数 合计男生 20 20 40女生 50 10 60合计 70 30 1000 1 2 315.(24-25高二下·江苏镇江·期中)某学校举行了一次数学有奖竞赛,对考试成绩优秀(成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为. (1)求的值和样本容量;(2)用每个区间的组中值作为相应学生的成绩,估计所有参赛学生的平均成绩;(3)假设在抽取的样本中,男生比女生多人,且女生的获奖率为,问:能否有的把握认为获奖与性别有关?附:.获奖 不获奖 合计男生女生合计16.(23-24高二下·江苏南京南京外国语学校·期中)某航天公司研发一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:飞行距离(km) 56 63 71 79 90 102 110 117损坏零件数(个) 61 73 90 105 119 136 149 163(1)建立关于的回归模型,根据所给数据及回归模型,求关于回归方程;(精确到0.1,精确到1)(2)该公司进行了第二次测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,飞行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的推进器占比30%,请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?\ 保养 未保养 合计报废 20未报废合计 60 100参考数据、公式如下:,,,,,其中.0.25 0.1 0.05 0.025 0.01 0.0011.323 2.706 3.841 5.024 6.635 10.828\ 保养 未保养 合计报废 6 14 20未报废 54 26 80合计 60 40 10017.(23-24高二下·江苏宿迁青华中学·期中)“每天跑步一小时,幸福生活一辈子.”青华中学工会为了解师生员工的爱好慢跑是否与性别有关,从学校随机抽取100名老师男女各半进行了问卷调查,得到了如下列联表:男性 女性 总计爱好 30不爱好 10总计 100(1)请将上面的列联表补充完整,试根据小概率值的独立性检验,分析爱好运动与性别是否有关;(2)若从这100人中的不爱好运动的人中随机抽取2人参加体育培训,记抽到的男性人数为,求的分布列 数学期望.附:0.10 0.05 0.010 0.005 0.0012.706 3.841 6.635 7.879 10.828参考公式:,其中.男性 女性 总计爱好 40 30 70不爱好 10 20 30总计 50 50 10018.(23-24高二下·江苏新海高级中学·期中)航天行业拥有广阔的发展前景,有越来越多的公司开始从事航天研究.某航天公司研发了一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:飞行距离x(千公里) 54 62 69 78 88 100 109损坏零件数y(个) 61 73 88 100 118 142 160参考数据:,,,(1)建立y关于x的回归模型,根据所给数据及回归模型,求;(精确到0.1)(2)该公司进行了第二项测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,对其中60台进行飞行前保养,测试结束后,100台推进器中有20台报废,其中保养过的推进器占比35%.请根据统计数据完成2×2列联表,并根据小概率值的独立性检验,能否认为推进器报废与保养有关 保养 未保养 合计报废 20未报废合计 60 100附:回归方程中斜率和截距的最小二乘估计公式分别为,,;0.10 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828保养 未保养 合计报废 7 13 20未报废 53 27 80合计 60 40 10019.(23-24高二下·江苏如皋中学·调研)某社区为了推动全民健身,增加人们对体育运动的兴趣,随机抽取了男,女各 200 人做 统计调查. 统计显示,被调查的人中,喜欢运动的男性有 100 人,不喜欢运动的女性有 50 人.(1)完成下面列联表,并判断能否在犯错误概率不超过 0.005的情况下认为人们喜欢运动与性别有关;喜欢 不喜欢 合计男性女性合计(2)为了鼓励全民运动,社区开展一次趣味体育比赛,并设置3个奖项,每个奖项有且仅有 一人获取,每人最多只能获得 1 个奖项; 现从这 400 人中选出男性4人,女性4人参加 比赛,记为获奖的男性人数,求的分布列和数学期望.附:0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828喜欢 不喜欢 合计男性 100 100 200女性 150 50 200合计 250 150 4000 1 2 320.(23-24高二下·江苏盐城中学、南京二十九中联考·期中)某学校号召学生参加“每天锻炼1小时”活动,为了解学生参加活动的情况,统计了全校所有学生在假期每周锻炼的时间,现随机抽取了60名同学在某一周参加锻炼的数据,整理如下列联表:性别 不经常锻炼 经常锻炼 合计男生 7女生 16 30合计 21注:将一周参加锻炼时间不小于3小时的称为“经常锻炼”,其余的称为“不经常锻炼”.(1)请完成上面列联表,并依据小概率值的独立性检验,能否认为性别因素与学生锻炼的经常性有关系;(2)将一周参加锻炼为0小时的称为“极度缺乏锻炼”.在抽取的60名同学中有5人“极度缺乏锻炼”.以样本频率估计概率.若在全校抽取20名同学,设“极度缺乏锻炼”的人数为X,求X的数学期望和方差;(3)将一周参加锻炼6小时以上的同学称为“运动爱好者”.在抽取的60名同学中有10名“运动爱好者”,其中有7名男生,3名女生.为进一步了解他们的生活习惯,在10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为Y,求Y的分布列和数学期望.附:,0.1 0.05 0.012.706 3.841 6.635性别 不经常锻炼 经常锻炼 合计男生 7 23 30女生 14 16 30合计 21 39 60Y 0 1 2 3P21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源列表 专题10 线性回归分析和独立性检验(2大考点20题)(原卷版).docx 专题10 线性回归分析和独立性检验(2大考点20题)(答案版).docx 专题10 线性回归分析和独立性检验(2大考点20题)(解析版).docx