资源简介 第48讲 变量相关性与统计案例【练基础】1.从甲地到乙地,一天中有5次火车,12次客车,3次飞机航班,还有6次轮船,某人某天要从甲地到乙地,共有不同走法的种数是( )A.26 B.60C.18 D.1 0802.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+bln x3.某班新年联欢会原定的6个节目已排成节目单,开演前又增加了3个新节目,如果将这3个新节目插入节目单中,那么不同的插法种数为( )A.504 B.210C.336 D.1204.某模具厂采用了新工艺后,原材料支出费用x与销售额y(单位:万元)之间有如下数据,由散点图可知,销售额y与原材料支出费用x有较好的线性相关关系,其线性回归方程是=x+48,则当原材料支出费用为40时,预估销售额为( )x 10 15 20 25 30y 110 125 160 185 220A.252 B.268C.272 D.2885.六个人从左至右排成一行,最左端只能排甲或乙,最右端不能排甲,则不同的排法共有( )A.192种 B.216种C.240种 D.288种6.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线 一线 总计愿生 45 20 65不愿生 13 22 35总计 58 42 100计算得,K2≈9.616.参照下表,P(K2≥k0) 0.050 0.010 0.001k0 3.841 6.635 10.828下列结论正确的是( )A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过5%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”7.从10种不同的作物种子中选出6种放入6个不同的瓶子中展出,如果甲、乙两种种子不能放入第1号瓶内,那么不同的放法种数为( )A.CA B.CAC.CA D.CA8.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表: 夜晚天气日落云里走 下雨 未下雨出现 25 5未出现 25 45临界值表P(K2≥k0) 0.10 0.05 0.010 0.001k0 2.706 3.841 6.635 10.828并计算得到K2≈19.05,下列小波对地区A天气判断正确的是( )A.夜晚下雨的概率约为B.未出现“日落云里走”夜晚下雨的概率约为C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨9.某人设计一项单人游戏,规则如下:先将一棋子放在如图所示正方形ABCD(边长为2个单位)的顶点A处,然后通过掷骰子来确定棋子沿正方形的边按逆时针方向行走的单位,如果掷出的点数为i(i=1,2,…,6),则棋子就按逆时针方向行走i个单位,一直循环下去.则某人抛掷三次骰子后棋子恰好又回到点A处的所有不同走法共有( )A.22种 B.24种C.25种 D.27种10.将2名教师,4名学生分成2个小组,分别安排到甲、乙两地参加社会实践活动,每个小组由1名教师和2名学生组成,不同的安排方案共有( )A.12种 B.10种C.9种 D.8种【练提升】1.某微信群中有甲、乙、丙、丁、戊五个人玩抢红包游戏,现有4个红包,每人最多抢一个,且红包被全部抢完,4个红包中有2个6元,1个8元,1个10元(红包中金额相同视为相同红包),则甲、乙都抢到红包的情况有( )A.18种 B.24种C.36种 D.48种2.为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关关系,并由调查数据得到y与x的回归直线方程为=0.15x+0.2.由回归直线方程可知,家庭年收入每增加1万元,则年教育支出平均增加________万元.3.北京大兴国际机场为4F级国际机场、大型国际枢纽机场、国家发展新动力源,于2019年9月25日正式通航.目前建有“三纵一横”4条跑道,分别叫西一跑道、西二跑道、东一跑道、北一跑道,若有2架飞往不同目的地的飞机要从以上不同跑道同时起飞,且西一跑道、西二跑道至少有一道被选取,则共有________种不同的安排方法.(用数字作答)4.心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)几何题 代数题 总计男同学 22 8 30女同学 8 12 20总计 30 20 50根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过________.附表:P(K2≥k0) 0.10 0.05 0.025 0.010 0.001k0 2.706 3.841 5.024 6.635 10.8285.将甲、乙等5名交警分配到三个不同的路口疏导交通,每个路口至少1人,且甲、乙在同一路口的分配方案共有________种.6.近五年来某草场羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:年份 1 2 3 4 5羊只数量/万只 1.4 0.9 0.75 0.6 0.3草地植被指数 1.1 4.3 15.6 31.3 49.7根据表及图得到以下判断:①羊只数量与草地植被指数成减函数关系;②若利用这五组数据得到的两变量间的相关系数为r1,去掉第一年数据后得到的相关系数为r2,则|r1|<|r2|;③可以利用回归直线方程,准确地得到当羊只数量为2万只时的草地植被指数.以上判断中正确的个数是________.7.从4名男同学中选出2人,6名女同学中选出3人,并将选出的5人排成一排.(1)共有多少种不同的排法?(2)若选出的2名男同学不相邻,共有多少种不同的排法?(用数字表示)8.“学习强国”APP是由中宣部主管以习近平新时代中国特色社会主义思想和党的十九大精神为主要内容的“PC端+手机客户端”两大终端二合一模式的学习平台,2019年1月1日上线后便成了党员干部群众学习的“新助手”,为了调研某地党员在“学习强国”APP的学习情况,研究人员随机抽取了200名该地党员进行调查,将他们某两天在“学习强国”APP上所得的分数统计如表(1)所示:表(1)分数 [60,70) [70,80) [80,90) [90,100]人数 50 100 20 30(1)现用分层抽样的方法从80分及以上的党员中随机抽取5人,再从抽取的5人中随机选取2人作为学习小组长,求所选取的两位小组长的分数都在上的概率;(2)为了调查“学习强国”APP得分情况是否受到所在单位的影响,研究人员随机抽取了机关事业单位党员以及国有企业党员作出调查,得到的数据如表所示:表(2)机关事业单位党员 国有企业党员分数超过80 220 150分数不超过80 80 50判断是否有99%的把握认为“学习强国”APP得分情况受所在单位的影响.附:K2=,n=a+b+c+d.P(K2≥k0) 0.100 0.050 0.010 0.001k0 2.706 3.841 6.635 10.8289.一汽车销售公司对开业4年来某种型号的汽车“五一”优惠金额与销售量之间的关系进行分析研究并做了记录,得到如下资料:日期 第一年 第二年 第三年 第四年优惠金额x/千元 10 11 13 12销售量y/辆 22 24 31 27(1)求出y关于x的线性回归方程=x+;(2)若第5年优惠金额8.5千元,估计第5年的销售量y(辆)的值.参考公式:=,=-.10.用0,1,2,3,4这五个数字,可以组成多少个满足下列条件的没有重复数字的五位数?(1)比21 034大的偶数;(2)左起第二、四位是奇数的偶数.第48讲 变量相关性与统计案例【练基础】1.从甲地到乙地,一天中有5次火车,12次客车,3次飞机航班,还有6次轮船,某人某天要从甲地到乙地,共有不同走法的种数是( )A.26 B.60C.18 D.1 080【答案】A 【解析】由分类加法计数原理知有5+12+3+6=26(种)不同走法.2.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+bln x【答案】D 【解析】用光滑的曲线把图中各点连接起来,由图象的大致走向判断,此函数应该是对数函数类型的,故应该选用的函数模型为y=a+bln x.3.某班新年联欢会原定的6个节目已排成节目单,开演前又增加了3个新节目,如果将这3个新节目插入节目单中,那么不同的插法种数为( )A.504 B.210C.336 D.120【答案】A 【解析】分三步,先插一个新节目,有7种方法,再插第二个新节目,有8种方法,最后插第三个节目,有9种方法.故共有7×8×9=504种不同的插法.4.某模具厂采用了新工艺后,原材料支出费用x与销售额y(单位:万元)之间有如下数据,由散点图可知,销售额y与原材料支出费用x有较好的线性相关关系,其线性回归方程是=x+48,则当原材料支出费用为40时,预估销售额为( )x 10 15 20 25 30y 110 125 160 185 220A.252 B.268C.272 D.288【答案】C 【解析】由题意得=20,=160,将点代入回归方程=x+48中,得=5.6,∴回归方程为=5.6x+48,∴当x=40时,=272,故选C.5.六个人从左至右排成一行,最左端只能排甲或乙,最右端不能排甲,则不同的排法共有( )A.192种 B.216种C.240种 D.288种【答案】B 【解析】第一类:甲在左端,有A=120种排法;第二类:乙在最左端,甲不在最右端,有4A=96种排法;所以共有120+96=216种排法.6.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线 一线 总计愿生 45 20 65不愿生 13 22 35总计 58 42 100计算得,K2≈9.616.参照下表,P(K2≥k0) 0.050 0.010 0.001k0 3.841 6.635 10.828下列结论正确的是( )A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过5%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”【答案】C 【解析】因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.7.从10种不同的作物种子中选出6种放入6个不同的瓶子中展出,如果甲、乙两种种子不能放入第1号瓶内,那么不同的放法种数为( )A.CA B.CAC.CA D.CA【答案】C 【解析】先排第1号瓶,从除甲、乙以外的8种不同作物种子中选出1种有C种方法,再排剩余的瓶子,有A种方法,故不同的放法共CA种,故选C.8.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表: 夜晚天气日落云里走 下雨 未下雨出现 25 5未出现 25 45临界值表P(K2≥k0) 0.10 0.05 0.010 0.001k0 2.706 3.841 6.635 10.828并计算得到K2≈19.05,下列小波对地区A天气判断正确的是( )A.夜晚下雨的概率约为B.未出现“日落云里走”夜晚下雨的概率约为C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨【答案】D 【解析】由题意,把频率看作概率可得夜晚下雨的概率约为=,故A判断正确;未出现“日落云里走”,夜晚下雨的概率约为=,故B判断正确;由K2≈19.05>10.828,根据临界值表,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C判断正确,D判断错误,故选D.9.某人设计一项单人游戏,规则如下:先将一棋子放在如图所示正方形ABCD(边长为2个单位)的顶点A处,然后通过掷骰子来确定棋子沿正方形的边按逆时针方向行走的单位,如果掷出的点数为i(i=1,2,…,6),则棋子就按逆时针方向行走i个单位,一直循环下去.则某人抛掷三次骰子后棋子恰好又回到点A处的所有不同走法共有( )A.22种 B.24种C.25种 D.27种【答案】D 【解析】由题意知正方形ABCD(边长为2个单位)的周长是8个单位,抛掷三次骰子后棋子恰好又回到点A处,表示三次骰子的点数之和是8或16,点数和为8或16的有125,134,116,224,233,466,556,共有7种组合.组合125,134,每种情况可以排列出A=6种走法,共有2A=2×6=12种走法;组合116,224,233,466,556各自可以列出3种走法,共有5×3=15种走法.根据分类加法计数原理知,共有12+15=27(种)走法,故选D.10.将2名教师,4名学生分成2个小组,分别安排到甲、乙两地参加社会实践活动,每个小组由1名教师和2名学生组成,不同的安排方案共有( )A.12种 B.10种C.9种 D.8种【答案】A 【解析】将4名学生均分为2个小组共有=3(种)分法;将2个小组的同学分给2名教师共有A=2(种)分法;最后将2个小组的人员分配到甲、乙两地有A=2(种)分法.故不同的安排方案共有3×2×2=12(种).【练提升】1.某微信群中有甲、乙、丙、丁、戊五个人玩抢红包游戏,现有4个红包,每人最多抢一个,且红包被全部抢完,4个红包中有2个6元,1个8元,1个10元(红包中金额相同视为相同红包),则甲、乙都抢到红包的情况有( )A.18种 B.24种C.36种 D.48种【答案】C【解析】若甲、乙抢的是一个6元和一个8元的红包,剩下2个红包,被剩下的3人中的2个人抢走,有AA=12种;若甲、乙抢的是一个6元和一个10元的红包,剩下2个红包,被剩下的3人中的2个人抢走,有AA=12种;若甲、乙抢的是一个8元和一个10元的红包,剩下2个红包,被剩下的3人中的2个人抢走,有AC=6种;若甲、乙抢的是两个6元的红包,剩下2个红包,被剩下的3人中的2个人抢走,有A=6种,根据分类加法计数原理可得,共有36种情况,故选C.2.为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关关系,并由调查数据得到y与x的回归直线方程为=0.15x+0.2.由回归直线方程可知,家庭年收入每增加1万元,则年教育支出平均增加________万元.【解析】因为回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.【答案】0.153.北京大兴国际机场为4F级国际机场、大型国际枢纽机场、国家发展新动力源,于2019年9月25日正式通航.目前建有“三纵一横”4条跑道,分别叫西一跑道、西二跑道、东一跑道、北一跑道,若有2架飞往不同目的地的飞机要从以上不同跑道同时起飞,且西一跑道、西二跑道至少有一道被选取,则共有________种不同的安排方法.(用数字作答)【解析】从4条跑道中选取安排共有A=12种选择,排除西一跑道、西二跑道都没有的A=2种选择,共有12-2=10种选择.【答案】104.心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)几何题 代数题 总计男同学 22 8 30女同学 8 12 20总计 30 20 50根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过________.附表:P(K2≥k0) 0.10 0.05 0.025 0.010 0.001k0 2.706 3.841 5.024 6.635 10.828【解析】由列联表计算K2的观测值k=≈5.556>5.024.∴推断犯错误的概率不超过0.025.【答案】0.0255.将甲、乙等5名交警分配到三个不同的路口疏导交通,每个路口至少1人,且甲、乙在同一路口的分配方案共有________种.【解析】把甲、乙2人看作一个整体,5个人变成了4个,再把这4个人分成3部分,每部分至少1人,共有C种方法,再把这3部分人分到3个路口,有A种方法,根据分步乘法计数原理,不同分法的种类为CA=36(种).【答案】366.近五年来某草场羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:年份 1 2 3 4 5羊只数量/万只 1.4 0.9 0.75 0.6 0.3草地植被指数 1.1 4.3 15.6 31.3 49.7根据表及图得到以下判断:①羊只数量与草地植被指数成减函数关系;②若利用这五组数据得到的两变量间的相关系数为r1,去掉第一年数据后得到的相关系数为r2,则|r1|<|r2|;③可以利用回归直线方程,准确地得到当羊只数量为2万只时的草地植被指数.以上判断中正确的个数是________.【解析】对于①,羊只数量与草地植被指数成负相关关系,不是减函数关系,所以①错误;对于②,用这五组数据得到的两变量间的相关系数为r1,因为第一年数据(1.4,1.1)是离群值,去掉后得到的相关系数为r2,其相关性更强,所以|r1|<|r2|,②正确;对于③,利用回归直线方程,不能准确得到当羊只数量为2万只时的草地植被指数,得到的只是预测值,所以③错误.综上知,正确的判断序号是②,共1个.【答案】17.从4名男同学中选出2人,6名女同学中选出3人,并将选出的5人排成一排.(1)共有多少种不同的排法?(2)若选出的2名男同学不相邻,共有多少种不同的排法?(用数字表示)【解析】(1)从4名男生中选出2人,有C种选法,从6名女生中选出3人,有C种选法,根据分步乘法计数原理知选出5人,再把这5个人进行排列,共有CCA=14 400(种).(2)在选出的5个人中,若2名男生不相邻,则第一步先排3名女生,第二步再让男生插空,根据分步乘法计数原理知共有CCAA=8 640(种).8.“学习强国”APP是由中宣部主管以习近平新时代中国特色社会主义思想和党的十九大精神为主要内容的“PC端+手机客户端”两大终端二合一模式的学习平台,2019年1月1日上线后便成了党员干部群众学习的“新助手”,为了调研某地党员在“学习强国”APP的学习情况,研究人员随机抽取了200名该地党员进行调查,将他们某两天在“学习强国”APP上所得的分数统计如表(1)所示:表(1)分数 [60,70) [70,80) [80,90) [90,100]人数 50 100 20 30(1)现用分层抽样的方法从80分及以上的党员中随机抽取5人,再从抽取的5人中随机选取2人作为学习小组长,求所选取的两位小组长的分数都在上的概率;(2)为了调查“学习强国”APP得分情况是否受到所在单位的影响,研究人员随机抽取了机关事业单位党员以及国有企业党员作出调查,得到的数据如表所示:表(2)机关事业单位党员 国有企业党员分数超过80 220 150分数不超过80 80 50判断是否有99%的把握认为“学习强国”APP得分情况受所在单位的影响.附:K2=,n=a+b+c+d.P(K2≥k0) 0.100 0.050 0.010 0.001k0 2.706 3.841 6.635 10.828【解析】(1)由题意得,分数在上抽取2人,记为a,b;分数在上抽取3人,记为A,B,C.选取2人作为学习小组长的基本事件有10个,即(a,b),(a,A),(a,B),(a,C),(b,A),(b,B),(b,C),(A,B),(A,C),(B,C),其中两位小组长的分数都在上的有(A,B),(A,C),(B,C)共3个基本事件,∴所求概率P=.(2)完善表格如下:机关事业单位党员 国有企业党员 总计分数超过80 220 150 370分数不超过80 80 50 130总计 300 200 500K2=≈0.173<6.635,故没有99%的把握认为“学习强国”APP得分情况受所在单位的影响.9.一汽车销售公司对开业4年来某种型号的汽车“五一”优惠金额与销售量之间的关系进行分析研究并做了记录,得到如下资料:日期 第一年 第二年 第三年 第四年优惠金额x/千元 10 11 13 12销售量y/辆 22 24 31 27(1)求出y关于x的线性回归方程=x+;(2)若第5年优惠金额8.5千元,估计第5年的销售量y(辆)的值.参考公式:=,=-.【解析】(1)由题中数据可得=11.5,=26,xiyi=1 211,x=534,∴====3,故=-=26-3×11.5=-8.5,∴y关于x的线性回归方程为=3x-8.5.(2)由(1)得,当x=8.5时,=17,∴第5年优惠金额为8.5千元时,销售量估计为17辆.10.用0,1,2,3,4这五个数字,可以组成多少个满足下列条件的没有重复数字的五位数?(1)比21 034大的偶数;(2)左起第二、四位是奇数的偶数.【解析】(1)可分五类,当末位数字是0,而首位数字是2时,有6个五位数;当末位数字是0,而首位数字是3或4时,有CA=12个五位数;当末位数字是2,而首位数字是3或4时,有CA=12个五位数;当末位数字是4,而首位数字是2时,有3个五位数;当末位数字是4,而首位数字是3时,有A=6个五位数.故共有6+12+12+3+6=39个满足条件的五位数.(2)可分为两类:末位数是0,个数有A·A=4;末位数是2或4,个数有A·C=4.故共有4+4=8个满足条件的五位数.第48讲 变量相关性与统计案例【学科素养】1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程,凸显数学运算的核心素养.3.了解独立性检验的基本思想、方法及其应用,凸显数学建模、数据分析的核心素养.4.了解回归分析的基本思想、方法及其简单应用,凸显数学建模、数据分析的核心素养.【课标解读】1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系。2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。3.了解回归分析的思想、方法及其简单应用. 4.了解独立性检验的思想、方法及其初步应用。【备考策略】从近三年高考情况来看,本讲是高考中的一个热点考查内容.预测2022年将会考查:①回归直线方程的判断、求解及相关系数的意义,并用其解决实际问题;②独立性检验思想在实际问题中的应用.试题以解答题的形式呈现,难度为中等。此外,也可能出现在客观题中,此时试题难度不大,属中、低档题型。【核心知识】1.变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.(3)回归方程为=x+,其中=,=-.(4)相关系数当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:y1 y2 总计x1 a b a+bx2 c d c+d总计 a+c b+d a+b+c+d(2)K2统计量K2=(其中n=a+b+c+d为样本容量).【高频考点】高频考点一 相关关系的判断【例1】(1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关(2)某公司在2019年上半年的月收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:月份 1月份 2月份 3月份 4月份 5月份 6月份收入x 12.3 14.5 15.0 17.0 19.8 20.6支出y 5.63 5.75 5.82 5.89 6.11 6.18根据统计资料,则( )A.月收入的中位数是15,x与y有正线性相关关系B.月收入的中位数是17,x与y有负线性相关关系C.月收入的中位数是16,x与y有正线性相关关系D.月收入的中位数是16,x与y有负线性相关关系【方法技巧】判断相关关系的2种方法散点图法 如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系相关系数法 利用相关系数判定,当|r|越趋近于1时,相关性越强【变式探究】四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且=2.347x-6.423;②y与x负相关且=-3.476x+5.648;③y与x正相关且=5.437x+8.493;④y与x正相关且=-4.326x-4.578.其中一定不正确的结论的序号是( )A.①② B.②③C.③④ D.①④【答案】D 【解析】正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④.高频考点二 回归分析例2.某手机厂商在销售200万台某型号手机时开展“手机碎屏险”活动.活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x元.若在购机后一年内发生碎屏可免费更换一次屏幕.该手机厂商将在这200万台该型号手机全部销售完毕一年后,在购买碎屏险且购机后一年内未发生碎屏的用户中随机抽取1 000名,每名用户赠送1 000元的红包.为了合理确定保费x的值,该手机厂商进行了问卷调查,统计后得到下表(其中y表示保费为x元时愿意购买该“手机碎屏险”的用户比例):x 10 20 30 40 50y 0.79 0.59 0.38 0.23 0.01(1)根据上面的数据求出y关于x的回归直线方程;(2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为0.5%.已知更换一次该型号手机屏幕的费用为800元,若该手机厂商要求在这次活动中因销售该“手机碎屏险”产生的利润不少于70万元,能否把保费x定为5元?参考数据:表中x的5个值从左到右分别记为x1,x2,x3,x4,x5,相应的y值分别记为y1,y2,y3,y4,y5,经计算有 (xi-)(yi-)=-19.2,其中=xi,=yi.【变式探究】已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下表对应数据,根据表中数据可得回归方程=x+其中=11据此估计,当投入6万元广告费时,销售额约为( )x 1 2 3 4 5y 10 15 30 45 50A.60万元 B.63万元C.65万元 D.69万元高频考点三 独立性检验例3.(2023·全国高考)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品 二级品 合计甲机床 150 50 200乙机床 120 80 200合计 270 130 400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少 (2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异 附:0.050 0.010 0.001k 3.841 6.635 10.828【变式探究】(2020·全国卷Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次空气质量等级 [0,200] (200,400] (400,600]1(优) 2 16 252(良) 5 10 123(轻度污染) 6 7 84(中度污染) 7 2 0(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400 人次>400空气质量好空气质量不好附:K2=,P(K2≥k) 0.050 0.010 0.001k 3.841 6.635 10.828.【举一反三】在某次测验中,某班40名考生的成绩满分100分统计如图所示.(1)估计这40名学生的测验成绩的中位数x0(精确到0.1);(2)记80分以上为优秀,80分及以下为合格,结合频率分布直方图完成下表,并判断是否有95%的把握认为数学测验成绩与性别有关?合格 优秀 总计男生 16女生 4总计 40第48讲 变量相关性与统计案例【学科素养】1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程,凸显数学运算的核心素养.3.了解独立性检验的基本思想、方法及其应用,凸显数学建模、数据分析的核心素养.4.了解回归分析的基本思想、方法及其简单应用,凸显数学建模、数据分析的核心素养.【课标解读】1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系。2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。3.了解回归分析的思想、方法及其简单应用. 4.了解独立性检验的思想、方法及其初步应用。【备考策略】从近三年高考情况来看,本讲是高考中的一个热点考查内容.预测2022年将会考查:①回归直线方程的判断、求解及相关系数的意义,并用其解决实际问题;②独立性检验思想在实际问题中的应用.试题以解答题的形式呈现,难度为中等。此外,也可能出现在客观题中,此时试题难度不大,属中、低档题型。【核心知识】1.变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.(3)回归方程为=x+,其中=,=-.(4)相关系数当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:y1 y2 总计x1 a b a+bx2 c d c+d总计 a+c b+d a+b+c+d(2)K2统计量K2=(其中n=a+b+c+d为样本容量).【高频考点】高频考点一 相关关系的判断【例1】(1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关(2)某公司在2019年上半年的月收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:月份 1月份 2月份 3月份 4月份 5月份 6月份收入x 12.3 14.5 15.0 17.0 19.8 20.6支出y 5.63 5.75 5.82 5.89 6.11 6.18根据统计资料,则( )A.月收入的中位数是15,x与y有正线性相关关系B.月收入的中位数是17,x与y有负线性相关关系C.月收入的中位数是16,x与y有正线性相关关系D.月收入的中位数是16,x与y有负线性相关关系【解析】(1)由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图②的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.(2)月收入的中位数是=16,收入增加,支出增加,故x与y有正线性相关关系.【答案】(1)C (2)C【方法技巧】判断相关关系的2种方法散点图法 如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系相关系数法 利用相关系数判定,当|r|越趋近于1时,相关性越强【变式探究】四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且=2.347x-6.423;②y与x负相关且=-3.476x+5.648;③y与x正相关且=5.437x+8.493;④y与x正相关且=-4.326x-4.578.其中一定不正确的结论的序号是( )A.①② B.②③C.③④ D.①④【答案】D 【解析】正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④.高频考点二 回归分析例2.某手机厂商在销售200万台某型号手机时开展“手机碎屏险”活动.活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x元.若在购机后一年内发生碎屏可免费更换一次屏幕.该手机厂商将在这200万台该型号手机全部销售完毕一年后,在购买碎屏险且购机后一年内未发生碎屏的用户中随机抽取1 000名,每名用户赠送1 000元的红包.为了合理确定保费x的值,该手机厂商进行了问卷调查,统计后得到下表(其中y表示保费为x元时愿意购买该“手机碎屏险”的用户比例):x 10 20 30 40 50y 0.79 0.59 0.38 0.23 0.01(1)根据上面的数据求出y关于x的回归直线方程;(2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为0.5%.已知更换一次该型号手机屏幕的费用为800元,若该手机厂商要求在这次活动中因销售该“手机碎屏险”产生的利润不少于70万元,能否把保费x定为5元?参考数据:表中x的5个值从左到右分别记为x1,x2,x3,x4,x5,相应的y值分别记为y1,y2,y3,y4,y5,经计算有 (xi-)(yi-)=-19.2,其中=xi,=yi.【解析】(1)由=30,=0.4,(xi-)(yi-)=-19.2, (xi-)2=1 000,得==-0.019 2,=-=0.976,所以y关于x的回归直线方程为y=-0.019 2x+0.976.(2)能把保费x定为5元.理由如下:若保费x定为5元,则估计y=-0.019 2×5+0.976=0.88,估计该手机厂商在这次活动中因销售该“手机碎屏险”产生的利润为2 000 000×0.88×5-2 000 000×0.88×0.5%×800-1 000×1 000=0.76×106(元)=76(万元)>70(万元),所以能把保费x定为5元.【变式探究】已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下表对应数据,根据表中数据可得回归方程=x+其中=11据此估计,当投入6万元广告费时,销售额约为( )x 1 2 3 4 5y 10 15 30 45 50A.60万元 B.63万元C.65万元 D.69万元【答案】B 【解析】由表格数据可知==3,==30,因为回归方程过点(,),所以30=3+,且=11,得=-3,所以=11x-3,代入x=6,得=63,故选B.高频考点三 独立性检验例3.(2023·全国高考)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品 二级品 合计甲机床 150 50 200乙机床 120 80 200合计 270 130 400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少 (2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异 附:0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)75%;60%;(2)能.【解析】本题考查频率统计和独立性检验,属基础题,根据给出公式计算即可【解析】(1)甲机床生产的产品中的一级品的频率为,乙机床生产的产品中的一级品的频率为.(2),故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.【变式探究】(2020·全国卷Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次空气质量等级 [0,200] (200,400] (400,600]1(优) 2 16 252(良) 5 10 123(轻度污染) 6 7 84(中度污染) 7 2 0(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400 人次>400空气质量好空气质量不好附:K2=,P(K2≥k) 0.050 0.010 0.001k 3.841 6.635 10.828.【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:空气质量等级 1 2 3 4概率的估计值 0.43 0.27 0.21 0.09(2)一天中到该公园锻炼的平均人次的估计值为(100×20+300×35+500×45)=350.(3)根据所给数据,可得2×2列联表:人次≤400 人次>400空气质量好 33 37空气质量不好 22 8根据列联表得K2=≈5.820.由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.【举一反三】在某次测验中,某班40名考生的成绩满分100分统计如图所示.(1)估计这40名学生的测验成绩的中位数x0(精确到0.1);(2)记80分以上为优秀,80分及以下为合格,结合频率分布直方图完成下表,并判断是否有95%的把握认为数学测验成绩与性别有关?合格 优秀 总计男生 16女生 4总计 40【解析】(1)由频率分布直方图易知0.01×10+0.015×10+0.02×10=0.45,即分数在的频率为0.45,∴0.03×=0.5-0.45,解得x0=≈71.7,∴40名学生的测验成绩的中位数为71.7.(2)由频率分布直方图,可得列联表如下:合格 优秀 总计男生 16 6 22女生 14 4 18总计 30 10 40∴K2==≈0.135<3.841,故没有95%的把握认为数学测验成绩与性别有关. 展开更多...... 收起↑ 资源列表 (课标全国版)高考数学第一轮复习讲练测 第48讲 变量相关性与统计案例(练)原卷版+解析.docx (课标全国版)高考数学第一轮复习讲练测 第48讲 变量相关性与统计案例(讲)原卷版+解析.docx