第四十三讲 变量之间的相关关系及统计案例--文科数学高考复习 学案

资源下载
  1. 二一教育资源

第四十三讲 变量之间的相关关系及统计案例--文科数学高考复习 学案

资源简介

中小学教育资源及组卷应用平台
第四十三讲 变量之间的相关关系及统计案例
【考纲解读】
理解两个变量正相关,负相关和线性相关的定义,掌握判断两个变量正相关,负相关和线性相关的基本方法;
理解回归直线,回归方程的定义,掌握求两个线性相关变量回归方程的基本方法;
理解样本点中心,相关系数和回归分析的定义,掌握运用相关系数判断两个变量线性相关和回归分析的基本方法;
理解分类变量,列联表和独立性检验的定义,掌握独立性检验的基本方法。
【知识精讲】
一、两个向量的相关关系:
两个变量线性相关的概念:
(1)两个变量线性相关的定义:如果两个变量的散点图中点的分布从整体上看大致在一条 附近,则称这两个变量之间具有线性相关关系;
(2)两个变量正相关的定义:如果两个变量的散点图中,散点分布在从下到上 的区域,这样的两个变量的相关关系,称为正相关;
(3)两个变量负相关的定义:如果两个变量的散点图中,散点分布在从上到下的区域,这样的两个变量的相关关系,称为负相关。
2、回归方程:
(1)回归直线的定义:具有线性相关关系的两个变量散点图靠近的这条直线,称为回归直线;
(2)回归方程:方程=x+,称为具有线性相关关系的两个变量的一组数据(, ),(,),-------,(,)的回归方程;
(3)回归系数:回归方程中的待定系数,, 称为回归系数,且=,
=- 。
二、回归分析:
1、回归分析的定义:对具有线性相关关系的两个变量进行统计分析的方法,称为回归分析;
2、样本点的中心的定义:对具有线性相关关系两个变量的一组数据(, ),(,),-------,(,)的(其中=,
=),称为样本点的中心;
3、相关系数的定义:通过两个变量的一组对应值(, ),(,),-------,(,) 计算而得到并能判断两个变量是否相关的值,称为相关系数;
相关系数的计算公式为:r=;
4、运用相关系数判断两个变量是否相关的基本方法:①|r|越接近1,表明两个变量线性相关越强(一般|r|>0.75时,认为两个变量具有很强的线性相关关系),|r|越接近于0,表明两个变量之间越不具有线性相关关系;②r>0,表明两个变量正相关,r<0,表明两个变量负相关。
三、独立性检验:
1分类变量的定义:变量的不同值,表示个体所属的不同类别,这样的变量称为分类变量;
2、列联表:列出两个分类变量的频数表,称为列联表(一般是2x2列联表);
3、独立性检验:利用随机变量来判断两个分类变量是否相关的方法,称为独立性检验;
4、随机变量的计算:假设两个分类变量x和y,它们的可能取值分别为(, )和(,),其样本频數列联表(称为2x2列联表)为:
合计
a b a+b
c d c+d
合计 a+c b+d a+b+c+d
则= , 其中n=a+b+c+d为样本容量。
【探导考点】
考点1相关关系的判断:热点①已知线性回归方程,判断两个变量的相关关系;热点②已知两个变量的散点图,判断两个变量的相关关系;
考点2线性回归分析:热点①已知两个变量的一组数据,求线性回归方程并进行回归分析;热点②已知两个变量的散点图,求线性回归方程并进行回归分析;
考点3独立性检验:热点①已知分类变量的列联表的独立性检验;热点②没有分类变量列联表的独立性检验。
【典例解析】
【典例1】解答下列问题:
x和y的散点图如图所示,则下列说法中所有正确命题的序号为 。
①x,y是负相关关系;②在该相关关系中,若用 3000 .
Y=拟合时的相关系数的平方为,用= 2500 .
x+拟合时的相关系数的平方为,则>; 2000 .
③x,y之间不能建立线性回归方程。 1500 .
1000 .
500 . . . . .
0 1 2 3 4 5 6 7 8 9 10 x
2、四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归方程,分别得到以下四个结论:①y与x负相关,且=2.347x-6.423;②y与x负相关,且=-3.476x+5.648;
③y与x正相关,且=5.437x+8.493;④y与x正相关,且=-4.326x-4.578。其中一定不正确的结论的序号是( )(2013全国高考湖北卷)
A ①② B ②③ C ③④ D ①④
『思考问题1』
(1)【典例1】相关关系的判断问题,解答这类问题需要理解两个变量具有相关关系的定义,掌握判断两个变量是否具有相关关系的基本方法;
(2)判断两个变量是否具有相关关系的基本方法是:① 图法,② 系数法;
(3)散点图法的基本步骤是:①根据两个变量的一组对应值作出 图,②运用散点图得出结论;
(4)相关系数法的基本步骤是:①根据两个变量的一组对应值运用公式计算 系数的值,
②由计算结果得出结论;
(5)判断两个变量是正相关还是负相关的基本方法是:① 图法,② 系数法,③运用线性回归方程=x+中的系数,若 0,为正相关;若 0为负相关。
〔练习1〕解答下列问题:
(1)在一组样本数据,,-----,(n2,,,------,不全相等)的散点图中,所有的样本点(,)(i=1,2,-------,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A -1 B 0 C D 1
(2)变量x与y相对应的一组数据为(10,1),(11,3.2),(11.8,3),(12.5,4),(13,5);变量u与v相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1). 表示变量y与x的线性相关系数,表示变量v与u的线性相关系数,则( )
A <<0 B 0<< C <0< D =
【典例2】解答下列问题:
1、某车间为了制定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到
的数据如下: y
零件的个数x(个) 2 3 4 5 5
加工的时间y(小时)2.5 3 4 4.5 4
(1)在给定的坐标系中画出表中数据的散点图; 3
(2)求出y关于x的线性回归方程=x+, 2
并在坐标系中画出回归直线; 1
试预测加工10个零件需要多少小时?注: 0 1 2 3 4 5 x
=,=- ;
2、下图 是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(注:年代代码1—7分别对应年份2008—2014)。
(1)曲线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程,(系数精确到0.01),预测2016年我国生活垃圾无害化处理量(2016全国高考新课标III卷)
附注:参考数据:=9.32,=40.17,=0.55,2.56;
参考公式:相关系数 , 回归方程=x+中斜率和截距的最小二乘估计公式分别为:
r=,=,=- ;
『思考问题2』
(1)【典例2】是与线性回归方程和线性回归分析相关的问题,解答这类问题需要理解线性回归方程,线性回归分析的定义,掌握线性回归方程的求法和线性回归分析的方法;
(2)线性回归方程的求法是:①判断两个变量是否具有线性相关关系,②运用公式:
=, =- 求出回归系数,(也可以用待定系数法,即根据回归直线过样本点的中心求系数,),③写出回归直线方程;
(3)回归分析及回归预测的基本方法是,依据回归直线方程视为变量y是变量x(或t)的一次函数,将变量x(或t)的值代入回归直线方程求出变量y的值。
〔练习2〕解答下列问题:
(1)已知x,y的取值如下表: x 0 1 4 5 6 8
从所得散点图中分析可知y与x线性相关, y 1.3 1.8 5.6 6.1 7.4 9.3
且=0.95x+,则x=13时,y等于( )(2016湖南师大附中月考)
A 1.45 B 13.8 C 13 D 12.8
(2)某产品的广告费支出x与销售额y x 2 4 5 6 8
(单位:万元)之间有如下对应数据: y 30 40 60 50 70
①画出散点图;
②求线性回归方程;
③试预测广告费支出为10万元时,销售额多大?
【典例3】解答下列问题:
为调查某地区老年人是否需要志愿者提供帮助, 性别 男 女
用简单随机抽样方法从该地区调查了500位老年人,是否需要志愿者
结果如下: 需要 40 30
(1)估计该地区老年人中,需要志愿者提供帮助 不需要 160 270
的老年人的比例;
(2)能否有99.5%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由。
2、某大型企业人力资源部为了研究企业员工工作的积极性和对待企业改革的态度的关系,随机抽取了100名员工进行调查,其中支持企业改革的调查者中工作积极的有46人,工作一般的有35人,而不太赞成企业改革的调查者中,工作积极有4人,工作一般有15人。
(1)根据以上数据建立一个2x2列联表;
(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的态度与其工作积极性有关?
参考公式:= , 其中n=a+b+c+d为样本容量。
P( ≥)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
『思考问题3』
(1)【典例3】是独立性检验的问题,解答这类问题需要理解分类变量,独立性检验的定义,了解2x2列联表的意义,掌握独立性检验的基本方法;
(2)比较两个分类变量是否有关的基本方法是:①计算的值进行判断,越大两个分类变量有关的可能性越大;②计算|ad-bc|的值进行判断,|ad-bc|越大两个分类变量有关的可能性越大;
(3)独立性检验的基本方法是:①根据样本数据制成2x2列联表,②运用公式=
计算的观察值,③比较与临界值的大小,作出推断。
〔练习3〕解答下列问题:
(1)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班
各抽取20名同学参加环保知识测试,统计得到成绩与专业的列联表:
优秀 非优秀 合计 ②独立性检验临界值表:
A班 14 6 20 P( ≥) 0.050 0.010
B班 7 13 20 3.841 6.635
合计 21 19 40
附:参考公式及数据:
①统计量:= (其中n=a+b+c+d为样本容量);
则下列说法正确的是( )(2017泰安月考)
A 有99%的把握认为环保知识测试成绩与专业有关 B有99%的把握认为环保知识测试成绩与专业无关C有95%的把握认为环保知识测试成绩与专业有关D有95%的把握认为环保知识测试成绩与专业无关
(2)2016年9月20日是第28个全国爱牙日,为了迎接此节日,某地区卫生部门成立了调查小组,调查“常吃零食与患龋齿的关系”,对该地区小学六年级800名学生进行检查,按患龋齿和不患龋齿分类,并汇总数据,不常吃零食且不患龋齿的学生有60名,常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有140名。
①能否在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系?
②4名卫生部门的工作人员随机分成两组,每组2人,一组负责数据收集,另一组负责数据处理,求工作人员甲分到收集数据组,工作人员乙分到处理数据组的概率。
附:= P( ≥)0.010 0.005 0.001
(其中n=a+b+c+d为样本容量) 6.635 7.879 10.828
(2013全国高考湖北卷)
【考题演练】
【典例4】解答下列问题:
1、在某大学一食品超市,随机询问了70名不同性别 女 男 总计
的大学生在购买食物时是否查看营养说明,得到如下 要查看营养说明 15 25 40
的列联表:根据列联表的独立性检验,则下列说法正 不查看营养说明 20 10 30
确的是( )(成都市2019级高三三珍) 总计 35 35 70
A 在犯错误的概率不超过0.05的前提下,认为该校大学生在购买食物时要查看营养说明的人数中男生人数更多 B在犯错误的概率不超过0.010的前提下,认为该校大学生在购买食物时要查看营养说明的人数与不查看营养说明的人数比是 C 在犯错误的概率不超过0.025的前提下,认为性别与是否查看营养说明有关 D 在犯错误的概率不超过0.010的前提下,认为性别与是否查看营养说明有关附:=其中n=a+b+c+d。
P() 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005
0.455 0.708 1.323 2.702 2.706 3.841 5.024 6.635 7.879
2、某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同温度条件下进行种子发芽率实验,由实验数据(,)(i=1,2------,20)得到如下散点图:由此散点图,在10至40之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型是( )(2020全国高考新课标I)
A y=a+bx B y=a+b C y=a+b D y=a+blnx
3、某实验室对小白鼠体内x,y两项指标进行 小白鼠体内x 120 110 125 130 115
研究,连续五次实验所测得的这两项指标数据如 小白鼠体内y 92 83 90 96 89
表所示,已知y与x具有线性相关关系,利用表中数据求得回归直线方程为=x+,若下一次实验中x=170,利用该回归直线方程预测得=117,则的值为 (成都市2020高三三诊)
4、某公司一种新产品的销售额y与宣传费用 x(单位:万元) 0 1 2 3 4
x之间的关系如右表:
一种销售额y与宣传费用x具有线性相关关系, y(单位:万元) 10 15 20 30 35
并求得其回归直线方程为=x+9,则的值为 (2020成都市高三零诊)
5、某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在
20个不同的温度条件下进行种子发芽实验,由实验数据(,)(i=1,2,------,20)得到如图所示的散点图。由此散点图,在10至40直角,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A y=a+bx B y=a+b C y=a+b D y=a+blnx
6、某实验室对小白鼠体内x,y两项指标进行研究, x 120 110 125 130 115
连续5次实验所测得的这两项指标数据如下表: y 92 83 90 96 89
已知y与x具有线性相关关系,利用上表中的五组数据求得回归直线方程为=x+,
若下一次实验中x=170,利用该回归直线方程预测得=117,则的值为 (2020成都市高三三诊)
7、某汽车销售公司统计了某款汽车行驶里程x 行驶里程x 1 2 4 5 8
(万公里)与维修保养费用y(万元)数据,并(单位:万公里)
根据这五组数据求得y与x的线性回归方程为 维修保养费用 0.50 0.90 2.30 2.70
EMBED Equation.DSMT4 =0.46x+0.16。由于疏忽,行驶8万公里的数 y(单位:万元)
据被污损了。如右表所示。则被污损的数据为( )(2019成都市高三零诊)
A 3.20 B 3.60 C 3.76 D 3.84
8、环保部门研究发现某地的PM10浓度与车流量之间有线性相关关系,现采集到该地一周内车流量x与PM10浓度y的数据如下表:
(1)在如图所示的坐标系中作出表中数据的散点图;
(2)根据表中统计数据,求出线性回归方程=x+(计算时精确到0.01,计算时精确到0.01);
(3)为净化空气,该地决定下周起在工作日(2019年2月11日 星期一至星期五)限号,假设限号时每个工作日的车流量为表中对应工作日的,试预测下周星期三的PM10浓度(精确到0.1)(2018—2019成都市高二上期调研考试)
『思考问题4』
【典例4】是近几年高考(或高三诊断考试或高二期末考试)试卷中关于变量之间相关关系问题的试题,归结起来主要包括:①变量相关关系的判断;②线性回归分析;③独立性检验等几种类型;
解答变量之间相关关系问题的基本方法是:①归结问题结构特征判断问题所属类型;②运用解答该类型问题的解题思路和基本方法对问题实施解答;③得出解答问题的结果。
〔练习4〕解答下列问题:
1、空气质量指数AQI是检测空气质量的重要参数,其数值越大说明空气污染状况月严重,空气质量越差。某地环保部门统计了该地区12月1日至12月24日连续24天的空气质量指数AQI,根据得到的数据绘制出如图所示的折线图,则下列说法错误的是( )(2018成都市高三一诊)
A该地区在12月2日空气质量最好 B该地区在12月24日空气质量最差 C该地区从122、月7日到12月12日AQI持续增大 D该地区的空气质量指数AQI与这段日期成负相关
2、2017年3月15日,某物价部门对本市5家商场某商品一天的销售额及其价格进行调查,5家商场的价格x与销售额y之间的一组数据如下表所示:
价格x(单位:元) 8 9.5 10 10.5 12
销售额y(单位:千元) 12 10 8 6 4
由散点图可知,销售额y与价格x之间有较好的线性相关关系,且回归方程是=-3.2x+,
则=( )(2017—2018成都市高二上期质量检测)
A -24 B 35.6 C 40 D 40.5
3、具有线性相关关系的变量x,y满足 x 0 1 2 3
一组数据如下表所示:若y与x的线性 y -1 1 m 8
回归方程为=3x-,则m的值是( )(2016衡水质检)
A 4 B C 5 D 6
4、已知一组变量x,y的取值如下表: x 0 1 4 5 6 8
从所得散点图中分析可知,y与x线性相关, y 1.3 1.8 5.6 6.1 7.4 9.3
且=0.95x+,则x=13时,y等于( )(2015湖南师大附中月考)
A 1.45 B 13.8 C 13 D 12.8
5、给出以下四个命题:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位;④对分类变量X与Y的随机变量的观察值k来说,k越小,“X与Y有关系”的把握程度越大。其中正确命题的序号是 ;
6、对具有线性相关关系的变量x,y有一组观测数据(,)(i=1,2,-----8),其线性回归方程=x+,且++-------+=2(++----+)=6,则实数的值是
(2016郑州模拟)
7、(理)海水养殖场进行某水产品的新,旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99℅的把握认为箱产量与养殖方法有关;
箱产量<50kg 箱产量50kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
(文)(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99℅的把握认为箱产量与养殖方法有关;
箱产量<50kg 箱产量50kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优 进行比较(2017全国高考新课标II卷)
附: ,=
8、某医疗科研项目对5只小白鼠体内的A,B两项指标数据进行收集和分析,得到的数据如下表:
指标 1号小白鼠 2号小白鼠 3号小白鼠 4号小白鼠 5号小白鼠
A 5 7 6 9 8
B 2 2 3 4 4
(1)若通过数据分析,得知A项指标数据与B项指标数据具有线性相关关系,试根据上表,求B项指标数据y关于A项指标数据x的线性回归方程=x+;
(2)现要从这5只小白鼠中随机抽取3只,求其中至少有一只B项指标数据高于3的概率(2018成都市高三零诊)
参考公式: == ,= -)。
9、某项科研活动共进行了5次试验,其数据如下表所示:
(1)从5次特征量y的试验数据中,随机地抽取两个数据,求至少有一个大于600的概率;
特征量 第一次 第二次 第三次 第四次 第五次
X 555 559 551 563 552
y     601   605  597   599   598
(2)求特征量y关于x的线性回归方程=x+,并预测当特征量x为570时特征量y的值(2017成都市高三二诊)
(附:线性回归方程=x+中的和的最小二乘法估计公式分别为:= ,= -)
第四十三讲 变量之间的相关关系及统计案例
【考纲解读】
1.理解两个变量正相关,负相关和线性相关的定义,掌握判断两个变量正相关,负相关和线性相关的基本方法;
2.理解回归直线,回归方程的定义,掌握求两个线性相关变量回归方程的基本方法;
3.理解样本点中心,相关系数和回归分析的定义,掌握运用相关系数判断两个变量线性相关和回归分析的基本方法;
4.理解分类变量,列联表和独立性检验的定义,掌握独立性检验的基本方法。
【知识精讲】
一、两个向量的相关关系:
两个变量线性相关的概念:
(1)两个变量线性相关的定义:如果两个变量的散点图中点的分布从整体上看大致在一条 附近,则称这两个变量之间具有线性相关关系;
(2)两个变量正相关的定义:如果两个变量的散点图中,散点分布在从下到上 的区域,这样的两个变量的相关关系,称为正相关;
(3)两个变量负相关的定义:如果两个变量的散点图中,散点分布在从上到下的区域,这样的两个变量的相关关系,称为负相关。
2、回归方程:
(1)回归直线的定义:具有线性相关关系的两个变量散点图靠近的这条直线,称为回归直线;
(2)回归方程:方程=x+,称为具有线性相关关系的两个变量的一组数据(, ),(,),-------,(,)的回归方程;
(3)回归系数:回归方程中的待定系数,, 称为回归系数,且=,
=- 。
二、回归分析:
1、回归分析的定义:对具有线性相关关系的两个变量进行统计分析的方法,称为回归分析;
2、样本点的中心的定义:对具有线性相关关系两个变量的一组数据(, ),(,),-------,(,)的(其中=,
=),称为样本点的中心;
3、相关系数的定义:通过两个变量的一组对应值(, ),(,),-------,(,) 计算而得到并能判断两个变量是否相关的值,称为相关系数;
相关系数的计算公式为:r=;
4、运用相关系数判断两个变量是否相关的基本方法:①|r|越接近1,表明两个变量线性相关越强(一般|r|>0.75时,认为两个变量具有很强的线性相关关系),|r|越接近于0,表明两个变量之间越不具有线性相关关系;②r>0,表明两个变量正相关,r<0,表明两个变量负相关。
三、独立性检验:
1分类变量的定义:变量的不同值,表示个体所属的不同类别,这样的变量称为分类变量;
2、列联表:列出两个分类变量的频数表,称为列联表(一般是2x2列联表);
3、独立性检验:利用随机变量来判断两个分类变量是否相关的方法,称为独立性检验;
4、随机变量的计算:假设两个分类变量x和y,它们的可能取值分别为(, )和(,),其样本频數列联表(称为2x2列联表)为:
合计
a b a+b
c d c+d
合计 a+c b+d a+b+c+d
则= , 其中n=a+b+c+d为样本容量。
【探导考点】
考点1相关关系的判断:热点①已知线性回归方程,判断两个变量的相关关系;热点②已知两个变量的散点图,判断两个变量的相关关系;
考点2线性回归分析:热点①已知两个变量的一组数据,求线性回归方程并进行回归分析;热点②已知两个变量的散点图,求线性回归方程并进行回归分析;
考点3独立性检验:热点①已知分类变量的列联表的独立性检验;热点②没有分类变量列联表的独立性检验。
【典例解析】
【典例1】解答下列问题:
x和y的散点图如图所示,则下列说法中所有正确命题的序号为 。
①x,y是负相关关系;②在该相关关系中,若用 3000 .
Y=拟合时的相关系数的平方为,用= 2500 .
x+拟合时的相关系数的平方为,则>; 2000 .
③x,y之间不能建立线性回归方程。 1500 .
1000 .
500 . . . . .
0 1 2 3 4 5 6 7 8 9 10 x
【解析】
【知识点】①随机变量散点图的定义与性质;②随机变量相关的定义与性质;③相关系数的定义与求法;④判断随机变量相关的基本方法。
【解题思路】(1)运用变量相关的性质和判断变量相关的基本方法,结合变量散点图,对各结论的真假进行判断就可得出结果。
【详细解答】从x和y的散点图可知,变量y岁变量x的增大而减小,图中的点没有分布在一条直线附近,①③正确,拟合时的相关系数越大,表明这种拟合越合理,②正确,即:下列说法中所有正确命题的序号为①②③。
2、四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归方程,分别得到以下四个结论:①y与x负相关,且=2.347x-6.423;②y与x负相关,且=-3.476x+5.648;
③y与x正相关,且=5.437x+8.493;④y与x正相关,且=-4.326x-4.578。其中一定不正确的结论的序号是( )
A ①② B ②③ C ③④ D ①④
【解析】
【知识点】①随机变量线性相关的定义与性质;②回归方程的定义与性质;③判断随机变量相关的基本方法。
【解题思路】运用变量相关的性质和判断变量相关的基本方法,结合变量散点图,对各结论的真假进行判断就可得出结果。
【详细解答】由=2.347x-6.423知,变量y与x正相关,①错误;由=-3.476x+5.648知,变量y与x负相关,②正确;由=5.437x+8.493知,变量y与x正相关,③正确;由=-4.326x-4.578知,变量y与x负相关,④错误,即其中一定不正确的结论的序号是①④,D正确,选D。
『思考问题1』
(1)【典例1】相关关系的判断问题,解答这类问题需要理解两个变量具有相关关系的定义,掌握判断两个变量是否具有相关关系的基本方法;
(2)判断两个变量是否具有相关关系的基本方法是:① 图法,② 系数法;
(3)散点图法的基本步骤是:①根据两个变量的一组对应值作出 图,②运用散点图得出结论;
(4)相关系数法的基本步骤是:①根据两个变量的一组对应值运用公式计算 系数的值,
②由计算结果得出结论;
(5)判断两个变量是正相关还是负相关的基本方法是:① 图法,② 系数法,③运用线性回归方程=x+中的系数,若 0,为正相关;若 0为负相关。
〔练习1〕解答下列问题:
(1)在一组样本数据,,-----,(n2,,,------,不全相等)的散点图中,所有的样本点(,)(i=1,2,-------,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )(答案:D)
A -1 B 0 C D 1
(2)变量x与y相对应的一组数据为(10,1),(11,3.2),(11.8,3),(12.5,4),(13,5);变量u与v相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1). 表示变量y与x的线性相关系数,表示变量v与u的线性相关系数,则( )(答案:C)
A <<0 B 0<< C <0< D =
【典例2】解答下列问题:
1、某车间为了制定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到
的数据如下: y
零件的个数x(个) 2 3 4 5 5
加工的时间y(小时)2.5 3 4 4.5 4
(1)在给定的坐标系中画出表中数据的散点图; 3
(2)求出y关于x的线性回归方程=x+, 2
并在坐标系中画出回归直线; 1
(3)试预测加工10个零件需要多少小时?注: 0 1 2 3 4 5 x
=,=- ;
【解析】
【知识点】①线性回归方程的定义与性质;②随机变量散点图的定义与作法;③求线性回归方程的基本方法;④统计预测的基本方法。
【解题思路】(1)运用作随机变量散点图的基本方法就可作出表中数据的散点图;(2)根据公式求出,的值就可得到随机变量y关于x的线性回归方程,从而由回归方程作出回归直线;(3)把x=10代入线性回归方程求出的值就可预测加工10个零件需要的时间。
【详细解答】(1)在给定的坐标系中描出相应的点,得到表中数据的散点图如图所示;(2)===0.7,=-0.7=1.05,随机变量y关于x的线性回归方程为:=0.7x+1.05,在坐标系中画出回归直线如图所示;(3)当x=10时,=0.710+1.05=8.05(小时),预测加工10个零件需要8.05小时。
2、下图 是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(注:年代代码1—7分别对应年份2008—2014)。
(1)曲线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程,(系数精确到0.01),预测2016年我国生活垃圾无害化处理量(2016全国高考新课标III卷)
附注:参考数据:=9.32,=40.17,=0.55,2.56;
参考公式:相关系数 , 回归方程=x+中斜率和截距的最小二乘估计公式分别为:
r=,=,=- ;
【解析】
【知识点】①线性回归方程的定义与性质;②随机变量折线图的定义与性质;③随机变量相关系数的定义与求法;④求线性回归方程的基本方法;⑤统计预测的基本方法。
【解题思路】(1)运用随机变量相关系数计算公式求出随机变量y关于t的相关系数的值,从而说明可用线性回归模型拟合随机变量y关于t的关系;(2)根据公式求出,的值就可得到随机变量y关于t的线性回归方程,把t=9代入线性回归方程求出的值就可预测2016年我国生活垃圾无害化处理量。
【详细解答】(1)==4,=1.331,
=-7=40.17-741.3312.902,==2,r=0.99,随机变量y关于t的相关系数约为0.99,接近1,可用线性回归模型拟合随机变量y与t的关系;(2)=0.103,1.331-0.10340.92,
随机变量y关于t的线性回归方程为:=0.103x+0.92,当t=9时,0.1039+0.92
1.82,预测2016年我国生活垃圾无害化处理量为1.82亿吨。
『思考问题2』
(1)【典例2】是与线性回归方程和线性回归分析相关的问题,解答这类问题需要理解线性回归方程,线性回归分析的定义,掌握线性回归方程的求法和线性回归分析的方法;
(2)线性回归方程的求法是:①判断两个变量是否具有线性相关关系,②运用公式:
=, =- 求出回归系数,(也可以用待定系数法,即根据回归直线过样本点的中心求系数,),③写出回归直线方程;
(3)回归分析及回归预测的基本方法是,依据回归直线方程视为变量y是变量x(或t)的一次函数,将变量x(或t)的值代入回归直线方程求出变量y的值。
〔练习2〕解答下列问题:
1、已知x,y的取值如下表: x 0 1 4 5 6 8
从所得散点图中分析可知y与x线性相关, y 1.3 1.8 5.6 6.1 7.4 9.3
且=0.95x+,则x=13时,y等于( )(答案:B)
A 1.45 B 13.8 C 13 D 12.8
2、某产品的广告费支出x与销售额y x 2 4 5 6 8
(单位:万元)之间有如下对应数据: y 30 40 60 50 70
(1)画出散点图; y
(2)求线性回归方程; 70 .
(3)试预测广告费支出为10万元时,销售额多大? 60 .
(答案:(1)变量散点图如图所示: 50 .
(2)线性回归方程为=6.5x+17.5; 40 .
(3)若广告费支出为10万元时,则销售额为82.5万元)30 .
【典例3】解答下列问题: 0 2 4 5 6 8 x
1、为调查某地区老年人是否需要志愿者提供帮助, 性别 男 女
用简单随机抽样方法从该地区调查了500位老年人,是否需要志愿者
结果如下: 需要 40 30
(1)估计该地区老年人中,需要志愿者提供帮助 不需要 160 270
的老年人的比例;
(2)能否有99.5%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由。
【解析】
【知识点】①分类变量的定义与性质;②列联表的定义与性质;③独立性检验的定义与性质;④独立性检验的基本方法;⑤分层抽样的定义与基本方法。
【解题思路】(1)运用点估计的基本方法,结合列联表就可估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)根据列联表,运用公式求出的值就可得出结论;(3)根据(2)中的结论可知老年人中,需要志愿者提供帮助与性别有关,结合分层抽样的特征应该选用分层抽样的方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例。【详细解答】(1)调查的500人,需要志愿者提供帮助的人数为40+30=70(人),一般中需要志愿者提供帮助的老年人的比例为=,即估计该地区老年人中,需要志愿者提供帮助的老年人的比例为;(2) ==9.967>6.635,有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关;(3)由(2)知该地区的老年人是否需要志愿者提供帮助与性别有关,并且从表中可以看出该地区老年人中需要志愿者提供帮助的男性老年人与女性老年人有比较明显的差异,调查时应该先确定该地区老年人的男女比例,再把老年人分成男女两个群体,采用分层抽样的方法比简单随机抽样的方法会更好。
2、某大型企业人力资源部为了研究企业员工工作的积极性和对待企业改革的态度的关系,随机抽取了100名员工进行调查,其中支持企业改革的调查者中工作积极的有46人,工作一般的有35人,而不太赞成企业改革的调查者中,工作积极的有4人,工作一般的有15人。
(1)根据以上数据建立一个2x2列联表;
(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的态度与其工作积极性有关?
参考公式:= , 其中n=a+b+c+d为样本容量。
P( ≥)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
【解析】
【知识点】①分类变量的定义与性质;②列联表的定义与性质;③独立性检验的定义与性质;④独立性检验的基本方法。
【解题思路】(1)运用列联表的性质,结合问题条件就可得出2x2列联表;(2)根据2x2列联表,运用公式求出的值就可得出结论。
【详细解答】(1)支持企业改革的调查者中工作积极的有46人,工作一般的有35人,不太赞成企业改革的调查者中,工作积极的有 工作积极 工作一般 合计
4人,工作一般的有15人,个2x2列联表如 支持 46 35 81
表所示;(2) ==7.602, 不赞成 4 15 19
7.602>6.635,有99%的把握认为企业的全体员 合计 50 50 100
工对待企业改革的态度与其工作积极性有关。
『思考问题3』
(1)【典例3】是独立性检验的问题,解答这类问题需要理解分类变量,独立性检验的定义,了解2x2列联表的意义,掌握独立性检验的基本方法;
(2)比较两个分类变量是否有关的基本方法是:①计算的值进行判断,越大两个分类变量有关的可能性越大;②计算|ad-bc|的值进行判断,|ad-bc|越大两个分类变量有关的可能性越大;
(3)独立性检验的基本方法是:①根据样本数据制成2x2列联表,②运用公式= 计算的观察值,③比较与临界值的大小,作出推断。
〔练习3〕解答下列问题:
1、为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试,统计得到成绩与专业的列联表:
优秀 非优秀 合计 ②独立性检验临界值表:
A班 14 6 20 P( ≥) 0.050 0.010
B班 7 13 20 3.841 6.635
合计 21 19 40
附:参考公式及数据:
①统计量:= (其中n=a+b+c+d为样本容量);
则下列说法正确的是( )(2017泰安月考)(答案:C)
A 有99%的把握认为环保知识测试成绩与专业有关 B有99%的把握认为环保知识测试成绩与专业无关C有95%的把握认为环保知识测试成绩与专业有关D有95%的把握认为环保知识测试成绩与专业无关
2、2016年9月20日是第28个全国爱牙日,为了迎接此节日,某地区卫生部门成立了调查小组,调查“常吃零食与患龋齿的关系”,对该地区小学六年级800名学生进行检查,按患龋齿和不患龋齿分类,并汇总数据,不常吃零食且不患龋齿的学生有60名,常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有140名。
(1)能否在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系?
(2)4名卫生部门的工作人员随机分成两组,每组2人,一组负责数据收集,另一组负责数据处理,求工作人员甲分到收集数据组,工作人员乙分到处理数据组的概率。
附:= P( ≥)0.010 0.005 0.001
(其中n=a+b+c+d为样本容量) 6.635 7.879 10.828
(答案:(1)能在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系;(2)工作人员甲分到收集数据组,工作人员乙分到处理数据组的概率为)
【考题演练】
【典例4】解答下列问题:
1、在某大学一食品超市,随机询问了70名不同性别 女 男 总计
的大学生在购买食物时是否查看营养说明,得到如下 要查看营养说明 15 25 40
的列联表:根据列联表的独立性检验,则下列说法正 不查看营养说明 20 10 30
确的是( )(成都市2019级高三三珍) 总计 35 35 70
A 在犯错误的概率不超过0.05的前提下,认为该校大学生在购买食物时要查看营养说明的人数中男生人数更多 B在犯错误的概率不超过0.010的前提下,认为该校大学生在购买食物时要查看营养说明的人数与不查看营养说明的人数比是 C 在犯错误的概率不超过0.025的前提下,认为性别与是否查看营养说明有关 D 在犯错误的概率不超过0.010的前提下,认为性别与是否查看营养说明有关附:=其中n=a+b+c+d。
P() 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005
0.455 0.708 1.323 2.702 2.706 3.841 5.024 6.635 7.879
【解析】
【考点】①分类变量定义与性质;②列联表定义与性质;③独立性检验定义与性质;④随机变量计算公式及运用;⑤判断两个分类变量是否相关的基本方法。
【解题思路】根据分类变量,列联表和独立性检验的性质,运用计算随机变量的公式,结合问题条件求出随机变量的值,利用判断两个分类变量是否相关的基本方法,对该校大学生购买食物时,性别与是否查看营养说明的相关关系进行判断就可得出选项。
【详细解答】===5.833,5.024<5.833<6.635在犯错误的概率不超过0.025的前提下,认为性别与是否查看营养说明有关, C正确,选C。
2、某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同温度条件下进行种子发芽率实验,由实验数据(,)(i=1,2------,20)得到如下散点图:由此散点图,在10至40之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型是( )(2020全国高考新课标I)
A y=a+bx B y=a+b C y=a+b D y=a+blnx
【解析】
【考点】①随机变量相关关系定义与性质;②随机变量散点图及运用;③回归方程定义与性
质;④根据随机变量散点图求回归方程的基本方法。
【解题思路】根据随机变量相关关系的性质和随机变量散点图,运用根据随机变量散点图求回归方程的基本方法,确定出发芽率y和温度x的回归方程的类型就可得出选项。
【详细解答】发芽率y和温度x散点图可知,实验数据(,)(i=1,2------,20)的点分布在对数函数图像的附近,最适宜作为发芽率y和温度x的回归方程类型是y=a+blnx,D正确,选D。
3、某实验室对小白鼠体内x,y两项指标进行 小白鼠体内x 120 110 125 130 115
研究,连续五次实验所测得的这两项指标数据如 小白鼠体内y 92 83 90 96 89
表所示,已知y与x具有线性相关关系,利用表中数据求得回归直线方程为=x+,若下一次实验中x=170,利用该回归直线方程预测得=117,则的值为 (成都市2020高三三诊)
【解析】
【考点】①线性相关的定义与性质;②求回归直线方程的基本方法;③利用回归直线方程进行预测的基本方法。
【解题思路】根据线性相关的性质和求回归直线方程的基本方法,结合问题条件得到关于的方程,求解方程就可求出的值。
【详细解答】回归直线方程为=x+,当x=170,利用该回归直线方程预测得=117,
= =120,= =90,=-=90
-120,117=170+90-120,即:=0.54。
4、某公司一种新产品的销售额y与宣传费用 x(单位:万元) 0 1 2 3 4
x之间的关系如右表:
一种销售额y与宣传费用x具有线性相关关系, y(单位:万元) 10 15 20 30 35
并求得其回归直线方程为=x+9,则的值为 (2020成都市高三零诊)
【解析】
【考点】①线性相关关系的定义与性质;②线性回归方程的定义与性质;③求线性回归方程的基本方法。
【解题思路】运用线性回归方程的性质和求线性回归方程的基本方法,结合问题条件通过运算就可求出回归系数的值。
【详细解答】==2,==22,=-,
====6.5。
5、某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在
20个不同的温度条件下进行种子发芽实验,由实验数据(,)(i=1,2,------,20)得到如图所示的散点图。由此散点图,在10至40直角,下面四个回归方程类型中最适
宜作为发芽率y和温度x的回归方程类型的是( )(2020成都市高三二诊)
A y=a+bx B y=a+b C y=a+b D y=a+blnx
【解析】
【考点】①变量相关关系定义与性质;②变量散点图及运用;③对数函数定义与性质。
【解题思路】根据变量相关关系的性质,运用变量散点图和对数函数的性质,结合问题条件确定出最适宜作为发芽率y和温度x的回归方程,就可得出选项。
【详细解答】变量散点图分布在对数函数图像的附近,最适宜作为发芽率y和温度x的回归方程应该是对数函数解析式,D正确,选D。
6、某实验室对小白鼠体内x,y两项指标进行研究, x 120 110 125 130 115
连续5次实验所测得的这两项指标数据如下表: y 92 83 90 96 89
已知y与x具有线性相关关系,利用上表中的五组数据求得回归直线方程为=x+,若下一次实验中x=170,利用该回归直线方程预测得=117,则的值为 (2020成都市高三三诊)
【解析】
【考点】①线性相关的定义与性质;②求回归直线方程的基本方法;③利用回归直线方程进行预测的基本方法。
【解题思路】根据线性相关的性质和求回归直线方程的基本方法,结合问题条件得到关于的方程,求解方程就可求出的值。
【详细解答】回归直线方程为=x+,当x=170,利用该回归直线方程预测得=117,
= =120,= =90,=-=90
-120,117=170+90-120,即:=0.54。
7、某汽车销售公司统计了某款汽车行驶里程x 行驶里程x 1 2 4 5 8
(万公里)与维修保养费用y(万元)数据,并(单位:万公里)
根据这五组数据求得y与x的线性回归方程为 维修保养费用 0.50 0.90 2.30 2.70
EMBED Equation.DSMT4 =0.46x+0.16。由于疏忽,行驶8万公里的数 y(单位:万元)
据被污损了。如右表所示。则被污损的数据为( )(2019成都市高三零诊)
A 3.20 B 3.60 C 3.76 D 3.84
【解析】
【考点】①平均数的定义与基本求法;②线性回归方程的定义与求法;③求线性回归方程的基本方法。
【解题思路】根据平均数的基本求法,结合问题条件求出,的值,运用求线性回归方程的基本方法得到关于污损数据的方程,求解方程求出污损数据就可得出选项。
【详细解答】==4,=,=
0.16=-=-0.464,=0.16+0.464=2.00,
=2.005=10.00,=10.00-(0.50+0.90+2.30+2.70)=10.00-6.40=3.60,B正确,选B。
8、环保部门研究发现某地的PM10浓度与车流量之间有线性相关关系,现采集到该地一周内车流量x与PM10浓度y的数据如下表:
(1)在如图所示的坐标系中作出表中数据的散点图;
(2)根据表中统计数据,求出线性回归方程=x+(计算时精确到0.01,计算时精确到0.01);
(3)为净化空气,该地决定下周起在工作日(2019年2月11日 星期一至星期五)限号,假设限号时每个工作日的车流量为表中对应工作日的,试预测下周星期三的PM10浓度(精确到0.1)(2018—2019成都市高二上期调研考试)
【解析】
【考点】①线性相关定义与性质;②作数据散点图的基本方法;③线性回归方程定义与求法;④求线性回归方程的基本方法;⑤统计预测的基本方法。
【解题思路】(1)根据表中数据和作数据散点图的基本方法,就可作出表中数据的散点图;(2)根据公式求出,的值,就可得到线性回归方程;(3)利用线性回归方程,求出车流量的值,就可测算下周星期三的PM10的浓度。 y . . . .
【详细解答】(1)由表中数据作出散点图如图 20 . . .
所示; 15
(2)===0.97, 0 1 2 3 4 5 6 7 x
=-=10.90,y关于x的线性回归方程是=0.97x+10.90;(3)下周三的车流量=23.5=18.8(万辆),=0.9718.8+10.90=29.1(ug/),预计下周星期三的PM10
浓度为29.1。
『思考问题4』
【典例4】是近几年高考(或高三诊断考试或高二期末考试)试卷中关于变量之间相关关系问题的试题,归结起来主要包括:①变量相关关系的判断;②线性回归分析;③独立性检验等几种类型;
解答变量之间相关关系问题的基本方法是:①归结问题结构特征判断问题所属类型;②运用解答该类型问题的解题思路和基本方法对问题实施解答;③得出解答问题的结果。
〔练习4〕解答下列问题:
1、空气质量指数AQI是检测空气质量的重要参数,其数值越大说明空气污染状况月严重,空气质量越差。某地环保部门统计了该地区12月1日至12月24日连续24天的空气质量指数AQI,根据得到的数据绘制出如图所示的折线图,则下列说法错误的是( )(2018成都市高三一诊)(答案:D)
A该地区在12月2日空气质量最好 B该地区在12月24日空气质量最差 C该地区从122、月7日到12月12日AQI持续增大 D该地区的空气质量指数AQI与这段日期成负相关
2、2017年3月15日,某物价部门对本市5家商场某商品一天的销售额及其价格进行调查,5家商场的价格x与销售额y之间的一组数据如下表所示:
价格x(单位:元) 8 9.5 10 10.5 12
销售额y(单位:千元) 12 10 8 6 4
由散点图可知,销售额y与价格x之间有较好的线性相关关系,且回归方程是=-3.2x+,
则=( )(2017—2018成都市高二上期质量检测)(答案:C)
A -24 B 35.6 C 40 D 40.5
3、具有线性相关关系的变量x,y满足 x 0 1 2 3
一组数据如下表所示:若y与x的线性 y -1 1 m 8
回归方程为=3x-,则m的值是( )(2016衡水质检)(答案:A)
A 4 B C 5 D 6
4、已知一组变量x,y的取值如下表: x 0 1 4 5 6 8
从所得散点图中分析可知,y与x线性相关, y 1.3 1.8 5.6 6.1 7.4 9.3
且=0.95x+,则x=13时,y等于( )(2016湖南师大附中月考)(答案:B)
A 1.45 B 13.8 C 13 D 12.8
5、给出以下四个命题:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位;④对分类变量X与Y的随机变量的观察值k来说,k越小,“x与y有关系”的把握程度越大。其中正确命题的序号是 ;(答案:②③)
6、对具有线性相关关系的变量x,y有一组观测数据(,)(i=1,2,-----8),其线性回归方程=x+,且++-------+=2(++----+)=6,则实数的值是
(2016郑州模拟)(答案:实数的值是)
7、(理)海水养殖场进行某水产品的新,旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99℅的把握认为箱产量与养殖方法有关;
箱产量<50kg 箱产量50kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
(文)(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99℅的把握认为箱产量与养殖方法有关;
箱产量<50kg 箱产量50kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优 进行比较(2017全国高考新课标II卷)
附: ,= (答案:(理)(1)事件A概率的估计值为0.4092;(2)有99℅的把握认为箱产量与养殖方法有关;(3)新养殖法箱产量的中位数的估计值为52.35。(文)(1)事件A概率的估计值为0.4092;(2)有99℅的把握认为箱产量与养殖方法有关;(3)因为新养殖法箱产量高且比较稳定,所以新养殖法优于旧养殖法。)
8、某医疗科研项目对5只小白鼠体内的A,B两项指标数据进行收集和分析,得到的数据如下表:
指标 1号小白鼠 2号小白鼠 3号小白鼠 4号小白鼠 5号小白鼠
A 5 7 6 9 8
B 2 2 3 4 4
(1)若通过数据分析,得知A项指标数据与B项指标数据具有线性相关关系,试根据上表,求B项指标数据y关于A项指标数据x的线性回归方程=x+;
(2)现要从这5只小白鼠中随机抽取3只,求其中至少有一只B项指标数据高于3的概率(2018成都市高三零诊)
参考公式: == ,= -)。(答案:(1)B项指标数据y关于A项指标数据x的线性回归方程为:=x-;(2)其中至少有一只B项指标数据高于3的概率为)
9、某项科研活动共进行了5次试验,其数据如下表所示:
(1)从5次特征量y的试验数据中,随机地抽取两个数据,求至少有一个大于600的概率;
特征量 第一次 第二次 第三次 第四次 第五次
X 555 559 551 563 552
y     601   605  597   599   598
(2)求特征量y关于x的线性回归方程=x+,并预测当特征量x为570时特征量y的值(2017成都市高三二诊)
(附:线性回归方程=x+中的和的最小二乘法估计公式分别为:= ,= -) (答案:(1)至少有一个大于600的概率为0.7;(2)特征量y关于x的线性回归方程=0.25x+461.5,当特征量x为570时特征量y的值为604)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源预览