资源简介 (共36张PPT)(3)求出决定系数;(4)作出残差图;(5)进行残差分析.[解] (1)作出散点图,如图所示.(5)由散点图可以看出x与y有很强的线性相关性,由R2的值可以看出拟合效果很好.由残差图也可观察到,第2,5,9,10个样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误.[集训冲关]为了便于对某城市的“城市幸福感”指数进行研究,现从该市抽取若干人进行调查,绘制成如下表所示不完整的2×2列联表.性别 男 女 总计非常幸福 11 15比较幸福 9 总计30 (单位:人)解:(1)补充完整的表格如下所示:性别 男 女 总计非常幸福 4 11 15比较幸福 6 9 15总计 10 20 3021世织纪教痘2订世看,27G2@Py/min1301100000102030405060708090100x/个残差●543210●1:35381234●●习题课(三) 成对数据的统计分析一、选择题1.在建立两个变量y与x的回归模型时,分别选择了4个不同的模型,它们的R2如下,其中拟合得最好的模型为( )A.模型1的R2为0.75 B.模型2的R2为0.90C.模型3的R2为0.25 D.模型4的R2为0.55解析:选B R2的值越大,意味着残差平方和越小,也就是说拟合效果越好.2.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是( )A.由样本数据得到的经验回归方程=x+必过样本点的中心(,)B.残差平方和越小的模型,拟合的效果越好C.用决定系数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好D.若变量y和x之间的样本相关系数r=-0.936 2,则变量y与x之间具有线性相关关系解析:选C R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.3.对两个变量y与x进行回归分析,分别选择不同的模型,它们的样本相关系数r如下,其中拟合效果最好的模型是( )A.模型Ⅰ:样本相关系数r为0.96B.模型Ⅱ:样本相关系数r为-0.81C.模型Ⅲ:样本相关系数r为-0.53D.模型Ⅳ:样本相关系数r为0.35解析:选A |r|越大,拟合效果越好.4.关于残差和残差图,下列说法正确的是( )A.残差就是随机误差B.残差图的横坐标是残差C.残差点均匀分布的带状区域的宽度越窄,说明模型拟合精度越高D.残差点均匀分布的带状区域的宽度越窄,说明模型拟合精度越低解析:选C 根据残差分析的概念可知,C选项正确.残差是真实值减去估计值.5.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+bln x解析:选D 用光滑的曲线把图中各点连接起来,由图象的大致走向判断,此函数应该是对数函数类型的,故应该选用的函数模型为y=a+bln x.6.根据如下所示的列联表得到如下四个判断:①根据小概率值α=0.001的独立性检验,认为患肝病与嗜酒有关;②根据小概率值α=0.01的独立性检验,认为患肝病与嗜酒有关;③没有证据显示患肝病与嗜酒有关.单位:人患病状况 饮酒习惯 合计嗜酒(Y=0) 不嗜酒(Y=1)患肝病(X=0) 7 775 42 7 817未患肝病(X=1) 2 099 49 2 148合计 9 874 91 9 965其中正确命题的个数为( )A.1 B.2C.3 D.0解析:选B 根据列联表中的数据,经计算得到χ2=≈56.632,由56.632>10.828>6.635.且P(χ2≥10.828)≈0.001,P(χ2≥6.635)≈0.01.所以①②均正确.二、填空题7.调查某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元)显示,年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的经验回归方程=0.254x+0.321.由经验回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由经验回归方程=0.254x+0.321,知x每增加1,y增加0.254.答案:0.2548.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程为=0.67x+54.9.零件数x/个 10 20 30 40 50加工时间y/min 62 75 81 89现发现表中有一个数据模糊看不清,请你推断出该数据的值为________.解析:由表知=30,设模糊不清的数据为m,则=(62+m+75+81+89)=,因为=0.67+54.9,即=0.67×30+54.9,解得m=68.答案:689.假设关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)有如下的统计资料:x/年 2 3 4 5 6y/万元 2.2 3.8 5.5 6.5 7.0若由资料可知y对x呈线性相关关系,且经验回归方程为=+x,其中已知=1.23,请估计使用年限为20年时,维修费用约为________万元.解析:由表中数据可知,==4,==5.∵经验回归直线一定经过点(,),∴5=+1.23×4,∴=0.08,∴经验回归方程为=1.23x+0.08.故估计使用年限为20年时,维修费用约为y=1.23×20+0.08=24.68(万元).答案:24.68三、解答题10.2023年某市开展了“寻找身边的好老师”活动,市六中积极行动,认真落实,通过网络关注评选“身边的好老师”,并对选出的五位“好老师”的班主任的工作年限和被关注数量进行了统计,得到如下数据:班主任工作年限x/年 4 6 8 10 12被关注数量y/百人 10 20 40 60 50(1)若“好老师”的被关注数量y与其班主任的工作年限x满足经验回归方程,试求经验回归方程=x+,并就此分析:“好老师”的班主任工作年限为15年时被关注的数量;(2)若用(i=1,2,3,4,5)表示统计数据时被关注数量的“即时均值”(四舍五入到整数),从“即时均值”中任选2组,求这2组数据之和小于8的概率.解:(1)因为=8,=36,所以==6,=36-6×8=-12,所以=6x-12.当x=15时,=6×15-12=78(百人).(2)这5次统计数据,被关注数量的“即时均值”分别为3,3,5,6,4.从5组“即时均值”任选2组,共有C=10种情况,其中2组数据之和小于8为(3,3),(3,4),(3,4)共3种情况,所以这2组数据之和小于8的概率为.11.“双11”已经成为网民们的网购狂欢节,某电子商务平台对某市的网民在今年“双11”的网购情况进行摸底调查,用随机抽样的方法抽取了100人,其消费金额t(百元)的频率分布直方图如图所示:(1)求网民消费金额t的平均值和中位数t0.(2)把下表中空格里的数填上,并判断能否根据小概率值α=0.001的独立性检验,认为网购消费与性别有关?单位:人单位:人消费金额 性别 合计男(Y=0) 女(Y=1)t≥t0(X=0)t合计 45解:(1)以每组的中间值代表本组的消费金额,则网民消费金额t的平均值=2.5×0.2+7.5×0.3+12.5×0.2+17.5×0.15+22.5×0.1+27.5×0.05=11.5.直方图中第一组,第二组的频率之和为0.04×5+0.06×5=0.5.所以t的中位数t0=10.(2)补充列联表如下:消费金额 性别 合计男(Y=0) 女(Y=1)t≥t0(X=0) 25 25 50t合计 45 55 100零假设为H0:网购消费与性别独立,即网购消费与性别无关.根据列联表中的数据,经计算得到χ2==≈1.01<10.828=x0.001.根据小概率值α=0.001的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为网购消费与性别无关.12.流行性感冒(简称流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.其主要通过空气中的飞沫、人与人之间的接触与被污染物品的接触传播.流感每年在世界各地均有传播,在我国北方通常呈冬春流行,南方有冬春季和夏季两个流行高峰.儿童相对免疫力低,在幼儿园、学校等人员密集的地方更容易被传染.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:年龄x 2 3 4 5 6患病人数y 22 22 17 14 10(1)求y关于x的回归直线方程;(2)计算变量x,y的样本相关系数r(计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关很强.(若|r|∈[0.75,1],则x,y相关性很强;若|r|∈[0.3,0.75),则x,y相关性一般;若|r|∈[0,0.3),则x,y相关性较弱)参考数据:≈5.477.参考公式:==,样本相关系数r=.解:(1)由题意得,==4,==17,===-3.2,=-=17+3.2×4=29.8,故y关于x的线性回归方程为=-3.2x+29.8.(2)∵r===≈-0.97,∴r<0,说明x,y负相关.又|r|∈[0.75,1],说明x,y相关性很强.因此,可以认为该幼儿园去年春季流感人数与年龄负相关很强.21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源列表 人教A版高中数学选择性必修第三册习题课成对数据的统计分析课件.ppt 人教A版高中数学选择性必修第三册习题课(三)成对数据的统计分析含答案(教师用).doc