资源简介 课件27张PPT。章末整合提升知识网络答案 ①残差分析 ②线性回归方程 ③2×2列联表 ④等高条形图 ⑤K2统计量 某城市理论预测2010年到2014年人口总数与年份的关系如表所示专题归纳题型一 线性回归分析典例1【自主解答】 (1)散点图如图:●规律总结解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程.(3)回归分析.画残差图或计算R2,进行残差分析.(4)实际应用.依据求得的回归方程解决问题. 为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;(2)描述解释变量x与预报变量y之间的关系;(3)计算R2.题型二 非线性回归分析典例2【自主解答】 (1)散点图如图所示.(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的附近,于是令z=ln y,则所有变换后的样本点应分布在直线z=bx+a,a=ln c1,b=c2的周围,数据可以转化为:●规律总结解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,预报变量为y.(2)画散点图:通过观察散点图并与学过的函数(幂函数、指数函数、对数函数、二次函数)作比较,选取拟合效果好的函数模型.(3)变量置换:通过变量置换把非线性问题转化为线性回归问题.(4)分析拟合效果:通过计算R2等来判断拟合效果.(5)写出非线性回归方程. 调查某桑场采桑员的辅助工患桑毛虫皮炎病的情况,结果如下表:利用2×2列联表分析能否在犯错误的概率不超过0.001的前提下认为患桑毛虫皮炎病与采桑有关?题型三 独立性检验典例3●规律总结独立性检验的基本思想独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算随机变量K2的观测值,最后由K2的观测值说明两个分类变量是否有关系.进行独立性检验要注意理解以下两个问题:(1)独立性检验适用于两个分类变量.(2)两个分类变量是否有关系的直观判断:一是根据2×2列联表计算|ad-bc|,值越大关系越强;二是观察等高条形图,两个深色条的高度相差越大关系越强.◎跟踪训练答案 A2.为调查中学生近视情况,测得某校男生150名中有80名近视,女生140名中有70名近视.在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力A.期望与方差 B.排列与组合C.独立性检验 D.概率解析 分析已知条件,易得如下表格.根据列联表可得K2,再与临界值比较,检验这些中学生眼睛近视是否与性别有关,故利用独立性检验的方法最有说服力.答案 C⑤在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是90%以上.其中正确的是A.②③④⑤ B.①③④C.①③⑤ D.②④解析 从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样不是分层抽样,而是系统抽样,故①不正确,所以B、C两个答案一定不对,只有A、D两个可选,观察这两个答案的不同之处,只要判断第③个是否正确,在回归分析模型中,残差平方和越小,说明模型的拟合效果越好,这个说法是正确的,故③正确,故选A.答案 A4.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表(单位:人):解析 由于6.109>5.024,所以在犯错误的概率不超过0.025的前提下认为文化程度与月收入有关系.答案 0.0255.用两种检验方法对某食品做沙门氏菌检验,结果如下表:附:(1)利用图形判断采用荧光抗体法与检验结果呈阳性是否有关系?(2)能否在犯错误的概率不超过0.001的前提下认为采用荧光抗体法与检验结果呈阳性有关系?解析 (1)作出等高条形图如图所示,由图知采用荧光抗体法与检验结果呈阳性有关系.答案 (1)采用荧光抗体法与检验结果呈阳性有关系 (2)采用荧光抗体法与检验结果呈阳性有关系章末达标测试(三)(本卷满分150分,时间120分钟)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是 =-0.7x+,则等于A.10.5 B.5.15 C.5.2 D.5.25解析 =2.5,=3.5,因为回归直线过定点(,),所以3.5=-0.7×2.5+.所以=5.25.答案 D2.某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562.若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为A.83% B.72% C.67% D.66%解析 由已知=7.675,代入方程=0.66x+1.562,得x≈9.262 1,所以百分比为≈83%,故选A.答案 A3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为A.-1 B.0 C. D.1解析 由题设知,所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,所以这组样本数据完全正相关,故其相关系数为1.答案 D4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有A.b与r的符号相同 B.a与r的符号相同C.b与r的符号相反 D.a与r的符号相反解析 因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<0.答案 A5.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是x45678910y14181920232528A.线性函数模型 B.二次函数模型C.指数函数模型 D.对数函数模型解析 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.答案 A6.下面的等高条形图可以说明的问题是A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的B.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C.此等高条形图看不出两种手术有什么不同的地方D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握解析 由等高条形图可知选项D正确.答案 D7.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为=7.19x+73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是A.身高一定为145.83 cm B.身高大于145.83 cmC.身高小于145.83 cm D.身高在145.83 cm左右解析 用线性回归方程预测的不是精确值,而估计值.当x=10时,y=145.83,只能说身高在145.83 cm左右.答案 D8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关解析 根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.答案 D9.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示:杂质高杂质低旧设备37121新设备22202根据以上数据,则下列说法正确的是A.含杂质的高低与设备改造有关 B.含杂质的高低与设备改造无关C.设备是否改造决定含杂质的高低 D.以上答案都不对解析 由已知数据得到如下2×2列联表杂质高杂质低总计旧设备37121158新设备22202224总计59323382K2的观测值k=≈13.11,由于13.11>10.828,故在犯错误的概率不超过0.001的前提下认为含杂质的高低与设备改造是有关的.答案 A10.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于附:P(K2≥k0)0.050.025k03.8415.024A.3 B.4 C.5 D.6解析 列2×2列联表如下:x1x2总计y1102131y2cd35总计10+c21+d66故K2的观测值k=≥5.024.把选项A、B、C、D代入验证可知选A.答案 A11.下表是关于出生男婴与女婴调查的列联表:晚上白天总计男婴45AB女婴E35C总计98D180那么A,B,C,D,E的值分别为A.47 92 88 82 55 B.47 92 84 82 53C.47 92 88 82 53 D.45 92 88 82 53解析 由列联表可得E=98-45=53,D=180-98=82,A=D-35=47,B=45+A=92,C=E+35=88.答案 C12.有下列数据x123y35.9912.01下列四个函数中,模拟效果最好的为A.y=3×2x-1 B.y=log2xC.y=3x D.y=x2解析 当x=1,2,3,代入求值,求最接近y的.答案 A二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中横线上)13.某饮料店的日销售收入y(单位:百元)与当天平均气温x(单位:℃)之间有下列数据:x-2-1012y54221甲、乙、丙三位同学对上述数据进行了研究,分别得到了x与y之间的三个线性回归方程:①=-x+3;②=-x+2.8;③=-x+2.6.其中正确方程的序号是________.解析 =0,=2.8,∵线性回归方程过这组数据的样本中心点.∴点(0,2.8)满足线性回归方程.代入检验只有②符合.答案 ②14.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程=x+,其中=-2.现预测当气温为-4 ℃时,用电量的度数约为________.气温x(℃)181310-1用电量y(度)24343864解析 由题意可知=(18+13+10-1)=10,=(24+34+38+64)=40,=-2.又回归直线=-2x+过点(10,40),故=60,所以当x=-4时,=-2×(-4)+60=68.答案 6815.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:读书健身总计女243155男82634总计325789在犯错误的概率不超过________的前提下性别与休闲方式有关系.解析 由列联表中的数据,得K2的观测值为k=≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.答案 0.1016.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.零件数x/个1020304050加工时间/min62758189现发现表中有一个数据模糊看不清,请你推断出该数据的值为________.解析 由表知=30,设模糊不清的数据为m,则=(62+m+75+81+89)=,因为=0.67+54.9,即=0.67×30+54.9,解得m=68.答案 68三、解答题(本大题共6小题,共70分.解答时应写出必要的文字说明、证明过程或演算步骤)17.(10分)在研究某种药物对“H1N1”病毒的治疗效果时,进行动物试验,得到以下数据,对150只动物服用药物,其中132只动物存活,18只动物死亡,对照组150只动物进行常规治疗,其中114只动物存活,36只动物死亡.(1)根据以上数据建立一个2×2列联表;(2)试问该种药物对治疗“H1N1”病毒是否有效?解析 (1)2×2列联表如下:存活数死亡数合计服用药物13218150未服药物11436150合计24654300(2)由(1)知K2=≈7.317>6.635.故在犯错误的概率不超过0.01的前提下认为该种药物对“H1N1”病毒有治疗效果.答案 见解析18.(12分)机器按照模具生产的产品有一些也会有缺陷,我们将有缺陷的产品称为次品,每小时出现的次品数随机器运转速度的不同而变化.下表为某机器生产过程的数据:速度x/百转/秒每小时生产次品数y/个230440550660870(1)求机器运转速度与每小时生产有缺点的产品数之间的回归方程;(2)若实际生产所允许的每小时生产有缺点的产品数不超过75件,那么机器的速度每秒不超过多少百转?(写出满足的整数解)解析 (1)=(2+4+5+6+8)=5,=(30+40+50+60+70)=50,iyi=2×30+4×40+5×50+6×60+8×70=1 390.所以==7,=-=50-7×5=15,所以回归直线方程为=7x+15.(2)若实际生产所允许的每小时生产有缺点的产品数不超过75件,则≤75.即7x+15≤75解得x≤8.57.所以实际生产所允许的每小时生产有缺点的产品数不超过75件,那么机器的速度应每秒不超过8百转.答案 (1)=7x+15 (2)8百转19.(12分)炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如表所示:x(0.01%)104180190177147y(分钟)100200210185155x(0.01%)134150191204121y(分钟)135170205235125(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?(2)求回归直线方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟?解析 (1)可作散点图如图所示:由图可知它们呈线性相关关系.(2)=159.8,=172,=-≈172-1.267×159.8≈-30.47.所以=1.267x-30.47.(3)把x=60代入得y=172.25(分钟).当钢水含碳量为160时,应冶炼172.25分钟.答案 (1)略 (2)=1.267x-30.47 (3)172.25分钟20.(12分)随着生活水平的提高,越来越多的人参与了潜水这项活动.某潜水中心调查了100名男性与100名女性下潜至距离水面5米时是否会耳鸣,如图为其等高条形图:(1)绘出2×2列联表;(2)利用独立性检验方法判断性别与耳鸣是否有关系?若有关系,所得的结论犯错误的概率有多大?解析 (1)由男女生各100人及等高条形图可知耳鸣的男生有100×0.3=30人,耳鸣的女生有100×0.5=50人,所以无耳鸣的男生有100-30=70(人),无耳鸣的女生有100-50=50(人),所以2×2列联表如下:有耳鸣无耳鸣总计男3070100女5050100总计80120200(2)由公式计算K2的观测值:k=≈8.33>7.879.所以在犯错误的概率不超过0.005的前提下认为耳鸣与性别有关系.答案 见解析21.(12分)日本发生的9.0级地震引发了海啸及核泄漏,某国际组织用分层抽样的方法从心理专家、核专家、地质专家三类专家中抽取了若干人组成研究团队赴日本工作,有关数据见表1:(单位:人)核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检测,并将有关数据整理为不完整的2×2列联表(表2)表1相关人数抽样人数心理专家24x核专家48y地质专家726表2高度辐射轻微辐射总计身体健康30A50身体不健康B1060总计CDE(1)求研究小组的总人数;(2)写出表中的A,B,C,D,E的值,并判断在犯错误的前提下,认为羊受到高度辐射与身体不健康有关的概率有多大.解析 (1)由题意,==,所以y=4,x=2,所以研究小组的总人数为2+4+6=12.(2)根据列联表可得A=20,B=50,C=80,D=30,E=110,假设羊受到高度辐射与身体不健康无关.所以K2=≈7.486>6.635.所以在犯错误的概率不超过0.01的前提下认为羊受到高度辐射与身体不健康有关.答案 (1)12 (2)略22.(12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值. (1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距的最小二乘估计分别为.解析 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=,先建立y关于w的线性回归方程.=-=563-68×6.8=100.6,所以y关于w的线性回归方程为=100.6+68w.因此y关于x的回归方程为=100.6+68.(3)①由(2)知,当x=49时,年销售量y的预报值=100.6+68=576.6,年利润z的预报值=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值=0.2(100.6+68)-x=-x+13.6+20.12.所以当==6.8,即x=46.24时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.答案 (1)y=c+d (2)=100.6+68(3)①66.32 ②年宣传费为46.24千元时,年利润的预报值最大 展开更多...... 收起↑ 资源列表 章末整合提升(三).ppt 章末达标测试(三).doc