资源简介 (共26张PPT)成对数据的统计分析章末复习高二选择性必修三知识体系成对数据的统计分析成对数据的统计相关性一元线性回归模型及其应用列联表与独立性检验变量的相关关系样本相关系数一元线性回归模型一元线性回归模型参数的最小二乘估计分类变量与列联表独立性检验题型突破典例深度剖析 重点多维探究[例1] 某地收集到的新房屋的销售价格y和房屋的面积x的数据如下表:房屋面积x/m2 115 110 80 135 105销售价格y/万元 24.8 21.6 18.4 29.2 22(1)画出数据对应的散点图;(2)若y与x线性相关,建立y关于x的经验回归方程;(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.题型一 回归分析 [例1] 某地收集到的新房屋的销售价格y和房屋的面积x的数据如下表:房屋面积x/m2 115 110 80 135 105销售价格y/万元 24.8 21.6 18.4 29.2 22(1)画出数据对应的散点图;数据对应的散点图如图所示.[例1] 某地收集到的新房屋的销售价格y和房屋的面积x的数据如下表:房屋面积x/m2 115 110 80 135 105销售价格y/万元 24.8 21.6 18.4 29.2 22(2)若y与x线性相关,建立y关于x的经验回归方程;故所求经验回归方程为=0.1962x+1.8142.由散点图知y与x具有线性相关关系.由表中数据知xi=109,yi=23.2,=60975,xiyi=12952.设所求经验回归方程为x+,则≈0.1962, ≈1.8142.[例1] 某地收集到的新房屋的销售价格y和房屋的面积x的数据如下表:房屋面积x/m2 115 110 80 135 105销售价格y/万元 24.8 21.6 18.4 29.2 22(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.由(2)可知,当x=150时, =0.1962×150+1.8142=31.2442.故销售价格的估计值为31.244 2万元.总结提升在散点图中, 样本点大致分布在一条直线附近.利用公式求出,即可写出经验回归方程.利用经验回归模型进行研究.可近似地利用经验回归方程x+来预测.经验回归方程的求法及应用1. 已知某连锁经营公司的5个零售店某月的销售额和利润额资料如下表:商店名称 A B C D E销售额x/千万元 3 5 6 7 9利润额y/千万元 2 3 3 4 5(1)画出散点图;(2)根据如下的参考公式与参考数据,建立利润额y与销售额x的经验回归方程;(3)若该公司还有一个零售店某月销售额为10千万元,试估计它的利润额是多少.跟踪训练(参考公式:. 参考数据:xiyi=112,=200)1. 已知某连锁经营公司的5个零售店某月的销售额和利润额资料如下表:商店名称 A B C D E销售额x/千万元 3 5 6 7 9利润额y/千万元 2 3 3 4 5(1)画出散点图;散点图如下.商店名称 A B C D E销售额x/千万元 3 5 6 7 9利润额y/千万元 2 3 3 4 5(2)根据如下的参考公式与参考数据,建立利润额y与销售额x的经验回归方程;(参考公式:. 参考数据:xiyi=112,=200)=0.5, =3.4-0.5×6=0.4.由已知数据计算得n=5, =6, =3.4.故经验回归方程为=0.5x+0.4.由(1)中散点图可知,y与x线性相关.1. 已知某连锁经营公司的5个零售店某月的销售额和利润额资料如下表:商店名称 A B C D E销售额x/千万元 3 5 6 7 9利润额y/千万元 2 3 3 4 5(3)若该公司还有一个零售店某月销售额为10千万元,试估计它的利润额是多少.将x=10代入经验回归方程中得到=0.5×10+0.4=5.4,即估计该零售店的利润额为5.4千万元.[例2] 在研究弹簧伸长长度y(单位:cm)与拉力x(单位:N)的关系时,对不同拉力的6根弹簧进行测量,测得如下表中的数据:x/N 5 10 15 20 25 30y/cm 7.25 8.12 8.95 9.90 10.9 11.8若依据散点图可知x与y线性相关,且由最小二乘法求出的经验回归方程为=0.18x+6.34,求R2,并利用R2说明拟合效果.题型二 一元线性回归模型分析 列表求值如下:xi 5 10 15 20 25 30yi 7.25 8.12 8.95 9.90 10.9 11.8xiyi 36.25 81.2 134.25 198 272.5 35425 100 225 400 625 900yi- 0.01 -0.02 -0.09 -0.04 0.06 0.06yi- -2.24 -1.37 -0.54 0.41 1.41 2.31=17.5, ≈9.49,xiyi=1076.2, =2275,(yi- )2 =0.0174, (yi-)2 =14.6784.所以R2=1-≈0.99881, 模型拟合效果较好.总结提升在一元线性回归模型中,R2与相关系数r都能刻画模型拟合数据的效果.|r|越大,R2就越大,用模型拟合数据的效果就越好.一元线性回归模型拟合问题的求解策略2. 关于x与y有以下数据:x 2 4 5 6 8y 30 40 60 50 70跟踪训练已知x与y线性相关,由最小二乘法得=6.5.(1)建立y关于x的经验回归方程;(2)现有第二个模型:=7x+17,且R2=0.82.若与(1)的模型比较,则哪一个模型拟合效果比较好,请说明理由.2. 关于x与y有以下数据:x 2 4 5 6 8y 30 40 60 50 70已知x与y线性相关,由最小二乘法得=6.5.(1)建立y关于x的经验回归方程;依题意设y关于x的经验回归方程为=6.5x+.∵=5,=50,又经验回归直线经过(),∴50=6.5×5+.∴=17.5.∴y关于x的经验回归方程为=6.5x+17.5.(2)现有第二个模型:=7x+17,且R2=0.82.若与(1)的模型比较,则哪一个模型拟合效果比较好,请说明理由.yi- -0.5 -3.5 10 -6.5 0.5yi- -20 -10 10 0 20所以(1)的模型拟合效果比较好.所以(yi-)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.(yi-)2=(-20)2+(-10)2+102+02+202=1000.所以=1-=1-=0.845.因为R2=0.82, 所以>R2.[例3] 为了调查胃病是否与生活规律有关联,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)根据以上数据列出2×2列联表;(2)依据α=0.005的独立性检验,能否认为40岁以上的人患胃病与生活规律有关联 题型三 独立性检验[例3] 为了调查胃病是否与生活规律有关联,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)根据以上数据列出2×2列联表;由题意可列2×2列联表如下:类型 患胃病 未患胃病 合计生活规律 20 200 220生活不规律 60 260 320合计 80 460 540(2)依据α=0.005的独立性检验,能否认为40岁以上的人患胃病与生活规律有关联 零假设为H0:40岁以上的人患胃病与生活规律无关联.根据列联表得χ2=≈9.638>7.879=x0.005.依据α=0.005的独立性检验,我们推断H0不成立,即认为40岁以上的人患胃病和生活规律有关联.类型 患胃病 未患胃病 合计生活规律 20 200 220生活不规律 60 260 320合计 80 460 540比较χ2与临界值xα的大小关系,得到推断结论.总结提升独立性检验的一般步骤根据样本数据制成2×2列联表;根据公式计算χ2;1233. 为了解某班学生喜爱打篮球是否与性别有关联,对本班50人进行问卷调查得到了如下的列联表:性别 喜爱打篮球 不喜爱打篮球 合计男生 5 女生 10 合计 50已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为0.6.(1)请将上面的列联表补充完整(不用写计算过程).(2)依据α=0.01的独立性检验,能否认为喜爱打篮球与性别有关联 说明你的理由.跟踪训练(参考公式:χ2=)3. 为了解某班学生喜爱打篮球是否与性别有关联,对本班50人进行问卷调查得到了如下的列联表:性别 喜爱打篮球 不喜爱打篮球 合计男生 5 女生 10 合计 50已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为0.6.(1)请将上面的列联表补充完整(不用写计算过程).302025251520(2)依据α=0.01的独立性检验,能否认为喜爱打篮球与性别有关联 说明你的理由.性别 喜爱打篮球 不喜爱打篮球 合计男生 20 5 25女生 10 15 25合计 30 20 50零假设为H0:喜爱打篮球与性别无关联.根据列表中的数据,经计算得到χ2=≈8.333>6.635=x0.01,依据α=0.01的独立性检验,我们推断H0不成立,即认为喜爱打篮球与性别有关联.通过本节课,你学会了什么? 展开更多...... 收起↑ 资源预览