资源简介 4.1 课时1 成对数据的统计相关性(一)【学习目标】1.会结合散点图直观认识两个变量之间的线性相关性.(直观抽象)2.了解样本相关系数的统计含义,了解相关系数的计算公式及其性质.(数学抽象)3.会通过相关系数判断两变量之间的相关程度.(数学运算、数据分析)【自主预习】1.如何把一组数据x1,x2,…,xn转化为均值为0、方差为1的数据呢 【答案】 令x'i=(i=1,2,…,n),不难验证,x'1,x'2,…,x'n是均值为0、方差为1的数据.2.如何计算相关系数呢 【答案】 利用公式rxy=计算.3.相关系数r的取值范围以及它与线性相关程度有何关系 【答案】 ①r的取值范围为[-1,1];②|r|越接近于1,变量之间的线性相关程度越高;③|r|越接近于0,变量之间的线性相关程度越低.1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)(1)若两个变量的相关系数r>0,则两个变量正相关. ( )(2)两个变量的相关系数越大,它们的相关程度越高. ( )(3)相关系数r的取值范围是(-1,1). ( )(4)若相关系数r=0,则说明成对样本数据间是函数关系. ( )【答案】 (1)√ (2)× (3)× (4)×2.下面对相关系数r描述正确的是 ( ).A.r>0表明两个变量负相关B.r>1表明两个变量正相关C.r只能大于零D.|r|越接近于0,两个变量相关关系越弱【答案】 D【解析】 r>0表明两个变量正相关,故A错误;r∈[-1,1],故B,C错误;两个变量之间的相关系数r的绝对值越接近于1,表明两个变量的线性相关性越强, r的绝对值越接近于0,表示两个变量的线性相关性越弱,故D正确.3.根据统计,某蔬菜基地西红柿亩产量的增加量y(单位:百千克)与某种液体肥料每亩使用量x(单位:千克)之间的对应数据的散点图如图所示.计算西红柿亩产量的增加量y与液体肥料每亩使用量x之间的相关系数(结果保留两位小数).附:相关系数rxy=.参考数据:≈0.55,≈0.95.【解析】 由已知数据可得==5,==4,所以(xi-)(yi-)=(-3)×(-1)+(-1)×0+0×0+1×0+3×1=6,==2,==,所以相关系数rxy===≈0.95.【合作探究】探究1 散点图 为了了解人的身高与体重的关系,随机地抽取9名15岁的男生,测得如下数据:身高/cm 165 157 155 175 168 157 178 160 163体重/kg 52 44 45 55 54 47 62 50 53 问题1:怎样通过身高与体重的具体的数据来说明它们不是函数关系 【答案】 同一身高157 cm对应着不同的体重44 kg和47 kg,所以体重不是身高的函数.问题2:如果把身高看作横坐标,体重看作纵坐标,在坐标系中画出的对应点是怎样的图形 从画出的图形中,你发现了什么规律 【答案】 画出的对应点接近直线排列;从图中发现随着身高的增长,体重基本上是呈直线增加的趋势.问题3:任意两个统计数据是否均可以作散点图 【答案】 可以,不管这两个统计量是否具备相关性,以一个变量值作为横坐标,另一个作为纵坐标,均可画出散点图.新知生成1.散点图我们以身高的取值为横坐标,以体重的取值为纵坐标,建立平面直角坐标系,则每对数据(Hi,Wi)都可在平面直角坐标系中用一个点Pi(i=1,2,…,n)表示.这些点称为散点,由坐标系及散点形成的数据图叫作散点图.2.如果两个变量之间的关系近似地表现为一条直线,那么称它们具有线性相关关系,简称为相关关系.3.如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,那么称它们线性相关,这实际上就是函数关系.新知运用例1 某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:x 10 15 17 20 25 28 32y 1 1.3 1.8 2 2.6 2.7 3.3 (1)画出散点图;(2)判断y与x是否具有线性相关关系.【解析】 (1)散点图如下:(2)由图可知,所有数据点接近直线排列,因此,认为y与x具有线性相关关系.【方法总结】 判断变量之间有无相关关系,一种常用的简便可行的方法就是绘制散点图.散点图由数据点分布构成,是分析研究两个变量相关关系的重要手段.在散点图中,如果点的分布从整体上看大致在一条直线附近,那么这两个变量是线性相关的,否则不具备线性相关关系. 5名学生的数学和物理成绩如下表:学生学科 A B C D E数学 80 75 70 65 60物理 70 66 68 64 62 画出散点图,判断它们是否有相关关系.【解析】 以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示.由散点图可知,两者之间具有相关关系,且为正相关.探究2 相关系数 散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的高低,更不能精确地说明成对样本数据之间关系的密切程度.问题:我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢 【答案】 相关系数r.新知生成 相关系数样本容量是n的成对观测数据,用(x1,y1),(x2,y2),…,(xn,yn)表示,用{xi}表示数据x1,x2,…,xn,用{yi}表示数据y1,y2,…,yn,用=xi,=yi分别表示{xi}和{yi}的均值,用sx=,sy=分别表示{xi}和{yi}的标准差,记sxy=-=(xi-)(yi-),当sxsy≠0时,我们称rxy===为{xi}和{yi}的相关系数.新知运用例2 有人收集了某城市居民年收入x(单位:亿元)(即所有居民在一年内收入的总和)与A商品销售额y(单位:万元)的10年数据,如表所示.第n年 1 2 3 4 5 6 7 8 9 10居民年收 入/亿元 32.2 31.1 32.9 35.8 37.1 38.0 39.0 43.0 44.6 46.0A商品销 售额/万元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0 画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断居民年收入与A商品销售额的相关程度和变化趋势的异同.附:相关系数rxy=.【解析】 画出成对样本数据的散点图,从散点图可以看出,A商品销售额与居民年收入的样本数据呈现出线性相关关系.因为=xi=37.97,=yi=39.1,所以样本相关系数rxy=≈0.95.由此可以推断,A商品销售额与居民年收入呈正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很高.【方法总结】 利用相关系数r判断线性相关关系时,需要利用公式计算出r的值,由于数据较多,需要借助计算器. 现随机抽取了某中学高一年级10名在校学生入学时的数学成绩x(单位:分)与入学后第一次考试的数学成绩y(单位:分),如下表:学生号 1 2 3 4 5 6 7 8 9 10x 120 108 117 104 103 110 104 105 99 108y 84 64 84 68 69 68 69 46 57 71 求样本的相关系数.【解析】 =×(120+108+…+99+108)=107.8,=×(84+64+…+57+71)=68,=1202+1082+…+992+1082=116584,=842+642+…+572+712=47384,xiyi=120×84+108×64+…+99×57+108×71=73796,所以所求相关系数rxy=≈0.7506.探究3 相关系数的性质问题1:若样本相关系数r=0.86,则成对样本数据的相关程度如何 【答案】 r=0.86,表明成对样本数据正线性相关程度很强.问题2:|rxy|越接近于1,及越接近于0,表示两个变量x与y之间线性相关程度如何 【答案】 |rxy|越接近于1,表明两个变量的线性相关程度越强,它们的散点图越接近于一条直线,这时用线性回归模型拟合这组数据的效果就越好;|rxy|越接近于0,表明两个变量的线性相关程度越弱.通常|rxy|>0.8时,认为有很强的线性相关关系.新知生成相关系数的性质:(1)rxy的取值范围是[-1,1].(2)当0当-1当rxy=0时,称{xi}和{yi}不相关.(3)|rxy|越接近于1,变量x,y的线性相关程度越高,这时数据(x1,y1),(x2,y2),…,(xn,yn)分散在一条直线附近.(4)|rxy|越接近于0,变量x,y的线性相关程度越低.(5)rxy具有对称性,即rxy=ryx.(6)rxy仅仅是变量x与y之间线性相关程度的一个度量.rxy=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.新知运用一、相关系数的性质例3 甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并分别求得相关系数r如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85 则( )同学的试验结果体现A,B两变量的线性相关性最强.A.甲 B.乙 C.丙 D.丁【答案】 D【解析】 |rxy|越接近1,线性相关性越强.故选D.【方法总结】 相关系数的性质(1)当rxy>0时,x,y两变量呈正相关关系;当rxy<0时,x,y两变量呈负相关关系.(2)rxy的绝对值越接近0,线性相关性越弱;rxy的绝对值越接近1,线性相关性越强.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图1,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图2.由这两个散点图可以判断 ( ).A.变量x与y正相关,变量u与v正相关B.变量x与y正相关,变量u与v负相关C.变量x与y负相关,变量u与v正相关D.变量x与y负相关,变量u与v负相关【答案】 C【解析】 由题图可得两组数据均呈线性相关,图1中各点呈向右下方发展趋势,所以变量x与y负相关;图2中各点呈向右上方发展趋势,所以变量u与v正相关.故选C.二、相关系数的计算及判断例4 潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃食叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y(单位:个)和夏季平均温度x(单位:℃)有关,现收集了某地区以往6年的数据,得到下面数据统计表格.夏季平均温度xi/℃ 21 23 25 27 29 31产卵数yi/个 7 11 21 22 64 115 根据相关系数rxy判断潜叶蝇的平均产卵数y与夏季平均温度x是否具有相关关系.【解析】 =xi==26,=yi==40,rxy====≈0.89>0.8.故可以判断潜叶蝇的平均产卵数y与夏季平均温度x具有很强的正相关关系.【方法总结】 当相关系数|rxy|越接近1时,两个变量的线性相关关系越强;当相关系数|rxy|越接近0时,两个变量的线性相关关系越弱. 某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:x 2 4 6 8y 30 40 50 70 (1)画出(x,y)的散点图;(2)计算x与y之间的样本相关系数,并判断它们的相关程度.【解析】 (1)画出(x,y)的散点图如图所示. (2)=5,=47.5,=120,=9900,xiyi=1080,故样本相关系数rxy==≈0.9827.由样本相关系数rxy≈0.9827,可以判断生产原料耗费与销售额这两个变量正相关,且相关程度很高.【随堂检测】1.下列有关样本相关系数r的说法,错误的是( ).A.相关系数r可以用来衡量x与y之间的线性相关程度B.|r|≤1,且|r|越接近0,相关程度越低C.|r|≤1,且|r|越接近1,相关程度越高D.|r|≤1,且|r|越接近1,相关程度越低【答案】 D【解析】 相关系数是用来衡量两个变量之间的线性相关程度的,相关系数是一个绝对值小于或等于1的量,并且它的绝对值越大就说明相关程度越高.故选D.2.某火锅店为了了解营业额y(单位:百元)与气温x(单位:℃)之间的关系,随机统计并制作了某6天当天营业额与当天气温的对比表.气温/℃ 26 18 13 10 4 -1营业额/百元 20 24 34 38 50 64画出散点图并判断营业额与气温之间是否具有线性相关关系.【解析】 画出散点图如图所示.=×(26+18+13+10+4-1)≈11.67,=×(20+24+34+38+50+64)≈38.33,xiyi=26×20+18×24+13×34+10×38+4×50-1×64=1910,=262+182+132+102+42+(-1)2=1286,=202+242+342+382+502+642=10172,由rxy=,可得rxy≈-0.97.因为|rxy|的值较接近于1,所以x与y具有很强的线性相关关系.24.1 课时1 成对数据的统计相关性(一)【学习目标】1.会结合散点图直观认识两个变量之间的线性相关性.(直观抽象)2.了解样本相关系数的统计含义,了解相关系数的计算公式及其性质.(数学抽象)3.会通过相关系数判断两变量之间的相关程度.(数学运算、数据分析)【自主预习】1.如何把一组数据x1,x2,…,xn转化为均值为0、方差为1的数据呢 2.如何计算相关系数呢 3.相关系数r的取值范围以及它与线性相关程度有何关系 1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)(1)若两个变量的相关系数r>0,则两个变量正相关. ( )(2)两个变量的相关系数越大,它们的相关程度越高. ( )(3)相关系数r的取值范围是(-1,1). ( )(4)若相关系数r=0,则说明成对样本数据间是函数关系. ( )2.下面对相关系数r描述正确的是 ( ).A.r>0表明两个变量负相关B.r>1表明两个变量正相关C.r只能大于零D.|r|越接近于0,两个变量相关关系越弱3.根据统计,某蔬菜基地西红柿亩产量的增加量y(单位:百千克)与某种液体肥料每亩使用量x(单位:千克)之间的对应数据的散点图如图所示.计算西红柿亩产量的增加量y与液体肥料每亩使用量x之间的相关系数(结果保留两位小数).附:相关系数rxy=.参考数据:≈0.55,≈0.95.【合作探究】探究1 散点图 为了了解人的身高与体重的关系,随机地抽取9名15岁的男生,测得如下数据:身高/cm 165 157 155 175 168 157 178 160 163体重/kg 52 44 45 55 54 47 62 50 53 问题1:怎样通过身高与体重的具体的数据来说明它们不是函数关系 问题2:如果把身高看作横坐标,体重看作纵坐标,在坐标系中画出的对应点是怎样的图形 从画出的图形中,你发现了什么规律 问题3:任意两个统计数据是否均可以作散点图 新知生成1.散点图我们以身高的取值为横坐标,以体重的取值为纵坐标,建立平面直角坐标系,则每对数据(Hi,Wi)都可在平面直角坐标系中用一个点Pi(i=1,2,…,n)表示.这些点称为散点,由坐标系及散点形成的数据图叫作散点图.2.如果两个变量之间的关系近似地表现为一条直线,那么称它们具有线性相关关系,简称为相关关系.3.如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,那么称它们线性相关,这实际上就是函数关系.新知运用例1 某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:x 10 15 17 20 25 28 32y 1 1.3 1.8 2 2.6 2.7 3.3 (1)画出散点图;(2)判断y与x是否具有线性相关关系.【方法总结】 判断变量之间有无相关关系,一种常用的简便可行的方法就是绘制散点图.散点图由数据点分布构成,是分析研究两个变量相关关系的重要手段.在散点图中,如果点的分布从整体上看大致在一条直线附近,那么这两个变量是线性相关的,否则不具备线性相关关系. 5名学生的数学和物理成绩如下表:学生学科 A B C D E数学 80 75 70 65 60物理 70 66 68 64 62 画出散点图,判断它们是否有相关关系.探究2 相关系数 散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的高低,更不能精确地说明成对样本数据之间关系的密切程度.问题:我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢 新知生成 相关系数样本容量是n的成对观测数据,用(x1,y1),(x2,y2),…,(xn,yn)表示,用{xi}表示数据x1,x2,…,xn,用{yi}表示数据y1,y2,…,yn,用=xi,=yi分别表示{xi}和{yi}的均值,用sx=,sy=分别表示{xi}和{yi}的标准差,记sxy=-=(xi-)(yi-),当sxsy≠0时,我们称rxy===为{xi}和{yi}的相关系数.新知运用例2 有人收集了某城市居民年收入x(单位:亿元)(即所有居民在一年内收入的总和)与A商品销售额y(单位:万元)的10年数据,如表所示.第n年 1 2 3 4 5 6 7 8 9 10居民年收 入/亿元 32.2 31.1 32.9 35.8 37.1 38.0 39.0 43.0 44.6 46.0A商品销 售额/万元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0 画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断居民年收入与A商品销售额的相关程度和变化趋势的异同.附:相关系数rxy=.【方法总结】 利用相关系数r判断线性相关关系时,需要利用公式计算出r的值,由于数据较多,需要借助计算器. 现随机抽取了某中学高一年级10名在校学生入学时的数学成绩x(单位:分)与入学后第一次考试的数学成绩y(单位:分),如下表:学生号 1 2 3 4 5 6 7 8 9 10x 120 108 117 104 103 110 104 105 99 108y 84 64 84 68 69 68 69 46 57 71 求样本的相关系数.【解析】 =×(120+108+…+99+108)=107.8,=×(84+64+…+57+71)=68,=1202+1082+…+992+1082=116584,=842+642+…+572+712=47384,xiyi=120×84+108×64+…+99×57+108×71=73796,所以所求相关系数rxy=≈0.7506.探究3 相关系数的性质问题1:若样本相关系数r=0.86,则成对样本数据的相关程度如何 问题2:|rxy|越接近于1,及越接近于0,表示两个变量x与y之间线性相关程度如何 新知生成相关系数的性质:(1)rxy的取值范围是[-1,1].(2)当0当-1当rxy=0时,称{xi}和{yi}不相关.(3)|rxy|越接近于1,变量x,y的线性相关程度越高,这时数据(x1,y1),(x2,y2),…,(xn,yn)分散在一条直线附近.(4)|rxy|越接近于0,变量x,y的线性相关程度越低.(5)rxy具有对称性,即rxy=ryx.(6)rxy仅仅是变量x与y之间线性相关程度的一个度量.rxy=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.新知运用一、相关系数的性质例3 甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并分别求得相关系数r如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85 则( )同学的试验结果体现A,B两变量的线性相关性最强.A.甲 B.乙 C.丙 D.丁【方法总结】 相关系数的性质(1)当rxy>0时,x,y两变量呈正相关关系;当rxy<0时,x,y两变量呈负相关关系.(2)rxy的绝对值越接近0,线性相关性越弱;rxy的绝对值越接近1,线性相关性越强.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图1,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图2.由这两个散点图可以判断 ( ).A.变量x与y正相关,变量u与v正相关B.变量x与y正相关,变量u与v负相关C.变量x与y负相关,变量u与v正相关D.变量x与y负相关,变量u与v负相关二、相关系数的计算及判断例4 潜叶蝇是南方地区水稻容易遭受的虫害之一,成虫将虫卵产在叶片里,待虫卵孵化之后幼虫会在叶片中啃食叶肉,使得秧苗的叶片呈现白色的状态,进而降低水稻产量.经研究,每只潜叶蝇的平均产卵数y(单位:个)和夏季平均温度x(单位:℃)有关,现收集了某地区以往6年的数据,得到下面数据统计表格.夏季平均温度xi/℃ 21 23 25 27 29 31产卵数yi/个 7 11 21 22 64 115 根据相关系数rxy判断潜叶蝇的平均产卵数y与夏季平均温度x是否具有相关关系.【方法总结】 当相关系数|rxy|越接近1时,两个变量的线性相关关系越强;当相关系数|rxy|越接近0时,两个变量的线性相关关系越弱. 某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:x 2 4 6 8y 30 40 50 70 (1)画出(x,y)的散点图;(2)计算x与y之间的样本相关系数,并判断它们的相关程度.【随堂检测】1.下列有关样本相关系数r的说法,错误的是( ).A.相关系数r可以用来衡量x与y之间的线性相关程度B.|r|≤1,且|r|越接近0,相关程度越低C.|r|≤1,且|r|越接近1,相关程度越高D.|r|≤1,且|r|越接近1,相关程度越低2.某火锅店为了了解营业额y(单位:百元)与气温x(单位:℃)之间的关系,随机统计并制作了某6天当天营业额与当天气温的对比表.气温/℃ 26 18 13 10 4 -1营业额/百元 20 24 34 38 50 64画出散点图并判断营业额与气温之间是否具有线性相关关系.2 展开更多...... 收起↑ 资源列表 4.1 课时1 成对数据的统计相关性(一) - 副本.docx 4.1 课时1 成对数据的统计相关性(一).docx