资源简介 (共23张PPT)两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.1.相关关系把成对样本数据用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.2.散点图3.正相关与负相关一个变量随另一个变量的增加呈现减小的趋势.正相关:一个变量随另一个变量的增加呈现增加的趋势.负相关:温故知新:*8.1.2 样本相关系数通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等.散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小. 能否像引人均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢 通过绘图分析可得,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多,如图 (1)所示;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多,如图(2)所示.思考:根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?思考2:Lxy的大小是否一定能度量出成对样本数据的相关程度 因为Lxy的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小.为了消除度量单位的影响,需要对数据作进一步的“标准化”处理. 我们用我们称r为变量x和变量y的样本相关系数.样本相关系数:样本相关系数r是一个描述成对样本数据的数字特征,它反映了两个随机变量之间的线性相关程度.r的符号反映了相关关系的正负性.|r|的大小反映了两个变量线性相关的程度,即散点集中于一条直线的程度.样本相关系数:相关系数的性质:① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.② |r|≤1;③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.图8.1-5是不同成对样本数据的散点图和相应的样本相关系数.图(1)中的散点有明显的从左下角到右上角沿直线分布的趋势,说明成对样本数据呈现出线性相关关系;样本相关系数r=0.97,表明成对样本数据的正线性相关程度很强.图(2)中的散点有明显的从左上角到右下角沿直线分布的趋势,说明成对样本数据也呈现出线性相关关系;样本相关系数r=-0.85,表明成对样本数据的负线性相关程度比较强.从样本相关系数来看,图(1)中成对样本数据的线性相关程度要比图(2)中强一些;图(3)和图(4)中的成对样本数据的线性相关程度很弱,其中图(4)中成对样本数据的线性相关程度极弱.练习1:判断正误(正确的打“√”,错误的打“×”)(1)相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系( )(2)散点图越接近某一条直线,线性相关程度越强,样本相关系数越大( )(3)散点图能直观地分析出两个变量是否具有相关性.( )(4)若变量x,y满足函数关系,则这两个变量线性相关( )×√练习2:已知求得甲、乙、丙3组不同的数据的样本相关系数分别为0.81,-0.98,0.63,其中______(填甲、乙或丙)组数据的线性相关程度最强.乙√×编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14年龄/岁 23 27 39 41 45 49 50 53 54 56 57 58 60 61脂肪含量/% 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 35.2 34.6解:由样本数据可得由此可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.例1:根据表8.1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.解法2:由样本数据可得编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14年龄/岁 23 27 39 41 45 49 50 53 54 56 57 58 60 61脂肪含量/% 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 35.2 34.6例1:根据表8.1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.由此可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.变式1:在一次试验中,测得(x,y)4组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的样本相关系数为( )A.1 B.-2 C.0 D.-1解析:由样本数据可得DC1.由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的相关关系 为什么 解:样本相关系数可以反映变量之间相关的正负性及线性相关的程度,但由于样本数据的随机性,样本相关系数往往不能确切地反映变量之间的相关关系. 一般来说,样本量越大,根据样本相关系数推断变量之间相关的正负性及线性相关的程度越可靠,而样本量越小则越不可靠. 一个极端的情况是,无论两个变量之间是什么关系,如果样本量取2,则计算可得样本相关系数的绝对值都是1 (在样本相关系数存在的情况下),显然据此推断两个变量完全线性相关是不合理的.请看课本P103:练习12.变量x和变量y的3对随机观测数据(2,2),(3,-1),(5,-7),计算成对样本数据的样本相关系数. 能据此推断这两个变量线性相关吗 为什么 解:由样本数据可得虽然样本相关系数为-1,三个样本点在一条直线上,但是由于样本量太小,据此推断两个变量完全线性相关并不可靠.请看课本P103:练习2解:3.画出下列成对数据的散点图,并计算样本相关系数. 据此,请你谈谈样本相关系数在刻画成对样本数据相关关系上的特点.(1) (-2, -3), (-1, -1), (0, 1), (1, 3), (2, 5), (3, 7);(2) (0, 0), (1, 1), (2, 4), (3, 9), (4, 16);(3) (-2, -8), (-1, -1), (0, 0), (1, 1), (2, 8), (3, 27);(4) (2, 0) (1, ), (0, 2), (-1, ), (-2, 0).248x-4-320-213-16y-2 515x2041310y 20.51.5x-320-213-11y 51020x-10-320-213-115y-5 25样本相关系数主要刻画的是成对样本数据线性相关的程度.请看课本P103:练习3(1)(2)(3)(4)例2:有人收集了某城市居民年收入(所有居民在一年内收人的总和)与A商品销售额的10年数据,如下表所示.解:第n年 1 2 3 4 5 6 7 8 9 10居民年收入/亿元 32.2 31.1 32.9 35.8 37.1 38.0 39.0 43.0 44.6 46.0A商品销售额/万元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同画出成对样本数据的散点图,如图所示.从散点图看,A商品销售额与居民年收人的样本数据呈现出线性相关关系. 由样本数据计算得样本相关系数r≈0.95.由此可以推断,A商品销售额与居民年收入正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很强.例3:在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.体重与身高、臂展与身高分别具有怎样的相关性 编号 身高/cm 体重/kg 臂展/cm 编号 身高/cm 体重/kg 臂展/cm12345678910111213 1731791751791821731801701691 77177178174 55715262826355815454596756 1691701721771741661741 691 66176170174170 141516171819202122232425 166176176175169184169182171177173173 666149604886585458615851 161166165173162189164170164173165169根据样本数据画出体重与身高、臂展与身高的散点图,分别如图 (1)和(2)所示,两个散点图都呈现出线性相关的特征解:通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正线性相关. 其中,臂展与身高的相关程度更高.4.随机抽取7家超市,得到其广告支出与销售额数据如下:解:由样本数据可得正线性相关,相关性较强,销售额与广告支出的变化趋势相同.超市 A B C D E F G广告支出/万元 1 2 4 6 10 14 20销售额/万元 19 32 44 40 52 53 54请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.请看课本P103:练习4课堂小结:1. 样本相关系数:2.相关系数的性质:① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.② |r|≤1;③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.学以致用:足球是深受全世界人们喜爱的运动,我国大力发展校园足球.为了解本地区足球特色学校的发展状况,社会调查小组得到如下统计数据:年份x 2016 2017 2018 2019 2020足球特色学校y(百个) 0.30 0.60 1.00 1.40 1.70根据上表数据,计算y与x的样本相关系数r,并说明y与x的线性相关程度.(附: 若0.75≤|r|≤1,则认为y与x的线性相关程度很强;若0.3≤|r|<0.75,则认为y与x的线性相关程度一般;|r|≤0.25,则认为y与x的线性相关程度较弱)解:根据题意得∴y与x的线性相关程度很强. 展开更多...... 收起↑ 资源预览