资源简介 4.1 成对数据的统计相关性学习目标(1)通过实例,了解两个变量之间的关系,能用散点图表示它们的关系.(2)会作散点图,并利用散点图认识变量间的相关关系.(3)通过实例,了解相关系数的概念,理解相关系数的性质,并能用相关系数来研究两个变量的关系.(4)通过实例,了解多个变量之间的关系,能将多个变量分解成几个不同的两组数据分别进行相关性分析.(5)通过实例,了解向量夹角的概念,用向量夹角来研究两个变量的相关关系.课前预习要点一 相关关系1.散点图:由坐标系及散点形成的数据图.2.相关关系:如果两个变量之间的关系近似地表现为一条________,则称它们有线性相关关系,简称为相关关系.3.函数关系:如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称它们线性相关,这实际上就是函数关系.4.相关系数:一般地,对于n个成对观测数据(x1,y1),(x2,y2),…,(xn,yn),当数据{xi},{yi}(i=1,2,…,n)的标准差都不为0 时,我们称r==为{xi},{yi}的相关系数.5.相关系数的性质:(1)rxy值范围是[-1,1].当0(2) |rxy|越接近于1时,变量x,y的线性相关程度越高 ,这时数据(x1,y1),(x2,y2),…,(xn,yn)分散在一条直线附近.(3)|rxy|越接近于0时,变量x,y的线性相关程度________.(4)rxy具有对称性,即rxy=ryx.(5)rxy仅仅是变量x与y之间线性相关程度的一个度量.rxy=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.要点二 相关系数与向量夹角把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),向量夹角的大小可以用余弦来刻画,我们就用余弦来刻画两个向量的相关关系.. 当夹角在[0,)内时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度越高;余弦值越小表示两个向量的夹角越大,两组数据的正相关程度越低.当夹角在(,π]内时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度越低;余弦值越小表示两个向量的夹角越大,两组数据的负相关程度越高.当夹角为时,余弦值为0,说明两组数据不相关.基 础 自 测1.判断正误(正确的画“√”,错误的画“×”)(1)若两个变量正相关,则样本相关系数大于0小于1.( )(2)相关系数越大,两个变量的相关性就越强.( )(3)若相关系数r=0,则两变量x,y之间没有关系.( )2.下列两个量之间的关系是相关关系的是( )A.匀速直线运动中时间与位移的关系B.学生的成绩和身高C.儿童的年龄与体重D.物体的体积和质量3.若变量y与x之间的样本相关系数r=-0.983 2,则变量y与x之间( )A.具有很弱的线性相关关系B.具有较强的线性相关关系C.它们的线性相关关系还需要进一步确定D.不确定4.如图所示的两个变量具有相关关系的是________(填序号). 题型探究·课堂解透——强化创新性题型3 线性相关关系例1 某零售店近5个月的销售额和利润额资料如下表所示:(1)根据上表数据作出散点图;(2)观察散点判断利润额y关于销售额x是否具有线性相关关系.如果具有线性相关关系,那么是正相关还是负相关?方法归纳两个变量是否线性相关的判断方法巩固训练1 某个男孩的年龄与身高的统计数据如下表所示.(1)画出散点图;(2)判断y与x是否具有线性相关关系.题型2 相关系数例2 互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:据统计表明,y与x之间具有线性相关关系,请用样本相关系数r对y与x之间的相关性强弱进行判断.(若|r|>0.8,则可认为y与x有较强的线性相关关系)参考数据:方法归纳相关系数可以反映两个变量之间的线性相关程度,即散点集中于一条直线的程度,其符号反映了相关关系的正负性.用相关系数能够较准确的判断相关的程度.巩固训练2 科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的简单随机样本数据,如下表:根据上表中的样本数据,计算样本相关系数(精确到0.01),并推断它们的相关关系及相关程度.题型3 多组成对数据的相关性例3 某电器销售公司的管理人员认为,月销售收入是广告费用的函数.下面是该公司近8个月的月销售收入与广告费用数据,试分析其月销售收入与电视广告费用、月销售收入与报纸广告费用之间的相关关系.题型4 相关系数与向量夹角例4 用向量夹角分析例3中月销售收入与电视广告费用、月销售收入与报纸广告费用之间的相关关系.4.1 成对数据的统计相关性课前预习[教材要点]要点一2.直线5.(1)正相关 负相关 (3)越低 [基础自测]1.(1)√ (2)× (3)×2.解析:A、D是函数关系;B是不相关关系;C是相关关系,故选C.答案:C3.解析:变量y与x之间的样本相关系数r=-0.983 2,|r|=0.983 2,接近1,样本相关系数的绝对值越大,相关性越强,∴变量y与x之间有较强的线性相关关系,故选B.答案:B4.解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.答案:②③题型探究·课堂解透例1 解析:(1)散点图如图所示:(2)由散点图可知,所有散点接近一条直线排列,所以利润额与销售额是线性相关关系,由图可知当销售额增加时,利润额呈现增加的趋势,所以是正相关.巩固训练1 解析:(1)散点图如图所示.(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.例2 解析:由题意知,==7,==7,样本相关系数r==≈0.857>0.8.故可认为y与x有较强的线性相关关系.巩固训练2 解析:=(26+56+39+49+61+53+27+58+41+60)=47,=(14.5+31.4+21.2+26.3+34.6+29.6+17.8+33.5+25.9+35.2)=27,r===,因为≈6.56,≈54.18,所以r=≈0.98,由样本相关系数r≈0.98,可以推断人体脂肪含量和年龄的相关程度很强.例3 解析:由题意可得= 2=[(96-93.75)2+(90-93.75)2+…+(94-93.75)2]≈3.188,=2=[(5-3.187 5)2+(2-3.187 5)2+…+(3-3.187 5)2]≈0.809,= 2=[(1.5-2.475)2+(2-2.475)2+…+(2.5-2.475)2]≈0.727,sxy==(96×5+90×2+…+94×3)-93.75×3.187 5≈1.297,sxz==(96×1.5+90×2+…+94×2.5)-93.75×2.475≈-0.031,所以rxy==≈0.808,rxz==≈-0.020.上述结果表明月销售收入与电视广告费用之间正相关程度高,月销售收入与报纸广告费用之间呈负相关关系.例4 解析:由于≈93.75,≈3.187 5,≈2.475,将例3表中的三组数据分别减去.记x=(x1-,x2-,…,x8-),y=(y1-,y2-,…,y8-),z=(z1-,z2-,…,z8-).则可得x=(2.25,-3.75,1.25,-1.75,1.25,0.25,0.25,0.25),y=(1.812 5,-1.187 5,0.812 5,-0.687 5,-0.187 5,0.312 5,-0.687 5,-0.187 5),z=(-0.975,-0.475,-0.975,0.025,0.825,-0.175,1.725,0.025),于是有cos 〈x,y〉=≈0.808,cos 〈x,z〉=≈-0.021.由此可以看出,月销售收入与电视广告费用的余弦值较大,说明这两组数据正相关程度高;月销售收入与报纸广告费用的余弦值为负数,说明这两组数据呈负相关关系,且负相关程度较低. 展开更多...... 收起↑ 资源预览