资源简介 (共18张PPT)“悟道诗---严加安”随机非随意,概率破玄机;无序隐有序,统计解迷离.第十章回归分析第一节 相关与回归分析概述二、相关关系的度量与可视化四、小结一、相关关系三、什么是回归分析一、相关关系函数关系:人的身高和体重父亲的身高和成年儿子的身高粮食的施肥量和产量商品的广告费和销售额相关关系:例如例如二、相关关系的度量与可视化1. 相关系数随机变量 X 和 Y 的相关系数定义如下:其中 是 X 和 Y 的协方差,分别为 X 和 Y 的方差.二、相关关系的度量与可视化1. 相关系数在实际问题中,基于X 和 Y 的 n 对观测数据可以利用下式计算 X 和 Y的相关系数:称 r 为变量 X 和 Y 的样本相关系数.二、相关关系的度量与可视化1. 相关系数样本相关系数 r 度量了变量 X 和 Y 的线性相关性的强弱,满足 . 对于固定的样本容量n1) ;2) 越接近于1时, X 和 Y 的线性相关性越强;3) 越接近于0时, X 和 Y 的线性相关性越弱.二、相关关系的度量与可视化1. 相关系数二、相关关系的度量与可视化2. 散点图二、相关关系的度量与可视化3. 相关系数矩阵图设有 m 个变量 ,对它们进行 n 次独立的观测,观测数据矩阵记为定义 的相关系数矩阵如下:3. 相关系数矩阵图其中这里为变量 和 的相关系数,满足 .例10.1.1 在有氧锻炼中,人的耗氧能力 Y 是衡量身体状况的重要指标,它可能与以下因素有关:年龄 X1 (岁),体重X2 (kg),1500米跑所用的时间X3(min),静止时心速 X4 (次/min),跑步后心速X5 (次/min).对24名40至57岁的志愿者进行了测试,结果如下表所列.试根据这些数据分析耗氧能力 Y 与诸因素之间的相关性.例10.1.1 数据表:序号 y x1 x2 x3 x4 x51 44.6 44 89.5 6.82 62 1782 45.3 40 75.1 6.04 62 1853 54.3 44 85.8 5.19 45 1564 59.6 42 68.2 4.9 40 1665 49.9 38 89 5.53 55 178… … … … … … …23 45.4 52 76.3 5.78 48 16424 54.7 50 70.9 5.35 48 146解经计算得 的相关系数矩阵如下:为了直观,绘制相关系数矩阵图,图中用椭圆色块直观地表示变量间的线性相关程度的大小.相关系数矩阵图第i 行,第 j 列的椭圆色块用来表示第i 个变量和第 j 个变量的相关性,其短半轴和长半轴满足注:椭圆越扁,变量间相关系数的绝对值越接近于1,椭圆越圆,变量间相关系数的绝对值越接近于0.若椭圆的长轴方向是从左下到右上,则变量间为正相关,反之为负相关.三、什么是回归分析回归分析是对变量的相关关系进行建模的数学工具. 回归分析的内容包括:1)从一组样本数据出发,确定因变量和自变量之间的数学关系式,即经验回归方程;2)对经验回归方程进行显著性检验;3)对回归方程中的各项进行检验,判断哪些项对因变量的影响是显著的,哪些是不显著的,通常需要剔除不显著的项,重新计算,对模型做出改进;4)利用所求得的经验回归方程进行预测和控制.小结1. 主要概念:相关关系,相关系数,样本相关系数,相关系数矩阵.2. 基于样本数据计算样本相关系数和相关系数矩阵.3. 散点图和相关系数矩阵图. 展开更多...... 收起↑ 资源预览