10.1 相关与回归分析概述 课件(共18张PPT)- 《概率论与数理统计》同步教学(机工版)

资源下载
  1. 二一教育资源

10.1 相关与回归分析概述 课件(共18张PPT)- 《概率论与数理统计》同步教学(机工版)

资源简介

(共18张PPT)
“悟道诗---严加安”
随机非随意,概率破玄机;
无序隐有序,统计解迷离.
第十章
回归分析
第一节 相关与回归分析概述
二、相关关系的度量与可视化
四、小结
一、相关关系
三、什么是回归分析
一、相关关系
函数关系:
人的身高和体重
父亲的身高和成年儿子的身高
粮食的施肥量和产量
商品的广告费和销售额
相关关系:
例如
例如
二、相关关系的度量与可视化
1. 相关系数
随机变量 X 和 Y 的相关系数定义如下:
其中 是 X 和 Y 的协方差,
分别为 X 和 Y 的方差.
二、相关关系的度量与可视化
1. 相关系数
在实际问题中,基于X 和 Y 的 n 对观测数据
可以利用下式计算 X 和 Y的相关系数:
称 r 为变量 X 和 Y 的样本相关系数.
二、相关关系的度量与可视化
1. 相关系数
样本相关系数 r 度量了变量 X 和 Y 的线性相关性的强弱,满足 . 对于固定的样本容量n
1) ;
2) 越接近于1时, X 和 Y 的线性相关性越强;
3) 越接近于0时, X 和 Y 的线性相关性越弱.
二、相关关系的度量与可视化
1. 相关系数
二、相关关系的度量与可视化
2. 散点图
二、相关关系的度量与可视化
3. 相关系数矩阵图
设有 m 个变量 ,对它们进行 n 次独立的观测,观测数据矩阵记为
定义 的相关系数矩阵如下:
3. 相关系数矩阵图
其中
这里
为变量 和 的相关系数,满足 .
例10.1.1 在有氧锻炼中,人的耗氧能力 Y 是衡量身体状况的重要指标,它可能与以下因素有关:年龄 X1 (岁),体重X2 (kg),1500米跑所用的时间X3(min),静止时心速 X4 (次/min),跑步后心速X5 (次/min).对24名40至57岁的志愿者进行了测试,结果如下表所列.试根据这些数据分析耗氧能力 Y 与诸因素之间的相关性.
例10.1.1 数据表:
序号 y x1 x2 x3 x4 x5
1 44.6 44 89.5 6.82 62 178
2 45.3 40 75.1 6.04 62 185
3 54.3 44 85.8 5.19 45 156
4 59.6 42 68.2 4.9 40 166
5 49.9 38 89 5.53 55 178
… … … … … … …
23 45.4 52 76.3 5.78 48 164
24 54.7 50 70.9 5.35 48 146

经计算得 的相关系数矩阵如下:
为了直观,绘制相关系数矩阵图,图中用椭圆色块直观地表示变量间的线性相关程度的大小.
相关系数矩阵图
第i 行,第 j 列的椭圆色块用来表示第i 个变量和第 j 个变量的相关性,其短半轴和长半轴满足
注:椭圆越扁,变量间相关系数的绝对值越接近于1,椭圆越圆,变量间相关系数的绝对值越接近于0.若椭圆的长轴方向是从左下到右上,则变量间为正相关,反之为负相关.
三、什么是回归分析
回归分析是对变量的相关关系进行建模的数学工具. 回归分析的内容包括:
1)从一组样本数据出发,确定因变量和自变量之间的数学关系式,即经验回归方程;
2)对经验回归方程进行显著性检验;
3)对回归方程中的各项进行检验,判断哪些项对因变量的影响是显著的,哪些是不显著的,通常需要剔除不显著的项,重新计算,对模型做出改进;
4)利用所求得的经验回归方程进行预测和控制.
小结
1. 主要概念:相关关系,相关系数,样本相关系数,相关系数矩阵.
2. 基于样本数据计算样本相关系数和相关系数矩阵.
3. 散点图和相关系数矩阵图.

展开更多......

收起↑

资源预览