资源简介 (共31张PPT)《应用统计学》相关分析&回归分析第一节 相关关系第二节 一元线性回归第三节 多元线性回归CONTENTS目录CONTENTS目录第一节 相关系数应用统计学应用统计学函数关系(确定性关系):指现象之间存在着严格的数量依存关系,可以用数学式(函数式)表达。一一对应关系,变量值确定,函数值随之唯一确定。圆的半径与面积之间的关系:A=πr2例如:相关关系的概念应用统计学相关关系(不确定性关系)指现象之间客观存在不严格的数量依存关系,变量间关系不能用函数关系精确表达。一个变量的取值不能由另一个变量唯一确定变量x取某个值时,变量y 的取值可能有几个相关关系的例子①小孩身高(y)与父母身高 (x)之间的关系 ②收入水平(y)与受教育程度(x)之间的关系 ③商品销售额(y)与广告费支出(x)之间的关系 xy相关关系的概念应用统计学相关程度:完全相关、不相关和不完全相关相关方向:正相关和负相关相关形式:线性相关和非线性相关按变量多少:单相关、复相关和偏相关相关性质:真实相关和虚假相关相关关系的概念应用统计学相关表:在具有相关关系的各种因素中,把其中一个因 素按数值大小顺序排列,再把其他因素对应排列形成。相关图:是用来描述两个事物之间的相关关系的统计图,通常使用散点图。相关关系的概念应用统计学完全正线性相关 完全负线性相关 非线性相关 正线性相关 负线性相关 不相关相关表和相关图应用统计学某企业的广告费与家电销售额相关表广告费 0.4 0.5 0.7 0.8 1 1.2 1.2 1.5 1.5 1.6 1.8 2.5家电销售额 17 21 24 11 43 46 55 65 79 80 82 105广告费与家电销售额相关图(散点图)相关表和相关图应用统计学①定义:是用来测定变量间相关密切程度和相关方向的指标②对两个变量之间线性相关程度的度量称为简单相关系数③若相关系数是根据总体全部数据计算的,称为总体相关系数④若是根据样本数据计算的,则称为样本相关系数相关系数应用统计学相关系数的取值范围-1≤ r ≤1根据相关系数的值可以判断变量之间的相关方向和相关程度0-1r=0, 表示x与y不线性相关r=1或-1, 表示x与y完全相关相关系数应用统计学Pearson相关系数Pearson相关系数合适于定比和定距数据。相关系数应用统计学Spearman相关系数:主要用于测量顺序数据的相关密切程度和相关方向计算步骤:确定两个变量等级计算每对数据相应的等级的差量记为di相关系数第二节 一元线性回归应用统计学回归分析概念引入应用统计学什么是回归分析?①从一组样本数据出发,确定因变量和自变量之间的数学关系式。②对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。③利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。回归分析概念引入应用统计学回归分析和相关分析的关系相关关系的研究,一是研究变量之间关系的密切程度,称之为相关分析;二是采用适当的数学模型表述变量之间的变动关系,称之为回归分析。回归模型与回归方程应用统计学一元线性回归模型可表示为:y = 0+ 1 x+ y 是 x 的线性函数(部分)加上误差项。线性部分反映了由于 x 的变化而引起的 y 的变化。误差项 是随机变量,反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响。回归模型与回归方程应用统计学描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程一元线性回归方程的形式如下:E( y ) = 0+ 1 x方程的图示是一条直线,也称为直线回归方程 0是回归直线在 y 轴上的截距 1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值回归模型与回归方程应用统计学 线性回归模型的估计应用统计学最小二乘估计其中,线性回归模型拟合优度应用统计学总离差的分解:总离差平方和SST=残差平方和SSE+回归平方和SSR线性回归模型拟合优度应用统计学判定系数:①回归平方和占总离差平方和的比例:②反映回归直线的拟合程度③取值范围在 [ 0 , 1 ] 之间④ R2 1,说明回归方程拟合的越好;R2 0,说明回归方程拟合的越差线性回归直线的显著性检验应用统计学总体显著性检验:假设:统计量决策F>F (k,n-k-1) 说明回归方程显著线性回归直线的显著性检验应用统计学显著性检验方差分析表线性回归直线的显著性检验应用统计学单个回归系数显著性体验假设:统计量回归方程通过总体显著性检验,也可能出现某些单个变量xi对y不显著。第三节 多元线性回归应用统计学应用统计学为研究某商品销售量、人口数量及人均收入之间的关系,随机抽取了10个地区为样本,样本数据如下。试根据样本数据建立某商品销售量、人口数量及人均收入之间的关系模型。地 区 1 2 3 4 5 6 7 8 9 10商品销售量y 38 28 54 32 16 40 20 46 28 14人均收入x1(万元) 3.67 4.87 5.70 4.26 3.52 5.67 4.50 3.67 3.21 3.84人口数量x2(10万人) 35 23 49 27 11 33 13 42 26 6多元线性回归模型与方程应用统计学多元线性回归模型多元线性回归模型可表示为:是参数 。 是包含在y里面但不能被k个自变量的线性关系所解释的变异性。多元线性回归模型与方程应用统计学多元线性回归方程描述因变量 y 的平均值或期望值如何依赖于自变量 x1, x2 ,…,xk的方程。多元线性回归方程的形式:E( y ) = 0+ 1 x1 + 2 x2 +…+ k xk 0 , 1, 2 , , k称为偏回归系数 i 表示假定其他变量不变,当 xi 每变动一个单位时,y 的平均变动值多元线性回归模型的估计应用统计学单个回归系数显著性体验由书本上的式(8.20)得方程:解方程组,得 ,于是商品销售量与各地人口数量及人均可支配收入之间的经验回归方程为 。多元线性回归模型的检验应用统计学多元回归模型的拟合优度:多重判定系数:修正多重判定系数: 展开更多...... 收起↑ 资源预览