资源简介 (共27张PPT)应用统计学任务描述与分析A市自来水公司承担着对全市居民和企业单位供水的业务。为了平衡供水和用水关系,合理进行水资源的开发和利用,公司必须对A市的用水量进行预测,并据此进行水资源的合理开发和管理,那么我们应该如何进行用水量的预测呢?(1)自来水用水量与城镇居民人口数两个变量是不是存在依存关系,关系的密切程度如何 (2)如果存在依存关系,那么这种关系的具体形式是什么?是线性关系,还是曲线关系?怎样找出一个合适的方程来表示这种关系?(3)怎样根据城镇居民人口数的变化来估计城市用水量的变化?任务分析思考题请按照您的直觉在以下二维空间画出人的身高与体重的关系:O身高1、你所画的线条是正斜率还是负斜率?2、你所画的线条是直线还是曲线?请问体重主要内容任务一、现象之间有无关系任务二、相关关系的表现形式任务三、相关密切程度和方向相关分析任务四、建立相关回归方程任务五、测定预测误差回归分析任务一、现象之间是否存在相关任务二、相关的表现形式是否结束任务三、相关的方向、密切程度任务四、建立适当数学模型任务五、检测模型的有效性线形相关非线性相关相关关系社会现象之间的依存关系确定性、严格的依存关系函数关系不确定、不规则 的依存关系相关关系的概念线性相关非线性相关按相关的形式,可分为线性相关——散点图接近一条直线(左图)非线性相关——散点图接近一条曲线(右图)(1)是一一对应的确定关系(2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量(3)各观测点落在一条轨迹上 xy(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;(3)当变量 x 取某个值时,变量 y 的取值可能有几个;(4)y的取值虽然有一定的随机性,但总是围绕着他们的平均数波动并遵循一定的变动规律。 xy定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。四、相关关系的判断1、简单相关表企业编号 固定资产价值 工业增加值12345678910 346889991011 15202525303029343741相关表2、单变量分组相关表对自变量数值进行分组,计算出各组的次数和因变量组的平均数,就是单变量分组相关表。工人看管织机台数X(台) 工人数f(人) 时劳动生产率Y(米)5~67~89~1011~1213~1415~1617~18 11131828312917 151823263338433、双变量分组相关表对两个变量都进行分组,交叉排列,并列出两个变量各组间的共同次数,就是双变量分组相关表。运木材成本y(元/立方米) 木材运量(万立方米)1-11 11-21 21-31 31-41 41-51 合计16—2111—166—11 2513343111 3138合计 7 7 7 2 1 24注意:自变量在横行上,按从小到大排列、自左向右排列;因变量放在纵栏,按变量值从大到小、自上而下排列。相关图居民家庭月收入和消费支出相关图横轴表示自变量、纵轴表示因变量,标出每对变量值的坐标点,以相关点的分布状态来反映相关关系从变量相关关系变化的方向看正相关——变量同方向变化同增同减负相关——变量反方向变化一增一减相关系数分析线性相关条件下,相关的密切程度相关关系的测度(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关不存在直线关系完全正相关负相关程度增加r正相关程度增加(二)性质:0<|r|<1表示存在不同程度线性相关:|r|≤0.3为不存在线性相关0.3< |r| ≤ 0.5 为低度线性相关;0.5< |r| ≤0.8为显著线性相关;|r| >0.8为高度线性相关。所以家庭月支出与家庭月收入之间是高度正相关关系相关分析回归分析在相关分析的基础上,建立相关的数量模型,并进行估算和预测的统计分析方法区别 相关分析 回归分析变量性质 两变量都是随机的 自变量是确定的因变量是随机的变量关系 对等 不对等分析内容 相关程度、方向 数量变动关系几何意义:b表示直线的斜率;a表示直线的截距经济意义:b表示当自变量x每增加一个单位时,因变量y平均变动量a表示当自变量x为0时,因变量的预测值一元线性回归xya一元线性回归模型的建立 某农场对单位面积化肥用量X(kg)和水稻产量Y(kg)作了统计,其统计数据如表所示.试分析这些数据中所蕴含的规律性.X15 20 25 30 35 40 45Y330 345 365 405 445 490 455xy5004504003501020304050300估计标准误差因变量实际值与估计值离差的平均数估计标准误差估计标准误差的意义:误差越小,回归方程的准确性越高,代表性越大 展开更多...... 收起↑ 资源预览