资源简介 1085850011760200第八章 成对数据的统计分析 第八章 成对数据的统计分析 知识巩固 知识巩固 知识点1. 变量的相关关系 知识点1. 变量的相关关系 1.相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系. 2.散点图:将样本中的每一个序号下的成对样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图. 3.正相关与负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关 知识点2.相关关系的分类 知识点2.相关关系的分类 (1)按变量间的增减性分为正相关和负相关. ①正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势; ②负相关:当一个变量的值增加时,另一个变量的相应值呈现减少的趋势. (2)按变量间是否有线性特征分为线性相关和非线性相关(曲线相关). ①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关; ②非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量非线性相关或曲线相关. 知识点3.一元线性回归模型 知识点3.一元线性回归模型 称为Y关于x的一元线性回归模型.其中Y称为因变量或响应变量,x称为自变量或解释变量,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差,如e=0,那么Y与x之间的关系就可以用一元线性函数模型来描述. 知识点4 对模型刻画数据效果的分析 知识点4 对模型刻画数据效果的分析 1.残差图法 残差图中,如残差比较均匀地集中在以横轴为对称轴的水平带状区域内,说明经验回归方程较好地刻画两个变量的关系. 2.残差平方和法 残差平方和(yi-i)2越小,模型的拟合效果越好. 3.R2法 可以用R2=1-来比较两个模型的拟合效果,R2越大,模型拟合效果越好,R2越小,模型拟合效果越差. 知识点5.独立性检验 知识点5.独立性检验 1.定义:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验. 2.χ2=,其中n=a+b+c+d. 3.独立性检验解决实际问题的主要环节 (1)提出零假设H0:X和Y相互独立,并给出在问题中的解释. (2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较. (3)根据检验规则得出推断结论. (4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律. 题型探究 题型探究 一元线性回归模型及其应用 1.该知识点是具有线性相关关系的两变量的一种拟合应用,目的是借助函数的思想对实际问题做出预测和分析. 2.主要培养数学建模和数据分析的素养. 一元线性回归模型及其应用 1.该知识点是具有线性相关关系的两变量的一种拟合应用,目的是借助函数的思想对实际问题做出预测和分析. 2.主要培养数学建模和数据分析的素养. 例一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格: 人数xi 10 15 20 25 30 35 40 件数yi 4 7 12 15 20 23 27 其中i=1,2,3,4,5,6,7. (1)以每天进店人数为横坐标,每天商品销售件数为纵坐标,画出散点图; (2)求经验回归方程;(结果保留到小数点后两位) (3)预测进店人数为80时商品销售的件数.(结果保留整数) 参考公式:经验回归方程=x+, =,=-. 解(1)由表中数据,画出7个数据点, 可得散点图如图所示. (2)∵iyi=3 245,=25,≈15.43, =5 075,72=4 375. ∴=≈0.777, =- =-4.00. ∴经验回归方程是=0.78x-4.00. (3)进店人数为80时,商品销售的件数=0.78×80-4.00≈58(件). 独立性检验 1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,查表分析并判断相关性结论的可信程度. 2.通过计算χ2值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养. 独立性检验 1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,查表分析并判断相关性结论的可信程度. 2.通过计算χ2值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养. 例奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下: 是否愿意提供 志愿者服务 性别 愿意 不愿意 男生 20 10 女生 10 20 (1)用分层随机抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人? (2)依据小概率值α=0.01的独立性检验,能否据此推断该校高中生是否愿意提供志愿者服务与性别有关? 下面的临界值表供参考: α 0.10 0.05 0.010 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 χ2=,其中n=a+b+c+d. 解 (1)由题意,男生抽取6×=4(人). (2)零假设H0:该校高中生是否愿意提供志愿者服务与性别无关. 则χ2=≈6.667>6.635=x0.01, 所以依据小概率值α=0.01的独立性检验,可以认为该校高中生是否愿意提供志愿者服务与性别有关. 展开更多...... 收起↑ 资源预览