资源简介 一、样本相关系数1.样本相关系数r的计算公式我们称r为变量x和变量y的样本相关系数,计算公式为r=2.样本相关系数r的性质①|r|≤1;②当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关;③|r|越接近1,成对样本数据的线性相关程度越强;④|r|越接近0,成对样本数据的线性相关程度越弱.二、一元线性回归模型及其应用1.一元线性回归模型用x表示父亲身高,Y表示儿子身高,e表示随机误差.假定随机误差e的均值为0,方差为与父亲身高无关的定值σ2,则它们之间的关系可以表示为我们称上式为Y关于x的一元线性回归模型.其中, Y称为因变量或响应变量,x称为自变量或解释变量,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.2.经验回归方程对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),记=,=,其回归直线y=bx+a的斜率和截距的最小二乘估计分别为.我们将 称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法.经验回归方程过样本中心点(,),是经验回归方程最常用的一个特征.3.求一元线性回归模型的步骤(1)收集样本数据,画散点图,确定x,y存在线性相关关系.(2)数据制成表格xi,yi, ,xiyi, , ,(3)代入公式计算,, 公式为.(4)写出一元线性回归模型.4.决定系数R2=1- (a,b∈R)时,称之为非线性经验回归方程,当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来模拟,常见的非线性经验回归方程的转换方式总结如下表.曲线方程 变换公式 变换后的线性关系式y=axb c=ln a,v=ln x,u=ln y u=c+bvy=aebx c=ln a,u=ln y u=c+bxy=ae c=ln a,v=,u=ln y u=c+bvy=a+bln x v=ln x y=a+bvy=a+b v= y=a+bv三、独立性检验1.2×2列联表一般地,对于两个研究对象X和Y,X有两类取值:{X=0}和{X=1}(如吸烟与不吸烟);Y也有两类取值:{Y=0}和{Y=1}(如患呼吸道疾病与不患呼吸道疾病),得到如下表所示:X Y 合计Y=0 Y=1X=0 a b a+bX=1 c d c+d合计 a+c b+d n=a+b+c+d2.独立性检验的一般步骤(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2,χ2==,并与临界值xα比较.(3)根据检验规则得出推断结论.(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y的影响规律.3.临界值统计学家们根据统计数据得到了如下几个常用的小概率值和相应的临界值如表所示.α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828 展开更多...... 收起↑ 资源预览