资源简介 新教材 苏教版2019版 数学选择性必修第二册第9章知识点清单目录第9章 统计9. 1 线性回归分析9. 2 独立性检验第9章 统计9. 1 线性回归分析一、变量间的相关关系1. 两个变量的关系分类 函数关系 相关关系特征 两变量具有确定性关系 两变量没有确定性关系2. 相关关系两个变量之间具有一定的联系,但又没有确定性函数关系,这种关系称为相关关系.3. 散点图将样本中的n个数据构成的点(xi,yi)(i=1,2,3,…,n)描在平面直角坐标系中得到的图形称为散点图.4. 线性相关关系散点图中的点散布在一条直线附近,将具有这种特性的相关关系称为线性相关关系.5. 正相关与负相关具有相关关系的两个变量的散点图如果呈从左下向右上方向发展的趋势,称这两个变量之间正相关,如果呈从左上向右下方向发展的趋势,则称这两个变量之间负相关.二、相关系数1. 对于变量x与y的n对数据(xi,yi)(i=1,2,3,…,n),一般用r= 来衡量y与x的线性相关强弱,这里的r称为相关系数.2. 相关系数r具有的性质(1)-1≤r≤1;(2)r>0时y与x呈正相关关系, r<0 时y与x呈负相关关系;(3) |r|越接近1 ,y与x相关的程度就越强, |r|越接近0 ,y与x相关的程度就越弱 .通常情况下,当|r|>0. 5时,认为线性相关关系显著;当|r|<0. 3时,认为几乎没有线性相关关系.三、线性回归方程1. 线性回归模型散点图上的一些点在一条直线附近,但并不都在这条直线上. 也就是说,这条直线并不能精确地反映x与y之间的关系,y的值不能由x确定,在此,我们将两者之间的关系表示为y=a+bx+ε,其中a+bx是确定性函数,ε称为随机误差. 我们将y=a+bx+ε称为线性回归模型.2. 线性回归方程设有n对观测数据(xi,yi)(i=1,2,3,…,n),根据线性回归模型,对于每一个xi,对应的随机误差项εi=yi-(a+bxi). 当++…+取得最小值时得到的直线=+x称为这n对数据的回归直线,此直线方程称为线性回归方程,其中称为回归截距, 称为回归系数, 称为回归值. 把上述方法称为“最小二乘法”.3. 线性回归方程的计算及性质线性回归方程: =+x中,回归系数的计算公式: ==,的计算公式: =-. 其中a,b上方加“^”表示由观察值按最小二乘法求得的估计值. 表示实际值y的估计值.性质(1)回归直线一定过点(, ).(2)y与x正相关的充要条件是>0,y与x负相关的充要条件是<0.(3) 的实际意义:当x增大一个单位时, 增大个单位.四、非线性回归方程1. 对于变量y与x的关系,不是线性相关关系,称为非线性相关关系,其方程称为非线性回归方程. 一般地,非线性回归方程的曲线类型可以通过作出散点图进行猜测,而非线性回归方程有时可以通过变量替换后,借助求线性回归方程的过程确定.五、变量间相关关系的判断1. 利用散点图判断两个变量的相关性(1)如果变量x和y正相关,那么散点图表现为点散布的位置是从左下到右上的区域;如果变量x和y负相关,那么散点图表现为点散布的位置是从左上到右下的区域.(2)如果散点落在一条直线附近,则认为这两个变量线性相关.2. 利用相关系数判断两个变量相关性强弱相关系数r是从数值上来判断变量间的线性相关程度的量,是定量分析. |r|刻画了样本点集中于某条直线的程度.|r|越接近1,散点图中的样本点分布越接近一条直线,两个变量的线性相关程度越强.六、求线性回归方程1. 利用公式==, =-求线性回归方程的一般步骤(1)列出xi,yi,xiyi;(2)计算, , , ;(3)代入公式计算, 的值;(4)写出线性回归方程.七、非线性回归分析1. 研究两个变量的关系时,依据样本数据画出散点图,从整体上看,如果样本点没有分布在一条直线附近,就称这两个变量之间不具有线性相关关系. 当两个变量不具有线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量代换,利用线性回归模型建立两个变量间的非线性回归方程. 常见的非线性回归方程的转换方式如下:曲线方程 曲线(曲线的一部分) 变换公式 变换后的线性函数y=axb c=ln a, v=ln x, u=ln y u=c+bvy=aebx c=ln a, u=ln y u=c+bxy=a c=ln a, v=, u=ln y u=c+bvy=a+bln x v=ln x y=a+bv2. 建立非线性回归模型的基本步骤(1)确定研究对象,明确涉及的变量;(2)画出确定好的变量间的散点图,观察它们之间的关系(是否存在非线性关系);(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数模型、指数函数模型、对数函数模型等);(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;(5)按照公式计算线性回归方程中的参数,得到线性回归方程;(6)消去新元,得到非线性回归方程.9. 2 独立性检验一、2×2列联表假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为Yy1 y2 合计X x1 a b a+bx2 c d c+d合计 a+c b+d a+b+c+d2×2列联表给出了成对分类变量数据的交叉分类频数.二、与独立性检验相关的概念1. χ2公式一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B(如吸烟与不吸烟);Ⅱ也有两类取值,即类1和类2(如患呼吸道疾病和未患呼吸道疾病).我们得到2×2列联表所示的抽样数据:Ⅱ类1 类2 合计Ⅰ 类A a b a+b类B c d c+d合计 a+c b+d a+b+c+d记n=a+b+c+d,则χ2=.2. 独立性检验用χ2统计量研究两类变量是否有关的方法称为独立性检验.三、独立性检验的思想1. 要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行(1)提出假设H0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表与χ2=计算χ2的值;(3)根据临界值(如下表所示),做出判断.P(χ2≥x0) 0. 50 0. 40 0. 25 0. 15 0. 10x0 0. 455 0. 708 1. 323 2. 072 2. 706P(χ2≥x0) 0. 05 0. 025 0. 010 0. 005 0. 001x0 3. 841 5. 024 6. 635 7. 879 10. 8282. 常用检验结论(1)若χ2>10. 828,则有99. 9%的把握认为“Ⅰ与Ⅱ有关系”;(2)若χ2>6. 635,则有99%的把握认为“Ⅰ与Ⅱ有关系”;(3)若χ2>2. 706,则有90%的把握认为“Ⅰ与Ⅱ有关系”;(4)若χ2≤2. 706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能得出结论“H0成立”,即Ⅰ与Ⅱ没有关系.四、由χ2进行独立性检验1. 独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,事实上,|ad-bc|越小,两个分类变量的关系越弱;|ad-bc|越大,两个分类变量的关系越强.五、独立性检验与统计、概率的综合应用解决与独立性检验有关的统计、概率综合问题,一般有以下几个步骤(1)厘清题意,理解问题中的条件和所要得出的结论,尤其是直方图中给定的信息,找关键量.(2)分析数据,列出2×2列联表.(3)利用独立性检验的步骤进行判断.(4)利用概率公式求事件的概率.(5)反思回顾、检查关键点、易错点及答题规范. 展开更多...... 收起↑ 资源预览