资源简介 独立性检验(知识讲解)学习目标:1·了解独立性检验的基本思想的方法,能够运用独立性检验对两个分类变量是否线性相关作出判断2,借助于实例体会独立性检验的基本步骤.一、分类变量对于性别变量,其取值为男和女两种,这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为“分类变量”.在现实生活中,分类变量是大量存在的,例如吸烟变量有吸烟和不吸烟两个“值”,月份变量有十二个“值”,【补充说明】分类变量中所谓的“变量”和“值"都应该作广义的理解,它们并不是指具体的数值.例如对于性别变量,“变量”指的是性别,而“值“指的是男和女在日常生活中,我们常常关心两个分类变量之间是否有关系,例如,吸烟与患肺癌是否有关系?性别是否对喜欢数学课程有影响?等等·下面我们借助一个实例来体验一下:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965像上表这样列出的两个分类变量的频数表,称为列联表·由上表可以粗略估计出:在不吸烟样本中,有0.54%患肺癌;在吸烟样本中,有2.28%患肺癌,因此直观上可以得出结论:吸烟和患肺癌有关第1页(共4页)二、独立性检验下面我们利用统计分析的手段作进一步研究:先假设:吸烟与患肺癌没有关系用A表示不吸烟,表示不患肺癌,则吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”,即H0÷P(AB)=P(A)P(B)把上表中的数字用字母代替,得到如下用字母表示的列联表:不患肺癌患肺癌总计不吸烟aa+b吸烟c+d总计a十c8+da+6+c+d在上表中,a恰好为事件AB发生的频数;a+b和a十c恰好分别为事件A和事件B发生的频数.因为频率接近于概率.所以在五成立的条件下应该有:≈a+b×a+c(其中L=a+b+e+为样本容量).-X-将上式化简得到ad-c≈0.因此,lad-bc越小,说明吸烟与患肺癌之间关系越弱;lad-c越大,说明吸烟与患肺癌之间关系越强为了使不同样本容量的数据有统一的评判标准,基于上面的分析,我们构造一个随机变量n(ad -be)2K=a+e十a十90+可(其中n=a+b+c+功样本容量)·若假设H成立,即“吸烟与患肺癌没有关系”,则应该很小根据数字列联表中的数据,计算得到2的观测值约为56.632·这个值到底能告诉我们什么呢?统计学家经过研究后发现,在Ho成立的情况下,P(K2≥6.635)≈0.01即在H成立的情况下,2的观测值超过6.635的概率非常小,近似为0.01,是一个小概率事件而现在K2的观测值约为56.632,远远大于阀值6.635.所以我们有理由断定H0不成立,即认为“吸烟与患肺癌有关系”但这种判断需要承担不超过1第2页(共4页)独立性检验(知识讲解)学习目标:1·了解独立性检验的基本思想的方法,能够运用独立性检验对两个分类变量是否线性相关作出判断2,借助于实例体会独立性检验的基本步骤.一、分类变量对于性别变量,其取值为男和女两种,这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为“分类变量”.在现实生活中,分类变量是大量存在的,例如吸烟变量有吸烟和不吸烟两个“值”,月份变量有十二个“值”,【补充说明】分类变量中所谓的“变量”和“值"都应该作广义的理解,它们并不是指具体的数值.例如对于性别变量,“变量”指的是性别,而“值“指的是男和女在日常生活中,我们常常关心两个分类变量之间是否有关系,例如,吸烟与患肺癌是否有关系?性别是否对喜欢数学课程有影响?等等·下面我们借助一个实例来体验一下:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965像上表这样列出的两个分类变量的频数表,称为列联表·由上表可以粗略估计出:在不吸烟样本中,有0.54%患肺癌;在吸烟样本中,有2.28%患肺癌,因此直观上可以得出结论:吸烟和患肺癌有关第1页(共4页)二、独立性检验下面我们利用统计分析的手段作进一步研究:先假设:吸烟与患肺癌没有关系用A表示不吸烟,B表示不患肺癌,则吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”,即H0÷P(AB)=P(A)P(B)把上表中的数字用字母代替,得到如下用字母表示的列联表:不患肺癌患肺癌总计不吸烟aa+b吸烟c+d总计a十c8+da+6+c+d在上表中,a恰好为事件AB发生的频数;a+b和a十c恰好分别为事件A和事件B发生的频数.因为频率接近于概率.所以在五成立的条件下应该有:≈a+b×a+c(其中L=a+b+e+为样本容量).-X-将上式化简得到ad-c≈0.因此,lad-bc越小,说明吸烟与患肺癌之间关系越弱;lad-c越大,说明吸烟与患肺癌之间关系越强为了使不同样本容量的数据有统一的评判标准,基于上面的分析,我们构造一个随机变量n(ad -bc)2K=a+e十a十90+可(其中n=a+b+c+功样本容量)·若假设H成立,即“吸烟与患肺癌没有关系”,则应该很小根据数字列联表中的数据,计算得到2的观测值约为56.632·这个值到底能告诉我们什么呢?统计学家经过研究后发现,在Ho成立的情况下,P(K2≥6.635)≈0.01即在H成立的情况下,2的观测值超过6.635的概率非常小,近似为0.01,是一个小概率事件而现在K2的观测值约为56.632,远远大于阀值6.635.所以我们有理由断定H0不成立,即认为“吸烟与患肺癌有关系”但这种判断需要承担不超过1第2页(共4页) 展开更多...... 收起↑ 资源列表 独立性检验(知识讲解)(学生版).pdf 独立性检验(知识讲解)(教师版).pdf