资源简介 (共27张PPT)8.3.2 独立性检验第八章 成对数据的统计分析数学1.基于2×2列联表,能通过实例,解释独立性检验的基本思想,归纳出独立性检验的基本步骤.(重点)学习目标2.能用独立性检验的思想和步骤解决简单的实际问题,提升数据分析能力(难点).课堂导入例1:学校 数学成绩 合计不优秀( =0) 优秀( =1) 甲校( =0) 33 10 43乙校( =1) 38 7 45合计 71 17 88推断:两校学生的数学成绩优秀率存在差异.不足:频率具有随机性.(频率稳定于概率)课堂探究通过频率比较,例1的推断:“两校学生的数学成绩优秀率存在差异”可能是错误的.犯错误的概率有多大 如何从概率的角度去研究两个分类变量 与 是否有关联 合计 =0 =1 =0 a b a+b =1 c d c+d合计 a+c b+d n=a+b+c+d概率语言表示类似反证法2×2列联表:二选一课堂探究课堂探究课堂探究课堂探究 合计 =0 =1 =0 a b a+b =1 c d c+d合计 a+c b+d n=a+b+c+d(依据频率稳定于概率的原理)零假设H0:分类变量 与 独立问题:构造一个怎样的统计量,可以判断两个变量 和 是否有关联呢 课堂探究零假设H0:分类变量 与 独立:事件 观测值 期望值 观测值与期望值差 =0, =0 a =0, =1 b =1, =0 c =1, =1 d残差课堂探究零假设H0:分类变量 与 独立:取值均不大反之,这些量取值较大时,就可以推断H0不成立.课堂探究零假设H0:分类变量 与 独立:课堂探究课堂探究问题 当零假设: 成立的条件下,应该是一个很小的数,当很大时,零假设不成立,究竟大到什么程度呢 判断不成立的标准是什么呢 (临界值表)0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828小概率值ɑ课堂探究小概率事件在一次试验中不大可能发生.思考:如何根据观测值大小推断两个分类变量是否有关 小概率事件不大可能发生对于一个小概率值α,事件课堂探究可以认为两个分类变量 与 独立由观测数据计算得到 的的观测值推断H0 不成立没有充分证据推断H0不成立认为两个分类变量 与 不独立,推断犯错误的概率不超过α基于小概率值 α 的检验规则:课堂探究上面这种利用取值推断分类变量 与 是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验概念生成学以致用例 :分析例1中的抽样数据,能否据此推断两校学生的数学成绩优秀率有差异 学校 数学成绩 合计不优秀( =0) 优秀( =1) 甲校( =0) 33 10 43乙校( =1) 38 7 45合计 71 17 88解:零假设H0:分类变量 与 独立.思考:两个例题基于同一组数据的分析的两种分析方法(条件概率法和卡方独立性检验法),但却得出了不同的结论,你能说明其中的原因吗 事实上,8.3.1中的例1只是根据一个样本的两个频率间存在差异得出两校学生数学成绩优秀率有差异的结论,并没有考虑由样本随机性可能导致的错误,所以其的推断依据不太充分.在本节例1中,我们用独立性检验对零假设H0进行了检验. 通过计算,发现 ≈0.837小于α=0.1所对应的临界值2.706,因此认为没有充分证据推断H0不成立,所以接受H0 ,推断出两校学生的数学成绩优秀率没有显著差异的结论.这个检验结果意味着,抽样数据中两个频率的差异很有可能是由样本随机性导致的. 因此,只根据频率的差异得出两校学生的数学成绩优秀率有差异的结论是不可靠的.由此可见,相对于简单比较两个频率的推断:用独立性检验得到的结果更理性、更全面,理论依据也更充分.课堂探究某儿童医院用甲、乙两种疗法治疗小儿消化不良,采用有放回简单随机抽样的方法对治疗情况进行检查,得到如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法是否比甲种疗法好.解: 零假设为H0:疗法与疗效独立,即两种疗法效果没有差异,由已知数据列出2×2列联表,如下:疗法 疗效 合计未治愈 治愈 甲 15 52 67乙 6 63 69合计 21 115 136≈4.881根据小概率值α=0.005的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两种疗法效果没有差异.跟踪练习思考:若对调例2的2×2列联表中两种疗法数据,则卡方计算公式中 a, b, c, d 的赋值都会相应地改变. 这样做会影响 取值的计算结果吗 疗法 疗效 合计未治愈 治愈 甲 15 52 67乙 6 63 69合计 21 115 136对调前疗法 疗效 合计未治愈 治愈 甲 6 63 69乙 15 52 67合计 21 115 136对调后这说明,对调两种疗法的位置,不会影响x2取值的计算结果,同理对调两种疗效的位置也不会影响结果.课堂探究名师解惑012×2列联表02零假设03计算的值,并与临界值04给出推断结果独立性检验的一般步骤 合计 =0 =1 =0 a b a+b =1 c d c+d合计 a+c b+d n=a+b+c+d评价反馈1.下列关于χ 的说法中正确的是( )A. χ 越大,“变量a,B 有关联”的可信度越小 B. χ 越大,“变量a,B 无关”的可信度越大C. χ 越小,“变量a,B 有关联”的可信度越小 D. χ 越小,“变量a,B 无关”的可信度越小CB评价反馈2.考察棉花种子是否经过处理跟生病之间的关系得到有关数据,根据数据计算得χ =0.164,则根据小概率值α=0.1的独立性检验,下列判断正确的是( )A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的课堂小结数学知识布置作业数形结合,概率与统计,特殊到一般实际问题成对分类变量( , )样本数据确切结论总体数据普查抽样调查2×2列联表计算比率2×2列联表独立性检验零假设H0: 与 独立小概率值当当犯错误概率不超过α思想方法2.教科书第135~136页习题8.3第2,4,7,8,9题..布置作业1.课题研究:自己收集数据,研究视力好坏与性别有关吗 谢谢大家 展开更多...... 收起↑ 资源预览