人教A版(2019)高中数学选择性必修第三册 8.3.2 独立性检验 教案(表格式)

资源下载
  1. 二一教育资源

人教A版(2019)高中数学选择性必修第三册 8.3.2 独立性检验 教案(表格式)

资源简介

课题 8.3.2独立性检验
教学目标
1.通过具体实例,知道独立性检验的意义;会利用概率和统计思想分析两个分类变量的独立性,了解独立性检验的来龙去脉,提升学生的数学运算和数据分析素养; 2. 了解2x2列联表独立性检验,会用独立性检验解决实际问题,增强学生的数学运算素养。
教学重点:独立性检验的基本思想和独立性检验的基本方法 教学难点: 统计量的导出和意义,独立性检验的思想和方法
教学过程
一:复习回顾: 上节课例1: 为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生. 通过测验得到了如下数据: 甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异. 表8.3-2 学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788
甲优秀率:.233,乙优秀率:.156 依据频率稳定于概率的原理,我们可以推断甲校学生数学成绩优秀的概率大于乙校学生数学成绩优秀的概率,进而可以推断两校学生中数学成绩优秀率之间存在差异. 【思考】你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的? 这一结论有可能是错误的.对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大. 因此,需要找到一种更为合理的推断方法判断两变量之间有无关系,同时也希望能对出现错误推断的概率有一定的控制或估算. 二:教学过程(独立性检验的基本步骤) 探究一:提出零假设H0 :X和Y相互独立 我们首先要做的工作是将问题数学化,请同学们用数学语言描述一下两个分类变量是否有关联? 考虑以ω为样本空间的古典概型. 我们将两个分类变量的列联表抽象简化,以0,1分别表示事件发生的两种结果,如下表所示,独立的另一层含义,即我们需要了解事件{X=1}与{Y=1} 是否存在关联?注意到{X=1}和{X=0},{Y=0}和{Y=1}都是互为对立事件,我们需要判断下面的假定关系 H0:P(Y=1│X=0)=P(Y=1│X=1)是否成立,通常称H0为零假设或原假设 教师指出,我们通过样本数据取推断两个变量是否有关联,有点类似法官凭证据判案,法官在判定一个嫌疑犯是否有罪前,应先作一个无罪假设。统计里有推断两个变量有关联前,也往往先作一个无关联的假定,即零假设H0 设计意图:在独立性检验中,零假设是一个比较难以理解的概念,零假设是研究的起始点,也是测量时间研究结果的基准,通过法官判案为例,形象地解释零假设的含义,可以帮助学生突破难点.通过将问题抽象为以概率语言表达的数学问题,以提升学生的数学抽象素养. 思考1:请同学们根据学过的有关知识对H0进行推导,看看能化简成怎样的形式? P(X=1)P(Y=1)=P(X=1,Y=1) 思考2:P(X=1)P(Y=1)=P(X=1,Y=1)这个条件说明零假设P(Y=1|X=0)=P(X=1,Y=1)等价于什么? 零假设H0等价于{X=1}与{Y=1}独立 思考3:根据已经学过的概率知识,还能得到什么性质? 根据相互独立的性质,下面的四条性质彼此等价 {X=0}与{Y=0}独立 P(X=0,Y=0)=P(X=0)P(Y=0) {X=0}与{Y=1}独立 P(X=0,Y=1)=P(X=0)P(Y=1) {X=1}与{Y=0}独立 P(X=1,Y=0)=P(X=1)P(Y=0) {X=1}与{Y=1}独立 P(X=1,Y=1)=P(X=1)P(Y=1) 因此,我们可以用概率语言,将零假设概述为H0:分类变量X和Y独立 探究二:分析零假设,构造检验的统计量 有了无罪假设后,法官需要去寻找证据。如果能够找到在无罪情况下不可能出现的物证,那么我们就可以否定无罪假设,从而证明嫌犯有罪。在统计学中,我们通常要从样本数据中找证据,寻找证据的方法是构造一个统计量,并且了解它的统计特征,利用样本计算这个统计量的应有统计性质,那么我们就有理由相信H0不成立。 为了使得研究更具有代表性,我们首先将上述的列联表的数据进行一般化处理 XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d
填表:根据上面的列联表,完成下面概率表1,概率表2中的统计的真实值。在零假设H0前提下,完成表2中的假设期望值,利用表2中的概率假设期望值,将表3补充完 整 想一想:若H0成立,依据频率稳定与概率的原理,列联表中观测值和期望值是否相等? {X=0,Y=0}发生的频数的观测值a和期望值应该比较接近.如果零假设H0成立,下面四个量的取值都不应该太大 思考:当过大时,变量之间不独立,但这些量究竟多大才能说明变量之间不独立呢?我们能不能选择一个量,用它的大小来检验变量之间是否独立呢? 一般来说,若频数的期望值较大,则③中相应的差的绝对值也会越大;若频数的期望值较小,则③中相应的差的绝对值也会较小。为了合理地平衡这种影响,我们将四个差的绝对值取平方后分别除以相应的期望值再求和,得到如下的统计量: 构造统计量. 上述表达式是 的计算公式, 读作“卡方” 探究三:确定检验规则,得出推断结论 用随机变量取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.那么,究竟大到什么程度,可以推断H0不成立呢?或者说,怎样确定判断大小的标准呢? 1.英国统计学家卡尔皮尔逊研究发现,在某些条件下统建议,计量近似地服从一个自由度为1的卡方分布. 2.在GeoGebra工具栏“视图”菜单中选择“概率统计”,点击“分布”在下拉菜单中选择“卡方分布”,在“自由度”中填入1,得到卡方密度曲线。 例如α=0.05,可以求得相应的临界值=3.8415 α=0.001,可以求得相应的临界值=10.8276 4.这条密度曲线给出了的概率,对于任何的小概率值α,可以找到,使=α,我们称为α的临界值. 5.说明:任意(0,1]可找到唯一xα,有P(x≥)=α 设计意图:经历统计量的构造过程,让学生通过GeoGebra工具,直观演示卡方密度曲线来阐述统计量的统计性质. 表8.3-4给出了独立性检验中5个常用的小概率值和相应的临界值. 0.050.010.0050.0013.8416.6357.87910.828
例如:对于小概率值,我们有如下的检验规则: 当我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过 当我们没有充分证据推断H0不成立,即认为X和Y独立. 基于小概率值的检验规则是: 当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过; 当时,我们没有充分证据推断H0不成立,即认为X和Y独立. 这种利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验(test of independence) 三:应用独立性检验解决实际问题 例3 某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名. (1)试根据小概率值=0.005(2)小概率值=0.05(3)小概率值=0.1 的独立性检验,分析乙种疗法的效果是否比甲种疗法好. 解:零假设为:H0:疗法与疗效独立,即两种疗法效果没有差异 表8.3-5 疗法疗效合计未治愈治愈甲155267乙66369合计21115136
由GeoGebra软件计算得=4.881 (1)=4.8817.879=根据小概率值=0.005的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两种疗法效果没有差异 (2) =4.8813.841=推断H0不成立,即认为两种疗法的效果有差异,该推断犯错误的概率不超过0.05 (3)=4.8812.706=推断H0不成立,即认为两种疗法的效果有差异,该推断犯错误的概率不超过0.1 总结:同一组数据得到了相反的结论,可见推断的结论与检验规则有关.另外,由于依据不同的检验规则,(2)和(3)两个推断犯错误的概率上界是不同的,而这种犯错误的概率只能通过多次试验才能表示出来,因此在具体地问题中,所试验的小概率值往往是由有经验的专家先确定的. 师生活动:让学生分组讨论,在进行班级交流。 设计意图:通过具体问题,让学生掌握独立性检验的一般步骤和推断原理,要使学生理解到,在统计推断中,不同的统计方法会有不同的推断结论,也会发生错误。 观察:在上表8.3-5中,若对调两种疗法的位置或对调两种疗效的位置,这样做会影响取值的计算结果吗? 师生活动:让学生在GeoGebra中调整行、列的位置,可以发现不改变观测值 教师:对调两种疗法的位置,相当与对调a与c,b与d的位置,对调两种疗效的位置,相当与对调a与b,c与d的位置,不影响的计算结果. 设计意图:从2×2列联表的结构特征,进一步理解观测值计算公式的性质 四:样本量对于独立性检验结果的影响 对于例1列连表8.3-2中的数据,依据=0.1的独立性检验,得出的结论是两校学生数学成绩的优秀率没有明显差异。我们将每个数据都变为原来的10倍依据=0.1的独立性检验,两校的数学成绩优秀率有差异吗? 教师:通常情况下,样本越大,提供的信息越充分,观测的结果会更准确。样本量变为原来的10倍,这种差异无法通过频率的计算表现出来,而独立性检验可能会得出不同的结论,可见统计量能够有效地提取样本所包含的有用信息 五:归纳总结: 回顾本节课的学习,请你总结应用独立性检验解决实际问题时大致包括几个主要环节? (2)独立性检验的思想类似于我们常用的反证法,你能指出两者之间的相同和不同之处吗? (3)你能说一说独立性检验的本质吗? (1)应用独立性检验解决实际问题大致应包括以下几个主要环节: ①提出零假设H0:X与Y相互独立,并给出在问题中的解释. ②根据抽样数据整理出22列连表,计算的值,并与临界值比较 ③根据检验规则得出推断推论 ④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律 注意:上述几个环节的内容可以根据不同情况进行调整,例如,在有些时候,分类变量的抽样数据列联表是问题中给定的. (2) 反证法独立性检验在某种假设H0下,如果推出一个矛盾,则证明H0不成立;若未能推出矛盾,不能对H0下任何结论,即反证法不成功在零假设H0下,如果出现一个与H0相矛盾的小概率事件,则推断H0不成立,且该推断犯错误的概率不大于这个小概率. 否则,不能推断H0不成立,通常会接受H0,即认为两个分类变量相互独立.反证法不会犯错误独立性检验会犯随机性错误
教师:从表的对比中,可以看出独立性检验的思想和反证法类似,但需要注意的是:在全部逻辑推理正确的情况下,反证法不会犯错误,而独立性检验可能会犯错误,对于这种犯错误概率的估计是独立性检验的重要组成部分. (3)独立性检验的本质是通过比较观测值与期望值之间的差异,来判断事件发生的概率大小.具体地,由所代表的这种差异的大小是通过确定的小概率值进行判断的,这是一种非常重要的推断方法,不仅有相当广泛的应用,也开启了人类认识世界的思维方式。 设计意图:回顾学习过程,梳理知识体系,了解原理法则,体会思想方法. 作业布置:练习1-4,习题8.3 5,6,7

展开更多......

收起↑

资源预览