资源简介 4.3.2 独立性检验最新课程标准 1.了解2×2列联表、随机变量χ2的意义.2.通过对典型案例的分析,了解独立性检验的基本思想方法.(重点)3.通过对典型案例的分析,了解两个事件的独立性检验的应用.(难点)知识点一 卡方统计量χ2=,用χ2的大小可以决定是否拒绝原来的统计假设“事件A与B独立”.如果算出的χ2值________,就拒绝“事件A与B独立”,从而就认为它们是有关的了.知识点二 五个临界值(1)当根据具体的数据算出的χ2>2.706时,有________的把握说事件A与B有关;(2)当χ2>3.841时,有________的把握说事件A与B有关;(3)当χ2>6.635时,有________的把握说事件A与B有关;(4)当χ2>7.879时,有________的把握说事件A与B有关;(5)当χ2>10.828时,有________的把握说事件A与B有关;当χ2≤2.706时,认为事件A与B是________的.[基础自测]1.下列选项中,哪一个χ2的值可以有95%以上的把握认为“A与B有关系”( )A.χ2=2.700 B.χ2=2.710C.χ2=3.765 D.χ2=5.0142.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 合计爱好 40 20 60不爱好 20 30 50合计 60 50 110经计算得χ2=≈7.8.则正确结论是( )A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”3.考察棉花种子是否经过处理与是否生病之间的关系,得到下表中的数据:种子处理 种子未处理 合计得病 32 101 133不得病 61 213 274合计 93 314 407根据以上数据可得出( )A.种子是否经过处理与是否生病有关B.种子是否经过处理与是否生病无关C.种子是否经过处理决定是否生病D.有90%的把握认为种子经过处理与生病有关4.若由一个2×2列联表中的数据计算得χ2=4.013,那么有________的把握认为两个变量之间有关系.题型一 用2×2列联表分析两事件之间的关系例1 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人的饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用与判断二者是否有关系. →→→方法归纳1.作2×2列联表时,注意应该是4行4列,计算时要准确无误.2.作2×2列联表时,关键是对涉及的变量分清类别.跟踪训练1 上例中条件不变,尝试用|n11n22-n12n21|的大小判断饮食习惯与年龄是否有关.题型二 由χ2进行独立性检验例2 在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.未感冒 感冒 合计使用血清 258 242 500未使用血清 216 284 500合计 474 526 1 000 独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.方法归纳1.独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足n11n22-n12n21≈0,因此|n11n22-n12n21|越小,关系越弱;|n11n22-n12n21|越大,关系越强.2.独立性检验的具体做法(1)根据实际问题的需要确定允许推断“事件A与B有关系”犯错误的概率的上界α,然后查表确定临界值k0.(2)利用公式χ2=计算随机变量χ2.(3)如果χ2≥k0,推断“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.跟踪训练2 为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:患胃病 未患胃病 合计生活不规律 60 260 320生活有规律 20 200 220合计 80 460 540根据以上数据判断40岁以上的人患胃病与生活规律有关吗?题型三 独立性检验的综合应用 1.利用χ2进行独立性检验,估计值的准确度与样本容量有关吗?[提示] 利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确,如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.2.在χ2运算后,得到χ2的值为29.78,在判断变量相关时,P(χ2≥6.635)≈0.01和P(χ2≥7.879)≈0.005,哪种说法是正确的?[提示] 两种说法均正确.P(χ2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P(χ2≥7.879)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两个变量相关.例3 为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:男 女需要 40 30不需要 160 270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由. 根据题中表格提供的数据,可通过求χ2的值进行判定.对于(1)(3)可依据古典概率及抽样方法分析求解.方法归纳1.检验两个变量是否相互独立,主要依据是利用χ2=公式计算χ2的值,再利用该值与3.841,6.635两个值进行比较作出判断.2.χ2计算公式较复杂,一是公式要清楚;二是代入数值时不能张冠李戴;三是计算时要细心.3.统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推测全部数据的性质.因此,统计推断是可能犯错误的,即从数据上体现的只是统计关系,而不是因果关系.跟踪训练3 若两个分类变量x和y的列联表为: yx y1 y2x1 5 15x2 40 10则x与y之间有关系的概率约为________.教材反思4.3.2 独立性检验新知初探·自主学习知识点一较大知识点二(1)90% (2)95% (3)99% (4)99.5% (5)99.9% 无关[基础自测]1.解析:∵5.014>3.841,故D正确.答案:D2.解析:根据独立性检验的思想方法,正确选项为C.答案:C3.解析:χ2=≈0.164<3.841,即没有充足的理由认为种子是否经过处理跟生病有关.答案:B4.解析:查阅χ2表知有95%的把握认为两个变量之间有关系.答案:95%课堂探究·素养提升例1 【解析】 饮食习惯与年龄2×2列联表如下:年龄在六十岁以上 年龄在六十岁以下 合计饮食以蔬菜为主 43 21 64饮食以肉类为主 27 33 60合计 70 54 124将表中数据代入公式得=≈0.67,==0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.跟踪训练1 解析:将本例2×2列联表中的数据代入可得|n11n22-n12n21|=|43×33-21×27|=852.相差较大,可在某种程度上认为饮食习惯与年龄有关系.例2 【解析】 假设感冒与是否使用该种血清没有关系.由列联表中的数据,求得χ2=≈7.075.χ2=7.075>6.635,P(χ2≥6.635)=0.01,故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用.跟踪训练2 解析:由公式得χ2=≈9.638.∵9.638>6.635,∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.例3 【解析】 (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为=14%.(2)χ2=≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法进行抽样,这比采用简单随机抽样方法更好.跟踪训练3 解析:χ2=≈18.822.∵18.822>6.635,∴x与y之间有关系的概率约为1-0.01=0.99.答案:0.99 展开更多...... 收起↑ 资源预览