资源简介 第4节 列联表与独立性检验(时间:45分钟,满分:72分)[备注:单选、填空题5分,多选题6分]1.在研究打鼾与患心脏病的关系中,通过收集数据、整理分析数据得“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是( )A.100个吸烟者中至少有99人打鼾B.1个人患有心脏病,那么这个人有99%的概率打鼾C.在100个心脏病患者中一定有打鼾的人D.在100个心脏病患者中可能一个打鼾的人也没有2.为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:药物 流感患流感 未患流感服用 2 18未服用 8 12根据表中数据,计算χ2,若由此认为“该药物预防流感有效果”,则该结论出错的概率不超过( )A.0.05 B.0.1 C.0.01 D.0.0053.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到列联表:优秀 非优秀 合计甲班 10 b乙班 c 30合计 105已知在全部的105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,依据小概率值α=0.05的独立性检验,能认为“成绩与班级有关系”D.根据列联表中的数据,依据小概率值α=0.05的独立性检验,不能认为“成绩与班级有关系”4.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验.整理所得数据后发现,若依据小概率值α=0.010的独立性检验,则认为学生性别与是否支持该活动无关;若依据小概率值α=0.025的独立性检验,则认为学生性别与是否支持该活动有关,则χ2的值可能为( )A.4.238 B.4.972C.6.687 D.6.0695.已知某独立性检验中,由χ2=,n=a+b+c+d计算出χ2=,若将2×2列联表中的数据a,b,c,d分别变成2a,2b,2c,2d,计算出的χ2=,则( )A.= B.=2C.=2 D.=46.〔多选〕每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,甲、乙两家公司今年分别提供了2个和3个不同的职位,一共收到了100份简历,具体数据如下:公司 文史男 文史女 理工男 理工女甲 10 10 20 10乙 15 20 10 5分析毕业生的选择意愿与性别的关联关系时,已知对应的χ2的值χ1≈1.010;分析毕业生的选择意愿与专业的关联关系时,对应的χ2的值χ2≈9.091,则下列说法正确的是( )A.有99.9%的把握认为毕业生的选择意愿与专业相关联B.毕业生在选择甲、乙公司时,选择意愿与专业的关联性比与性别的关联性更大一些C.理工科专业的毕业生更倾向于选择甲公司D.女性毕业生更倾向于选择乙公司7.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400人(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层随机抽样的方法抽取23人,则抽取的男生人数为 .8.某驾驶员培训学校为对比了解“科目二”的培训过程,采用大密度集中培训与周末分散培训两种方式,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有50名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过 .9.足球是一项大众喜爱的运动,某机构为了解喜爱足球是否与性别有关联,随机抽取了若干人进行调查,已知抽取的女性人数是男性的2倍,男性中喜爱足球的人数占男性人数的,女性中喜爱足球的人数占女性人数的.若本次调查得出“根据小概率值α=0.005的独立性检验,认为是否喜爱足球与性别有关联”的结论,则被调查的男性人数至少为( )A.10 B.11C.12 D.1310.〔多选〕晚上睡眠充足是提高学习效率的必要条件,某高中M的高三年级学生晚上10点10分必须休息,另一所同类高中N的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中高中M有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则( )A.高中M的前50名学生中有60%的学生学习效率高B.高中N的前50名学生中有40%的学生学习效率高C.有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关D.认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率超过0.0511.为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为20k (k∈N*),则k= .12.(15分)(2024·全国甲卷17题改编)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:优级品 合格品 不合格品 合计甲车间 26 24 0 50乙甲间 70 28 2 100合计 96 52 2 150(1)能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?(2)已知升级改造前该工厂产品的优级品率p=0.5,设为升级改造后抽取的n件产品的优级品率.如果>p+1.65,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)第4节 列联表与独立性检验1.D 2.A 3.C 4.D 5.B 因为=,所以===2.故选B.6.BCD 7.15 8.0.001 9.C 设被调查的男性人数为x,则女性人数为2x,根据题意可得列联表如表:态度 性别 合计男 女喜爱足球不喜爱足球合计 x 2x 3x则χ2==,因为根据小概率值α=0.005的独立性检验,认为是否喜爱足球与性别有关联,所以χ2≥7.879,即≥7.879,解得x≥11.818 5,又因为列联表中的所有数据均为整数,所以x的最小值为12.10.AC 高中M的前50名学生中有30人学习效率高,即×100%=60%,A正确;高中N的前50名学生中有10人学习效率高,即×100%=20%,B错误;这100名学生中学习效率高的学生有100×0.4=40(人),根据题意填写列联表如下,学校 学习效率高低 合计学习 效率高 学习效率 不高高中M 30 20 50高中N 10 40 50合计 40 60 100χ2==≈16.667>10.828=x0.001,有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关,C正确;认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率不超过0.05,D错误.故选A、C.11.5或6 解析:设男、女学生的总人数为2n,则2n=20k(k∈N*),由题意建立2×2列联表为:喜欢 不喜欢 合计男生 0.8n 0.2n n女生 0.6n 0.4n n合计 1.4n 0.6n 2n所以χ2==,又因为有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关,所以3.841≤<6.635 80.661≤2n<139.335,又2n=20k(k∈N*),所以4.033 05≤k<6.966 75,所以k=5或k=6.12.解:(1)根据题意列出列联表:优级品 非优级品 合计甲车间 26 24 50乙车间 70 30 100合计 96 54 150可得χ2===4.687 5,因为3.841<4.687 5<6.635,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲、乙两车间产品的优级品率存在差异.(2)由题意可知,生产线智能化升级改造后,该工厂产品的优级品的频率为=0.64,用频率估计概率可得=0.64,又因为升级改造前该工厂产品的优级品率p=0.5,则p+1.65=0.5+1.65×≈0.5+1.65×≈0.57,可知>p+1.65,所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.1 / 1第4节 列联表与独立性检验1.掌握分类变量的含义. 2.通过实例,理解2×2列联表的统计意义. 3.通过实例,了解2×2列联表独立性检验及其应用.知识梳理1.分类变量与列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的 ,n是样本量,其样本频数列联表(称为2×2列联表)如表所示:X Y 合计Y=0 Y=1X=0 a b a+bX=1 c d c+d合计 a+c b+d n=a+b+c+d2.等高堆积条形图(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征;(2)如果通过直接计算或等高堆积条形图发现和相差很大,就判断两个分类变量之间有关系.3.独立性检验(1)概念:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验;(2)χ2的计算公式:χ2= ;(3)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值);(4)独立性检验中几个常用的小概率值和相应的临界值:α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828提醒:独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断,χ2越大,认为两个分类变量有关系的把握越大.诊断自测1.判断正误.(正确的画“√”,错误的画“×”)(1)2×2列联表中的数据是两个分类变量的频数.( )(2)事件A和B的独立性检验无关,即两个事件互不影响.( )(3)χ2的大小是判断事件A和B是否相关的统计量.( )(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.( )2.一个2×2列联表如表所示,则表中a,c处的值分别为( )y1 y2 合计x1 a 25 73x2 21 b c合计 d 49A.98,28 B.28,98C.48,45 D.45,483.想要检验喜欢参加体育活动是不是与性别有关,应该提出统计假设H0为( )A.男性喜欢参加体育活动B.女性不喜欢参加体育活动C.喜欢参加体育活动与性别有关D.喜欢参加体育活动与性别无关4.根据分类变量x与y的成对样本数据,计算得χ2=2.826,依据α=0.05的独立性检验,正确的结论为( )参考值:α 0.1 0.05 0.01xα 2.706 3.841 6.635A.x与y不独立B.x与y不独立,这个结论犯错误的概率不超过0.05C.x与y独立D.x与y独立,这个结论犯错误的概率不超过0.05分类变量与列联表(基础自学过关)1.〔多选〕根据如图所示的等高堆积条形图,下列叙述正确的是( )A.吸烟患肺病的频率约为0.2B.吸烟不患肺病的频率约为0.8C.不吸烟患肺病的频率小于0.05D.吸烟与患肺病无关系2.在某次独立性检验中,得到如下列联表:A 合计B 200 800 1 000180 a 180+a合计 380 800+a 1 180+a最后发现,两个分类变量没有关联,则a的值可能是( )A.200 B.720 C.100 D.1803.假设有两个分类变量X和Y,它们的值域分别为{x1,x2} 和{y1,y2},其2×2列联表为:X Y 合计y1 y2x1 a b a+bx2 c d c+d合计 a+c b+d n=a+b+c+d对同一样本,以下数据能说明X 与Y 有关的可能性最大的一组为( )A.a=5,b=4,c=3,d=2B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5D.a=3,b=2,c=4,d=5分类变量的两种统计表示形式 (1)2×2 列联表:用定量的方式判断两分类变量是否有关联及关联性的强弱; (2)等高堆积条形图:能更直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征.分类变量关联性的判断(师生共研过关)(2026·江苏盐城模拟)根据分类变量Ⅰ与Ⅱ的统计数据,计算得到χ2=2.954,则( )α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828A.变量Ⅰ与Ⅱ相关B.变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1C.变量Ⅰ与Ⅱ不相关D.变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.1听课记录 如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.训练1 (1)某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算得χ2=6.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是( )A.90% B.95%C.99% D.99.5%(2)根据分类变量 X 和Y 的样本观察数据的计算结果,有不少于95%的把握认为 X 和Y 有关,则χ2的值不可能为( )α 0.150 0.100 0.050 0.010 0.005xα 2.072 2.706 3.841 6.635 7.879A.2.819 B.5.512C.6.635 D.8.243独立性检验的应用(师生共研过关)(2025·全国Ⅰ卷15题)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1 000人,得到如下列联表:组别 超声波检查结果 合计正常 不正常患该疾病 20 180 200未患该疾病 780 20 800合计 800 200 1 000(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.独立性检验的一般步骤 (1)提出零假设H0:X和Y相互独立; (2)根据样本数据制成2×2列联表; (3)根据公式χ2=计算; (4)比较χ2与临界值的大小关系,根据检验规则得出推断结论.训练2 (2026·山东聊城模拟)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于130分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组[90,100)的频数为10.(1)求a的值和样本容量;(2)估计所有参赛学生的平均成绩;(3)假设在抽取的样本中,男生比女生多20人,女生的获奖率为12.5%,依据小概率值α=0.01的独立性检验,判断男生与女生的获奖情况是否存在差异?第4节 列联表与独立性检验【夯实必备知识】知识梳理1.(2)频数3.(2)诊断自测1.(1)√ (2)× (3)√ (4)×2.C 3.D 4.C【研透核心考点】考点11.ABC 2.B 3.D 考点2【例1】 B 零假设为H0:变量Ⅰ与Ⅱ不相关,因为χ2=2.954>2.706,依据α=0.1的独立性检验可知,推断H0不成立,即认为变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1.故选B.训练1 (1)B (2)A 解析:(1)结合选项,由临界值表,得6.023>3.841=x0.05,所以断言市民收入增减与旅游愿望有关系的可信程度为95%.(2)因为有不少于95%的把握认为 X 和Y 有关,所以χ2≥3.841,只有A不满足要求.故选A.考点3【例2】 解:(1)由题表可知,检查结果不正常者有200人,检查结果不正常者中患有该疾病的有180人,所以由样本估计总体得p==0.9.(2)零假设为H0:超声波检查结果与是否患该疾病无关.χ2==>10.828,所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为超声波检查结果与是否患该疾病有关.训练2 解:(1)由频率分布直方图中,所有矩形面积之和为1可得(a+0.01×2+0.005+0.015+0.025)×10=1,解得a=0.035,样本容量为=100.(2)所有参赛学生的平均成绩为=95×0.1+105×0.1+115×0.25+125×0.35+135×0.15+145×0.05=120.(3)由题意可知,获奖人数为100×(0.015+0.005)×10=20,零假设为H0:男生与女生的获得情况无差异.由题意可计算得如下2×2列联表:性别 奖励 合计获奖 未获奖男 15 45 60女 5 35 40合计 20 80 100所以χ2==2.343 75<6.635,所以,依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,即男生与女生的获奖情况无差异.1 / 1(共62张PPT)第4节 列联表与独立性检验课标要求1. 掌握分类变量的含义.2. 通过实例,理解2×2列联表的统计意义.3. 通过实例,了解2×2列联表独立性检验及其应用.目录/CONTENTS夯实必备知识01研透核心考点02课时跟踪检测0301PART夯实必备知识知识梳理1. 分类变量与列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的 ,n是样本量,其样本频数列联表(称为2×2列联表)如表所示:频数 X Y 合计Y=0 Y=1X=0 a b a+bX=1 c d c+d合计 a+c b+d n=a+b+c+d2. 等高堆积条形图(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征;(2)如果通过直接计算或等高堆积条形图发现 和 相差很大,就判断两个分类变量之间有关系.3. 独立性检验(1)概念:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验;(2)χ2的计算公式:χ2= ;(3)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值); (4)独立性检验中几个常用的小概率值和相应的临界值:α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828提醒:独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断,χ2越大,认为两个分类变量有关系的把握越大.诊断自测1. 判断正误.(正确的画“√”,错误的画“×”)(1)2×2列联表中的数据是两个分类变量的频数. ( √ )(2)事件A和B的独立性检验无关,即两个事件互不影响. ( × )(3)χ2的大小是判断事件A和B是否相关的统计量. ( √ )(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强. ( × )√×√×2. 一个2×2列联表如表所示,则表中a,c处的值分别为( )y1 y2 合计x1 a 25 73x2 21 b c合计 d 49A. 98,28 B. 28,98C. 48,45 D. 45,48√解析: 由2×2列联表知,a+25=73,b+25=49,b+21=c,解得a=48,b=24,c=45.3. 想要检验喜欢参加体育活动是不是与性别有关,应该提出统计假设H0为( )A. 男性喜欢参加体育活动B. 女性不喜欢参加体育活动C. 喜欢参加体育活动与性别有关D. 喜欢参加体育活动与性别无关√解析: 独立性检验是一种假设性检验,假设有反证法的意味,应假设两个变量无关,即应提出统计假设H0:喜欢参加体育活动与性别无关.4. 根据分类变量x与y的成对样本数据,计算得χ2=2.826,依据α=0.05的独立性检验,正确的结论为( )参考值:α 0.1 0.05 0.01xα 2.706 3.841 6.635A. x与y不独立B. x与y不独立,这个结论犯错误的概率不超过0.05C. x与y独立D. x与y独立,这个结论犯错误的概率不超过0.05√解析: 零假设为H0:x与y独立,由χ2=2.826<3.841,依据α=0.05的独立性检验,可得H0成立,故可以认为x与y独立.02PART研透核心考点分类变量与列联表(基础自学过关)1. 〔多选〕根据如图所示的等高堆积条形图,下列叙述正确的是( )A. 吸烟患肺病的频率约为0.2B. 吸烟不患肺病的频率约为0.8C. 不吸烟患肺病的频率小于0.05D. 吸烟与患肺病无关系√√√解析: 从等高堆积条形图上可以明显地看出,吸烟患肺病的频率远远大于不吸烟患肺病的频率,D错误.A、B、C都正确.2. 在某次独立性检验中,得到如下列联表:A 合计B 200 800 1 000180 a 180+a合计 380 800+a 1 180+a最后发现,两个分类变量没有关联,则a的值可能是( )A. 200 B. 720 C. 100 D. 180√解析:∵两个分类变量没有关联,∴ ≈ ,解得a≈720,故选B.3. 假设有两个分类变量X和Y,它们的值域分别为{x1,x2} 和{y1,y2},其2×2列联表为:X Y 合计y1 y2x1 a b a+bx2 c d c+d合计 a+c b+d n=a+b+c+d对同一样本,以下数据能说明X 与Y 有关的可能性最大的一组为( )A. a=5,b=4,c=3,d=2B. a=5,b=3,c=4,d=2C. a=2,b=3,c=4,d=5D. a=3,b=2,c=4,d=5√解析: 对于同一样本,|ad-bc| 越小,说明X 与Y 相关性越弱,而|ad-bc| 越大,说明X 与Y 相关性越强,通过计算知,对于A,B,C,都有|ad-bc|=|10-12|=2;对于D,有|ad-bc|=|15-8|=7,显然7>2.故选D.分类变量的两种统计表示形式(1)2×2 列联表:用定量的方式判断两分类变量是否有关联及关联性的强弱;(2)等高堆积条形图:能更直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征.分类变量关联性的判断(师生共研过关)(2026·江苏盐城模拟)根据分类变量Ⅰ与Ⅱ的统计数据,计算得到χ2=2.954,则( )α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828A. 变量Ⅰ与Ⅱ相关B. 变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1C. 变量Ⅰ与Ⅱ不相关D. 变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.1√解析: 零假设为H0:变量Ⅰ与Ⅱ不相关,因为χ2=2.954>2.706,依据α=0.1的独立性检验可知,推断H0不成立,即认为变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1.故选B. 如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.训练1 (1)某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算得χ2=6.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是( B )A. 90% B. 95%C. 99% D. 99.5%解析: 结合选项,由临界值表,得6.023>3.841=x0.05,所以断言市民收入增减与旅游愿望有关系的可信程度为95%.B(2)根据分类变量 X 和Y 的样本观察数据的计算结果,有不少于95%的把握认为 X 和Y 有关,则χ2的值不可能为( A )α 0.150 0.100 0.050 0.010 0.005xα 2.072 2.706 3.841 6.635 7.879A. 2.819 B. 5.512C. 6.635 D. 8.243解析: 因为有不少于95%的把握认为 X 和Y 有关,所以χ2≥3.841,只有A不满足要求.故选A.A独立性检验的应用(师生共研过关)(2025·全国Ⅰ卷15题)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1 000人,得到如下列联表:组别 超声波检查结果 合计正常 不正常患该疾病 20 180 200未患该疾病 780 20 800合计 800 200 1 000(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;解: 由题表可知,检查结果不正常者有200人,检查结果不正常者中患有该疾病的有180人,所以由样本估计总体得p= =0.9.(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.解:零假设为H0:超声波检查结果与是否患该疾病无关.χ2= = >10.828,所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为超声波检查结果与是否患该疾病有关.独立性检验的一般步骤(1)提出零假设H0:X和Y相互独立;(2)根据样本数据制成2×2列联表;(3)根据公式χ2= 计算;(4)比较χ2与临界值的大小关系,根据检验规则得出推断结论.训练2 (2026·山东聊城模拟)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于130分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组[90,100)的频数为10.(1)求a的值和样本容量;解: 由频率分布直方图中,所有矩形面积之和为1可得(a+0.01×2+0.005+0.015+0.025)×10=1,解得a=0.035,样本容量为 =100.(2)估计所有参赛学生的平均成绩;解:所有参赛学生的平均成绩为 =95×0.1+105×0.1+115×0.25+125×0.35+135×0.15+145×0.05=120.(3)假设在抽取的样本中,男生比女生多20人,女生的获奖率为12.5%,依据小概率值α=0.01的独立性检验,判断男生与女生的获奖情况是否存在差异?解:由题意可知,获奖人数为100×(0.015+0.005)×10=20,零假设为H0:男生与女生的获得情况无差异.由题意可计算得如下2×2列联表:性别 奖励 合计获奖 未获奖男 15 45 60女 5 35 40合计 20 80 100所以χ2= =2.343 75<6.635,所以,依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,即男生与女生的获奖情况无差异.03PART课时跟踪检测(时间:45分钟,满分:72分)[备注:单选、填空题5分,多选题6分]1. 在研究打鼾与患心脏病的关系中,通过收集数据、整理分析数据得“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是( )A. 100个吸烟者中至少有99人打鼾B. 1个人患有心脏病,那么这个人有99%的概率打鼾C. 在100个心脏病患者中一定有打鼾的人D. 在100个心脏病患者中可能一个打鼾的人也没有123456789101112√解析: 在犯错误的概率不超过0.01的前提下认为这个结论是成立的,其意义就是我们有99%的把握认为打鼾与患心脏病有关,在100个心脏病患者中可能一个打鼾的人也没有,故C错误,D正确;对于A,题设中没有给出吸烟与打鼾相关性判断,故A错误;对于B,独立性检验是对分类变量相关性的判断,不能具体到个体,故B错误.故选D.1234567891011122. 为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:药物 流感患流感 未患流感服用 2 18未服用 8 12根据表中数据,计算χ2,若由此认为“该药物预防流感有效果”,则该结论出错的概率不超过( )A. 0.05 B. 0.1√C. 0.01 D. 0.005解析: 由题意知,χ2= =4.8>3.841=x0.05,故认为“该药物预防流感有效果”,则该结论出错的概率不超过0.05.1234567891011123. 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到列联表:优秀 非优秀 合计甲班 10 b乙班 c 30合计 105已知在全部的105人中随机抽取1人,成绩优秀的概率为 ,则下列说法正确的是( )123456789101112A. 列联表中c的值为30,b的值为35B. 列联表中c的值为15,b的值为50C. 根据列联表中的数据,依据小概率值α=0.05的独立性检验,能认为“成绩与班级有关系”D. 根据列联表中的数据,依据小概率值α=0.05的独立性检验,不能认为“成绩与班级有关系”√123456789101112解析: 由题意知,在105人中随机抽取1人,成绩优秀的概率为 ,故成绩优秀的学生人数是105× =30,成绩非优秀的学生人数是105-30=75,所以c=30-10=20,b=75-30=45,故列联表为:优秀 非优秀 合计甲班 10 45 55乙班 20 30 50合计 30 75 105故A、B错误;根据列联表中的数据,得到χ2=≈6.109>3.841=x0.05,因此依据小概率值α=0.05的独立性检验,认为“成绩与班级有关系”,C正确,D错误.1234567891011124. 某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验.整理所得数据后发现,若依据小概率值α=0.010的独立性检验,则认为学生性别与是否支持该活动无关;若依据小概率值α=0.025的独立性检验,则认为学生性别与是否支持该活动有关,则χ2的值可能为( )A. 4.238 B. 4.972C. 6.687 D. 6.069√解析: 由题知χ2∈[5.024,6.635),结合选项,χ2的值可能为6.069.1234567891011125. 已知某独立性检验中,由χ2= ,n=a+b+c+d计算出χ2= ,若将2×2列联表中的数据a,b,c,d分别变成2a,2b,2c,2d,计算出的χ2= ,则( )A. = B. =2C. =2 D. =4√解析: 因为 = ,所以 == =2 .故选B.1234567891011126. 〔多选〕每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,甲、乙两家公司今年分别提供了2个和3个不同的职位,一共收到了100份简历,具体数据如下:公司 文史男 文史女 理工男 理工女甲 10 10 20 10乙 15 20 10 5分析毕业生的选择意愿与性别的关联关系时,已知对应的χ2的值χ1≈1.010;分析毕业生的选择意愿与专业的关联关系时,对应的χ2的值χ2≈9.091,则下列说法正确的是( )123456789101112A. 有99.9%的把握认为毕业生的选择意愿与专业相关联B. 毕业生在选择甲、乙公司时,选择意愿与专业的关联性比与性别的关联性更大一些C. 理工科专业的毕业生更倾向于选择甲公司D. 女性毕业生更倾向于选择乙公司√√√解析 由题知χ2≈9.091,所以有1-0.005=99.5%的把握认为毕业生的选择意愿与专业相关联,所以A不正确;由χ2>χ1,易知B正确;根据题中的数据表可知,理工科专业的毕业生更倾向于选择甲公司,女性毕业生更倾向于选择乙公司,所以C、D均正确.故选B、C、D.1234567891011127. 如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400人(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层随机抽样的方法抽取23人,则抽取的男生人数为 .15 123456789101112解析:根据等高堆积条形图可知:喜欢徒步的男生人数为0.6×500=300,喜欢徒步的女生人数为0.4×400=160,所以喜欢徒步的总人数为300+160=460,按分层随机抽样的方法抽取23人,则抽取的男生人数为×23=15.1234567891011128. 某驾驶员培训学校为对比了解“科目二”的培训过程,采用大密度集中培训与周末分散培训两种方式,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有50名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过 .0.001 123456789101112考试情况 培训方式 合计集中培训 分散培训一次考试通过 50 30 80一次考试未通过 5 20 25合计 55 50 105则χ2= ≈13.793>10.828=x0.001,故认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过0.001.解析:由题意,可得如下2×2列联表:1234567891011129. 足球是一项大众喜爱的运动,某机构为了解喜爱足球是否与性别有关联,随机抽取了若干人进行调查,已知抽取的女性人数是男性的2倍,男性中喜爱足球的人数占男性人数的 ,女性中喜爱足球的人数占女性人数的 .若本次调查得出“根据小概率值α=0.005的独立性检验,认为是否喜爱足球与性别有关联”的结论,则被调查的男性人数至少为( )A. 10 B. 11 C. 12 D. 13√123456789101112解析: 设被调查的男性人数为x,则女性人数为2x,根据题意可得列联表如表:态度 性别 合计男 女喜爱足球 不喜爱足球 合计 x 2x 3x123456789101112则χ2= = ,因为根据小概率值α=0.005的独立性检验,认为是否喜爱足球与性别有关联,所以χ2≥7.879,即 ≥7.879,解得x≥11.818 5,又因为列联表中的所有数据均为整数,所以x的最小值为12.12345678910111210. 〔多选〕晚上睡眠充足是提高学习效率的必要条件,某高中M的高三年级学生晚上10点10分必须休息,另一所同类高中N的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中高中M有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则( )A. 高中M的前50名学生中有60%的学生学习效率高B. 高中N的前50名学生中有40%的学生学习效率高C. 有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关D. 认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率超过0.05√√123456789101112解析: 高中M的前50名学生中有30人学习效率高,即 ×100%=60%,A正确;高中N的前50名学生中有10人学习效率高,即 ×100%=20%,B错误;这100名学生中学习效率高的学生有100×0.4=40(人),根据题意填写列联表如下,学校 学习效率高低 合计学习效率高 学习效率不高高中M 30 20 50高中N 10 40 50合计 40 60 100123456789101112χ2= = ≈16.667>10.828=x0.001,有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关,C正确;认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率不超过0.05,D错误.故选A、C.12345678910111211. 为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为20k(k∈N*),则k= .解析:设男、女学生的总人数为2n,则2n=20k(k∈N*),由题意建立2×2列联表为:5或6 123456789101112喜欢 不喜欢 合计男生 0.8n 0.2n n女生 0.6n 0.4n n合计 1.4n 0.6n 2n所以χ2= = ,又因为有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关,所以3.841≤ <6.635 80.661≤2n<139.335,又2n=20k(k∈N*),所以4.033 05≤k<6.966 75,所以k=5或k=6.12345678910111212. (15分)(2024·全国甲卷17题改编)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:优级品 合格品 不合格品 合计甲车间 26 24 0 50乙甲间 70 28 2 100合计 96 52 2 150123456789101112(1)能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?解: 根据题意列出列联表:优级品 非优级品 合计甲车间 26 24 50乙车间 70 30 100合计 96 54 150123456789101112可得χ2= = =4.687 5,因为3.841<4.687 5<6.635,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲、乙两车间产品的优级品率存在差异.123456789101112(2)已知升级改造前该工厂产品的优级品率p=0.5,设 为升级改造后抽取的n件产品的优级品率.如果 >p+1.65 ,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?( ≈12.247)解: 由题意可知,生产线智能化升级改造后,该工厂产品的优级品的频率为 =0.64,用频率估计概率可得 =0.64,又因为升级改造前该工厂产品的优级品率p=0.5,123456789101112则p+1.65 =0.5+1.65× ≈0.5+1.65×≈0.57,可知 >p+1.65 ,所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.123456789101112THANKS演示完毕 感谢观看 展开更多...... 收起↑ 资源列表 第4节 列联表与独立性检验.docx 第4节 列联表与独立性检验.pptx 第4节 列联表与独立性检验(练习,含解析).docx