第4节 列联表与独立性检验(课件 学案 练习)2027届高考数学一轮复习 第九章

资源下载
  1. 二一教育资源

第4节 列联表与独立性检验(课件 学案 练习)2027届高考数学一轮复习 第九章

资源简介

第4节 列联表与独立性检验
(时间:45分钟,满分:72分)
[备注:单选、填空题5分,多选题6分]
1.在研究打鼾与患心脏病的关系中,通过收集数据、整理分析数据得“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是(  )
A.100个吸烟者中至少有99人打鼾
B.1个人患有心脏病,那么这个人有99%的概率打鼾
C.在100个心脏病患者中一定有打鼾的人
D.在100个心脏病患者中可能一个打鼾的人也没有
2.为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:
药物 流感
患流感 未患流感
服用 2 18
未服用 8 12
根据表中数据,计算χ2,若由此认为“该药物预防流感有效果”,则该结论出错的概率不超过(  )
A.0.05 B.0.1 C.0.01 D.0.005
3.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到列联表:
优秀 非优秀 合计
甲班 10 b
乙班 c 30
合计 105
已知在全部的105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是(  )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,依据小概率值α=0.05的独立性检验,能认为“成绩与班级有关系”
D.根据列联表中的数据,依据小概率值α=0.05的独立性检验,不能认为“成绩与班级有关系”
4.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验.整理所得数据后发现,若依据小概率值α=0.010的独立性检验,则认为学生性别与是否支持该活动无关;若依据小概率值α=0.025的独立性检验,则认为学生性别与是否支持该活动有关,则χ2的值可能为(  )
A.4.238 B.4.972
C.6.687 D.6.069
5.已知某独立性检验中,由χ2=,n=a+b+c+d计算出χ2=,若将2×2列联表中的数据a,b,c,d分别变成2a,2b,2c,2d,计算出的χ2=,则(  )
A.= B.=2
C.=2 D.=4
6.〔多选〕每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,甲、乙两家公司今年分别提供了2个和3个不同的职位,一共收到了100份简历,具体数据如下:
公司 文史男 文史女 理工男 理工女
甲 10 10 20 10
乙 15 20 10 5
分析毕业生的选择意愿与性别的关联关系时,已知对应的χ2的值χ1≈1.010;分析毕业生的选择意愿与专业的关联关系时,对应的χ2的值χ2≈9.091,则下列说法正确的是(  )
A.有99.9%的把握认为毕业生的选择意愿与专业相关联
B.毕业生在选择甲、乙公司时,选择意愿与专业的关联性比与性别的关联性更大一些
C.理工科专业的毕业生更倾向于选择甲公司
D.女性毕业生更倾向于选择乙公司
7.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400人(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层随机抽样的方法抽取23人,则抽取的男生人数为    .
8.某驾驶员培训学校为对比了解“科目二”的培训过程,采用大密度集中培训与周末分散培训两种方式,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有50名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过    .
9.足球是一项大众喜爱的运动,某机构为了解喜爱足球是否与性别有关联,随机抽取了若干人进行调查,已知抽取的女性人数是男性的2倍,男性中喜爱足球的人数占男性人数的,女性中喜爱足球的人数占女性人数的.若本次调查得出“根据小概率值α=0.005的独立性检验,认为是否喜爱足球与性别有关联”的结论,则被调查的男性人数至少为(  )
A.10 B.11
C.12 D.13
10.〔多选〕晚上睡眠充足是提高学习效率的必要条件,某高中M的高三年级学生晚上10点10分必须休息,另一所同类高中N的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中高中M有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则(  )
A.高中M的前50名学生中有60%的学生学习效率高
B.高中N的前50名学生中有40%的学生学习效率高
C.有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关
D.认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率超过0.05
11.为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为20k (k∈N*),则k=     .
12.(15分)(2024·全国甲卷17题改编)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 合计
甲车间 26 24 0 50
乙甲间 70 28 2 100
合计 96 52 2 150
(1)能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率p=0.5,设为升级改造后抽取的n件产品的优级品率.如果>p+1.65,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)
第4节 列联表与独立性检验
1.D 2.A 3.C 4.D 
5.B 因为=,
所以===2.故选B.
6.BCD 7.15 8.0.001 
9.C 设被调查的男性人数为x,则女性人数为2x,根据题意可得列联表如表:
态度 性别 合计
男 女
喜爱足球
不喜爱足球
合计 x 2x 3x
则χ2==,因为根据小概率值α=0.005的独立性检验,认为是否喜爱足球与性别有关联,所以χ2≥7.879,即≥7.879,解得x≥11.818 5,又因为列联表中的所有数据均为整数,所以x的最小值为12.
10.AC 高中M的前50名学生中有30人学习效率高,即×100%=60%,A正确;高中N的前50名学生中有10人学习效率高,即×100%=20%,B错误;这100名学生中学习效率高的学生有100×0.4=40(人),根据题意填写列联表如下,
学校 学习效率高低 合计
学习 效率高 学习效率 不高
高中M 30 20 50
高中N 10 40 50
合计 40 60 100
χ2==≈16.667>10.828=x0.001,有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关,C正确;认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率不超过0.05,D错误.故选A、C.
11.5或6 解析:设男、女学生的总人数为2n,则2n=20k(k∈N*),由题意建立2×2列联表为:
喜欢 不喜欢 合计
男生 0.8n 0.2n n
女生 0.6n 0.4n n
合计 1.4n 0.6n 2n
所以χ2==,又因为有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关,所以3.841≤<6.635 80.661≤2n<139.335,又2n=20k(k∈N*),所以4.033 05≤k<6.966 75,所以k=5或k=6.
12.解:(1)根据题意列出列联表:
优级品 非优级品 合计
甲车间 26 24 50
乙车间 70 30 100
合计 96 54 150
可得χ2===4.687 5,
因为3.841<4.687 5<6.635,
所以有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)由题意可知,生产线智能化升级改造后,该工厂产品的优级品的频率为=0.64,
用频率估计概率可得=0.64,
又因为升级改造前该工厂产品的优级品率p=0.5,
则p+1.65=0.5+1.65×≈0.5+1.65×≈0.57,
可知>p+1.65,所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
1 / 1第4节 列联表与独立性检验
1.掌握分类变量的含义. 2.通过实例,理解2×2列联表的统计意义. 3.通过实例,了解2×2列联表独立性检验及其应用.
知识梳理
1.分类变量与列联表
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;
(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的                       ,
n是样本量,其样本频数列联表(称为2×2列联表)如表所示:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
2.等高堆积条形图
(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征;
(2)如果通过直接计算或等高堆积条形图发现和相差很大,就判断两个分类变量之间有关系.
3.独立性检验
(1)概念:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验;
(2)χ2的计算公式:χ2=                       ;
(3)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值);
(4)独立性检验中几个常用的小概率值和相应的临界值:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
提醒:独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断,χ2越大,认为两个分类变量有关系的把握越大.
诊断自测
1.判断正误.(正确的画“√”,错误的画“×”)
(1)2×2列联表中的数据是两个分类变量的频数.(  )
(2)事件A和B的独立性检验无关,即两个事件互不影响.(  )
(3)χ2的大小是判断事件A和B是否相关的统计量.(  )
(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.(  )
2.一个2×2列联表如表所示,则表中a,c处的值分别为(  )
y1 y2 合计
x1 a 25 73
x2 21 b c
合计 d 49
A.98,28 B.28,98
C.48,45 D.45,48
3.想要检验喜欢参加体育活动是不是与性别有关,应该提出统计假设H0为(  )
A.男性喜欢参加体育活动
B.女性不喜欢参加体育活动
C.喜欢参加体育活动与性别有关
D.喜欢参加体育活动与性别无关
4.根据分类变量x与y的成对样本数据,计算得χ2=2.826,依据α=0.05的独立性检验,正确的结论为(  )
参考值:
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
A.x与y不独立
B.x与y不独立,这个结论犯错误的概率不超过0.05
C.x与y独立
D.x与y独立,这个结论犯错误的概率不超过0.05
分类变量与列联表
(基础自学过关)
1.〔多选〕根据如图所示的等高堆积条形图,下列叙述正确的是(  )
A.吸烟患肺病的频率约为0.2
B.吸烟不患肺病的频率约为0.8
C.不吸烟患肺病的频率小于0.05
D.吸烟与患肺病无关系
2.在某次独立性检验中,得到如下列联表:
A 合计
B 200 800 1 000
180 a 180+a
合计 380 800+a 1 180+a
最后发现,两个分类变量没有关联,则a的值可能是(  )
A.200  B.720 C.100  D.180
3.假设有两个分类变量X和Y,它们的值域分别为{x1,x2} 和{y1,y2},其2×2列联表为:
X Y 合计
y1 y2
x1 a b a+b
x2 c d c+d
合计 a+c b+d n=a+b+c+d
对同一样本,以下数据能说明X 与Y 有关的可能性最大的一组为(  )
A.a=5,b=4,c=3,d=2
B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5
D.a=3,b=2,c=4,d=5
分类变量的两种统计表示形式 (1)2×2 列联表:用定量的方式判断两分类变量是否有关联及关联性的强弱; (2)等高堆积条形图:能更直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征.
分类变量关联性的判断
(师生共研过关)
(2026·江苏盐城模拟)根据分类变量Ⅰ与Ⅱ的统计数据,计算得到χ2=2.954,则(  )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.变量Ⅰ与Ⅱ相关
B.变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1
C.变量Ⅰ与Ⅱ不相关
D.变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.1
听课记录
  如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.
训练1 (1)某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算得χ2=6.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是(  )
A.90% B.95%
C.99% D.99.5%
(2)根据分类变量 X 和Y 的样本观察数据的计算结果,有不少于95%的把握认为 X 和Y 有关,则χ2的值不可能为(  )
α 0.150 0.100 0.050 0.010 0.005
xα 2.072 2.706 3.841 6.635 7.879
A.2.819 B.5.512
C.6.635 D.8.243
独立性检验的应用
(师生共研过关)
(2025·全国Ⅰ卷15题)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1 000人,得到如下列联表:
组别 超声波检查结果 合计
正常 不正常
患该疾病 20 180 200
未患该疾病 780 20 800
合计 800 200 1 000
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.
独立性检验的一般步骤 (1)提出零假设H0:X和Y相互独立; (2)根据样本数据制成2×2列联表; (3)根据公式χ2=计算; (4)比较χ2与临界值的大小关系,根据检验规则得出推断结论.
训练2 (2026·山东聊城模拟)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于130分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组[90,100)的频数为10.
(1)求a的值和样本容量;
(2)估计所有参赛学生的平均成绩;
(3)假设在抽取的样本中,男生比女生多20人,女生的获奖率为12.5%,依据小概率值α=0.01的独立性检验,判断男生与女生的获奖情况是否存在差异?
第4节 列联表与独立性检验
【夯实必备知识】
知识梳理
1.(2)频数
3.(2)
诊断自测
1.(1)√ (2)× (3)√ (4)×
2.C 3.D 4.C
【研透核心考点】
考点1
1.ABC 2.B 3.D 
考点2
【例1】 B 零假设为H0:变量Ⅰ与Ⅱ不相关,因为χ2=2.954>2.706,依据α=0.1的独立性检验可知,推断H0不成立,即认为变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1.故选B.
训练1 (1)B (2)A 解析:(1)结合选项,由临界值表,得6.023>3.841=x0.05,所以断言市民收入增减与旅游愿望有关系的可信程度为95%.
(2)因为有不少于95%的把握认为 X 和Y 有关,所以χ2≥3.841,只有A不满足要求.故选A.
考点3
【例2】 解:(1)由题表可知,检查结果不正常者有200人,检查结果不正常者中患有该疾病的有180人,
所以由样本估计总体得p==0.9.
(2)零假设为H0:超声波检查结果与是否患该疾病无关.
χ2==>10.828,
所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为超声波检查结果与是否患该疾病有关.
训练2 解:(1)由频率分布直方图中,所有矩形面积之和为1可得(a+0.01×2+0.005+0.015+0.025)×10=1,解得a=0.035,样本容量为=100.
(2)所有参赛学生的平均成绩为=95×0.1+105×0.1+115×0.25+125×0.35+135×0.15+145×0.05=120.
(3)由题意可知,获奖人数为100×(0.015+0.005)×10=20,
零假设为H0:男生与女生的获得情况无差异.
由题意可计算得如下2×2列联表:
性别 奖励 合计
获奖 未获奖
男 15 45 60
女 5 35 40
合计 20 80 100
所以χ2==2.343 75<6.635,
所以,依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,即男生与女生的获奖情况无差异.
1 / 1(共62张PPT)
第4节 列联表与独立性检验
课标要求
1. 掌握分类变量的含义.
2. 通过实例,理解2×2列联表的统计意义.
3. 通过实例,了解2×2列联表独立性检验及其应用.
目录/
CONTENTS
夯实必备知识
01
研透核心考点
02
课时跟踪检测
03
01
PART
夯实必备知识
知识梳理
1. 分类变量与列联表
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的
变量称为分类变量;
(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分
类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互
对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y
=y}(x,y=0,1)的 ,n是样本量,其样本频数列联表(称为
2×2列联表)如表所示:
频数 
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
2. 等高堆积条形图
(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是
否相互影响,常用等高堆积条形图展示列联表数据的频率特征;
(2)如果通过直接计算或等高堆积条形图发现 和 相差很大,就
判断两个分类变量之间有关系.
3. 独立性检验
(1)概念:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立
性检验,读作“卡方独立性检验”,简称独立性检验;
(2)χ2的计算公式:χ2= ;
(3)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即
认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有
充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值);
 
(4)独立性检验中几个常用的小概率值和相应的临界值:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
提醒:独立性检验是对两个分类变量有关系的可信程度的判断,而不是对
其是否有关系的判断,χ2越大,认为两个分类变量有关系的把握越大.
诊断自测
1. 判断正误.(正确的画“√”,错误的画“×”)
(1)2×2列联表中的数据是两个分类变量的频数. ( √ )
(2)事件A和B的独立性检验无关,即两个事件互不影响. ( × )
(3)χ2的大小是判断事件A和B是否相关的统计量. ( √ )
(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关
系越强. ( × )

×

×
2. 一个2×2列联表如表所示,则表中a,c处的值分别为(  )
y1 y2 合计
x1 a 25 73
x2 21 b c
合计 d 49
A. 98,28 B. 28,98
C. 48,45 D. 45,48

解析:  由2×2列联表知,a+25=73,b+25=49,b+21=c,解得a
=48,b=24,c=45.
3. 想要检验喜欢参加体育活动是不是与性别有关,应该提出统计假设H0为
(  )
A. 男性喜欢参加体育活动
B. 女性不喜欢参加体育活动
C. 喜欢参加体育活动与性别有关
D. 喜欢参加体育活动与性别无关

解析:  独立性检验是一种假设性检验,假设有反证法的意味,应假设
两个变量无关,即应提出统计假设H0:喜欢参加体育活动与性别无关.
4. 根据分类变量x与y的成对样本数据,计算得χ2=2.826,依据α=0.05
的独立性检验,正确的结论为(  )
参考值:
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
A. x与y不独立
B. x与y不独立,这个结论犯错误的概率不超过0.05
C. x与y独立
D. x与y独立,这个结论犯错误的概率不超过0.05

解析:  零假设为H0:x与y独立,由χ2=2.826<3.841,依据α=0.05
的独立性检验,可得H0成立,故可以认为x与y独立.
02
PART
研透核心考点
分类变量与列联表(基础自学过关)
1. 〔多选〕根据如图所示的等高堆积条形图,下列叙述正确的是(  )
A. 吸烟患肺病的频率约为0.2
B. 吸烟不患肺病的频率约为0.8
C. 不吸烟患肺病的频率小于0.05
D. 吸烟与患肺病无关系



解析:  从等高堆积条形图上可以明显地看出,吸烟患肺病的频率远
远大于不吸烟患肺病的频率,D错误.A、B、C都正确.
2. 在某次独立性检验中,得到如下列联表:
A 合计
B 200 800 1 000
180 a 180+a
合计 380 800+a 1 180+a
最后发现,两个分类变量没有关联,则a的值可能是(  )
A. 200 B. 720 C. 100 D. 180

解析:∵两个分类变量没有关联,∴ ≈ ,解得a≈720,故选B.
3. 假设有两个分类变量X和Y,它们的值域分别为{x1,x2} 和{y1,y2},
其2×2列联表为:
X Y 合计
y1 y2
x1 a b a+b
x2 c d c+d
合计 a+c b+d n=a+b+c+d
对同一样本,以下数据能说明X 与Y 有关的可能性最大的一组为(  )
A. a=5,b=4,c=3,d=2
B. a=5,b=3,c=4,d=2
C. a=2,b=3,c=4,d=5
D. a=3,b=2,c=4,d=5

解析:  对于同一样本,|ad-bc| 越小,说明X 与Y 相关性越弱,
而|ad-bc| 越大,说明X 与Y 相关性越强,通过计算知,对于A,B,
C,都有|ad-bc|=|10-12|=2;对于D,有|ad-bc|=|15-
8|=7,显然7>2.故选D.
分类变量的两种统计表示形式
(1)2×2 列联表:用定量的方式判断两分类变量是否有关联及关联性的
强弱;
(2)等高堆积条形图:能更直观地反映出两个分类变量间是否相互影
响,常用等高堆积条形图展示列联表数据的频率特征.
分类变量关联性的判断(师生共研过关)
(2026·江苏盐城模拟)根据分类变量Ⅰ与Ⅱ的统计数据,计算得到χ2=
2.954,则(  )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A. 变量Ⅰ与Ⅱ相关
B. 变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1
C. 变量Ⅰ与Ⅱ不相关
D. 变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.1

解析:  零假设为H0:变量Ⅰ与Ⅱ不相关,因为χ2=2.954>2.706,依据α
=0.1的独立性检验可知,推断H0不成立,即认为变量Ⅰ与Ⅱ相关,这个结
论犯错误的概率不超过0.1.故选B.
  如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否
则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,
或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.
训练1 (1)某市政府调查市民收入增减与旅游愿望的关系时,采用独立性
检验法抽查了3 000人,计算得χ2=6.023,则市政府断言市民收入增减与
旅游愿望有关系的可信程度是( B )
A. 90% B. 95%
C. 99% D. 99.5%
解析: 结合选项,由临界值表,得6.023>3.841=x0.05,所以断言市民收
入增减与旅游愿望有关系的可信程度为95%.
B
(2)根据分类变量 X 和Y 的样本观察数据的计算结果,有不少于95%的把
握认为 X 和Y 有关,则χ2的值不可能为( A )
α 0.150 0.100 0.050 0.010 0.005
xα 2.072 2.706 3.841 6.635 7.879
A. 2.819 B. 5.512
C. 6.635 D. 8.243
解析: 因为有不少于95%的把握认为 X 和Y 有关,所以χ2≥3.841,只有A
不满足要求.故选A.
A
独立性检验的应用(师生共研过关)
(2025·全国Ⅰ卷15题)为研究某疾病与超声波检查结果的关系,从做
过超声波检查的人群中随机调查了1 000人,得到如下列联表:
组别 超声波检查结果 合计
正常 不正常
患该疾病 20 180 200
未患该疾病 780 20 800
合计 800 200 1 000
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
解: 由题表可知,检查结果不正常者有200人,检查结果不正常者中患有
该疾病的有180人,
所以由样本估计总体得p= =0.9.
(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与
患该疾病有关.
解:零假设为H0:超声波检查结果与是否患该疾病无关.
χ2= = >10.828,
所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为超
声波检查结果与是否患该疾病有关.
独立性检验的一般步骤
(1)提出零假设H0:X和Y相互独立;
(2)根据样本数据制成2×2列联表;
(3)根据公式χ2= 计算;
(4)比较χ2与临界值的大小关系,根据检验规则得出推断结论.
训练2 (2026·山东聊城模拟)某学校为了调动学生学习数学的积极性,在
高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于
130分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试
成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小
组[90,100)的频数为10.
(1)求a的值和样本容量;
解: 由频率分布直方图中,所有矩形面积之和为1可得(a+0.01×2+
0.005+0.015+0.025)×10=1,解得a=0.035,样本容量为 =
100.
(2)估计所有参赛学生的平均成绩;
解:所有参赛学生的平均成绩为 =95×0.1+105×0.1+115×0.25+
125×0.35+135×0.15+145×0.05=120.
(3)假设在抽取的样本中,男生比女生多20人,女生的获奖率为12.5
%,依据小概率值α=0.01的独立性检验,判断男生与女生的获奖情况是
否存在差异?
解:由题意可知,获奖人数为100×(0.015+0.005)×10=20,
零假设为H0:男生与女生的获得情况无差异.
由题意可计算得如下2×2列联表:
性别 奖励 合计
获奖 未获奖
男 15 45 60
女 5 35 40
合计 20 80 100
所以χ2= =2.343 75<6.635,
所以,依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成
立,即男生与女生的获奖情况无差异.
03
PART
课时跟踪检测
(时间:45分钟,满分:72分)
[备注:单选、填空题5分,多选题6分]
1. 在研究打鼾与患心脏病的关系中,通过收集数据、整理分析数据得“打
鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认
为这个结论是成立的,下列说法中正确的是(  )
A. 100个吸烟者中至少有99人打鼾
B. 1个人患有心脏病,那么这个人有99%的概率打鼾
C. 在100个心脏病患者中一定有打鼾的人
D. 在100个心脏病患者中可能一个打鼾的人也没有
1
2
3
4
5
6
7
8
9
10
11
12

解析:  在犯错误的概率不超过0.01的前提下认为这个结论是成立的,
其意义就是我们有99%的把握认为打鼾与患心脏病有关,在100个心脏病
患者中可能一个打鼾的人也没有,故C错误,D正确;对于A,题设中没有
给出吸烟与打鼾相关性判断,故A错误;对于B,独立性检验是对分类变量
相关性的判断,不能具体到个体,故B错误.故选D.
1
2
3
4
5
6
7
8
9
10
11
12
2. 为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:
药物 流感
患流感 未患流感
服用 2 18
未服用 8 12
根据表中数据,计算χ2,若由此认为“该药物预防流感有效果”,则该结
论出错的概率不超过(  )
A. 0.05 B. 0.1

C. 0.01 D. 0.005
解析:  由题意知,χ2= =4.8>3.841=x0.05,故认
为“该药物预防流感有效果”,则该结论出错的概率不超过0.05.
1
2
3
4
5
6
7
8
9
10
11
12
3. 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下
为非优秀统计成绩,得到列联表:
优秀 非优秀 合计
甲班 10 b
乙班 c 30
合计 105
已知在全部的105人中随机抽取1人,成绩优秀的概率为 ,则下列说法正
确的是(  )
1
2
3
4
5
6
7
8
9
10
11
12
A. 列联表中c的值为30,b的值为35
B. 列联表中c的值为15,b的值为50
C. 根据列联表中的数据,依据小概率值α=0.05的独立性检验,能认为
“成绩与班级有关系”
D. 根据列联表中的数据,依据小概率值α=0.05的独立性检验,不能认为
“成绩与班级有关系”

1
2
3
4
5
6
7
8
9
10
11
12
解析:  由题意知,在105人中随机抽取1人,成绩优秀的概率为 ,故成
绩优秀的学生人数是105× =30,成绩非优秀的学生人数是105-30=
75,所以c=30-10=20,b=75-30=45,故列联表为:
优秀 非优秀 合计
甲班 10 45 55
乙班 20 30 50
合计 30 75 105
故A、B错误;根据列联表中的数据,得到χ2=
≈6.109>3.841=x0.05,因此依据小概率值α=0.05的独立性检验,认为
“成绩与班级有关系”,C正确,D错误.
1
2
3
4
5
6
7
8
9
10
11
12
4. 某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关
系,运用2×2列联表进行独立性检验.整理所得数据后发现,若依据小概
率值α=0.010的独立性检验,则认为学生性别与是否支持该活动无关;若
依据小概率值α=0.025的独立性检验,则认为学生性别与是否支持该活动
有关,则χ2的值可能为(  )
A. 4.238 B. 4.972
C. 6.687 D. 6.069

解析:  由题知χ2∈[5.024,6.635),结合选项,χ2的值可能为6.069.
1
2
3
4
5
6
7
8
9
10
11
12
5. 已知某独立性检验中,由χ2= ,n=a+b+
c+d计算出χ2= ,若将2×2列联表中的数据a,b,c,d分别变成
2a,2b,2c,2d,计算出的χ2= ,则(  )
A. = B. =2
C. =2 D. =4

解析:  因为 = ,所以 =
= =2 .故选B.
1
2
3
4
5
6
7
8
9
10
11
12
6. 〔多选〕每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,
甲、乙两家公司今年分别提供了2个和3个不同的职位,一共收到了100份
简历,具体数据如下:
公司 文史男 文史女 理工男 理工女
甲 10 10 20 10
乙 15 20 10 5
分析毕业生的选择意愿与性别的关联关系时,已知对应的χ2的值
χ1≈1.010;分析毕业生的选择意愿与专业的关联关系时,对应的χ2的值
χ2≈9.091,则下列说法正确的是(  )
1
2
3
4
5
6
7
8
9
10
11
12
A. 有99.9%的把握认为毕业生的选择意愿与专业相关联
B. 毕业生在选择甲、乙公司时,选择意愿与专业的关联性比与性别的关联
性更大一些
C. 理工科专业的毕业生更倾向于选择甲公司
D. 女性毕业生更倾向于选择乙公司



解析 由题知χ2≈9.091,所以有1-0.005=99.5%的把握认为毕业
生的选择意愿与专业相关联,所以A不正确;由χ2>χ1,易知B正确;根据
题中的数据表可知,理工科专业的毕业生更倾向于选择甲公司,女性毕业
生更倾向于选择乙公司,所以C、D均正确.故选B、C、D.
1
2
3
4
5
6
7
8
9
10
11
12
7. 如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高
堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生
400人(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分
层随机抽样的方法抽取23人,则抽取的男生人数为 .
15 
1
2
3
4
5
6
7
8
9
10
11
12
解析:根据等高堆积条形图可知:喜欢徒步的男生人数为0.6×500=
300,喜欢徒步的女生人数为0.4×400=160,所以喜欢徒步的总人数为
300+160=460,按分层随机抽样的方法抽取23人,则抽取的男生人数为
×23=15.
1
2
3
4
5
6
7
8
9
10
11
12
8. 某驾驶员培训学校为对比了解“科目二”的培训过程,采用大密度集中
培训与周末分散培训两种方式,调查了105名学员,统计结果为:接受大
密度集中培训的55名学员中有50名学员一次考试通过,接受周末分散培训
的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过
与是否集中培训有关”犯错误的概率不超过 .
0.001 
1
2
3
4
5
6
7
8
9
10
11
12
考试情况 培训方式 合计
集中培训 分散培训
一次考试通过 50 30 80
一次考试未通过 5 20 25
合计 55 50 105
则χ2= ≈13.793>10.828=x0.001,故认为“能否一次
考试通过与是否集中培训有关”犯错误的概率不超过0.001.
解析:由题意,可得如下2×2列联表:
1
2
3
4
5
6
7
8
9
10
11
12
9. 足球是一项大众喜爱的运动,某机构为了解喜爱足球是否与性别有关
联,随机抽取了若干人进行调查,已知抽取的女性人数是男性的2倍,男
性中喜爱足球的人数占男性人数的 ,女性中喜爱足球的人数占女性人数
的 .若本次调查得出“根据小概率值α=0.005的独立性检验,认为是否喜
爱足球与性别有关联”的结论,则被调查的男性人数至少为(  )
A. 10 B. 11 C. 12 D. 13

1
2
3
4
5
6
7
8
9
10
11
12
解析: 设被调查的男性人数为x,则女性人数为2x,根据题意可得列
联表如表:
态度 性别 合计
男 女
喜爱足球
不喜爱足球
合计 x 2x 3x
1
2
3
4
5
6
7
8
9
10
11
12
则χ2= = ,因为根据小概率值α=0.005的独立性检验,
认为是否喜爱足球与性别有关联,所以χ2≥7.879,即 ≥7.879,解得
x≥11.818 5,又因为列联表中的所有数据均为整数,所以x的最小值为
12.
1
2
3
4
5
6
7
8
9
10
11
12
10. 〔多选〕晚上睡眠充足是提高学习效率的必要条件,某高中M的高三
年级学生晚上10点10分必须休息,另一所同类高中N的高三年级学生晚上
11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分
别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调
查,其中高中M有30名学生的学习效率高,且从这100名学生中随机抽取1
人,抽到学习效率高的学生的概率是0.4,则(  )
A. 高中M的前50名学生中有60%的学生学习效率高
B. 高中N的前50名学生中有40%的学生学习效率高
C. 有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关
D. 认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率超过0.05


1
2
3
4
5
6
7
8
9
10
11
12
解析:  高中M的前50名学生中有30人学习效率高,即 ×100%=60
%,A正确;高中N的前50名学生中有10人学习效率高,即 ×100%=20
%,B错误;这100名学生中学习效率高的学生有100×0.4=40(人),根
据题意填写列联表如下,
学校 学习效率高低 合计
学习效率高 学习效率不高
高中M 30 20 50
高中N 10 40 50
合计 40 60 100
1
2
3
4
5
6
7
8
9
10
11
12
χ2= = ≈16.667>10.828=x0.001,有99.9%的把
握认为学生学习效率高低与晚上睡眠是否充足有关,C正确;认为学生学
习效率高低与晚上睡眠是否充足有关的犯错概率不超过0.05,D错误.故选
A、C.
1
2
3
4
5
6
7
8
9
10
11
12
11. 为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的
男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络
课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握
认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为20k
(k∈N*),则k= .
解析:设男、女学生的总人数为2n,则2n=20k(k∈N*),由题意建立
2×2列联表为:
5或6 
1
2
3
4
5
6
7
8
9
10
11
12
喜欢 不喜欢 合计
男生 0.8n 0.2n n
女生 0.6n 0.4n n
合计 1.4n 0.6n 2n
所以χ2= = ,又因为有95%的把握认为喜欢网
络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关,所
以3.841≤ <6.635 80.661≤2n<139.335,又2n=20k(k∈N*),
所以4.033 05≤k<6.966 75,所以k=5或k=6.
1
2
3
4
5
6
7
8
9
10
11
12
12. (15分)(2024·全国甲卷17题改编)某工厂进行生产线智能化升级改
造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行
检验,数据如下:
优级品 合格品 不合格品 合计
甲车间 26 24 0 50
乙甲间 70 28 2 100
合计 96 52 2 150
1
2
3
4
5
6
7
8
9
10
11
12
(1)能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能
否有99%的把握认为甲、乙两车间产品的优级品率存在差异?
解: 根据题意列出列联表:
优级品 非优级品 合计
甲车间 26 24 50
乙车间 70 30 100
合计 96 54 150
1
2
3
4
5
6
7
8
9
10
11
12
可得χ2= = =4.687 5,
因为3.841<4.687 5<6.635,
所以有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%
的把握认为甲、乙两车间产品的优级品率存在差异.
1
2
3
4
5
6
7
8
9
10
11
12
(2)已知升级改造前该工厂产品的优级品率p=0.5,设 为升级改造后
抽取的n件产品的优级品率.如果 >p+1.65 ,则认为该工厂
产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线
智能化升级改造后,该工厂产品的优级品率提高了?( ≈12.247)
解: 由题意可知,生产线智能化升级改造后,该工厂产品的优级品
的频率为 =0.64,
用频率估计概率可得 =0.64,
又因为升级改造前该工厂产品的优级品率p=0.5,
1
2
3
4
5
6
7
8
9
10
11
12
则p+1.65 =0.5+1.65× ≈0.5+1.65×
≈0.57,
可知 >p+1.65 ,所以可以认为生产线智能化升级改造后,
该工厂产品的优级品率提高了.
1
2
3
4
5
6
7
8
9
10
11
12
THANKS
演示完毕 感谢观看

展开更多......

收起↑

资源列表