(新人教A版强基版)2024届高考一轮复习数学 第九章 9.4 列联表与独立性检验 (课件+学案)

资源下载
  1. 二一教育资源

(新人教A版强基版)2024届高考一轮复习数学 第九章 9.4 列联表与独立性检验 (课件+学案)

资源简介

(共85张PPT)
§9.4 列联表与独
立性检验
第九章 统计与成对数据的统计分析
1.通过实例,理解2×2列联表的统计意义.
2.通过实例,了解独立性检验及其应用.
考试要求
内容索引
第一部分
第二部分
第三部分
落实主干知识
探究核心题型
课时精练
落实主干知识




1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
2.列联表与独立性检验
(1)关于分类变量X和Y的抽样数据的2×2列联表:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
(2)计算随机变量χ2= ,利用χ2的取值推断分类变
量X和Y 的方法称为χ2独立性检验.
如表为5个常用的小概率值和相应的临界值.
是否独立
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)2×2列联表中的数据是两个分类变量的频数.(  )
(2)事件A和B的独立性检验无关,即两个事件互不影响.(  )
(3)χ2的大小是判断事件A和B是否相关的统计量.(  )
(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.
(  )
×

×

由题意可知,“爱玩网游”与“性别”是两类变量,其是否有关,应用独立性检验判断.
1.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,用下列最适合的统计方法是
A.均值 B.方差
C.独立性检验 D.回归分析

A.27,38 B.28,38 C.27,37 D.28,37
2.如表是2×2列联表,则表中a,b的值分别为

y1 y2 合计
x1 a 8 35
x2 11 34 45
合计 b 42 80
a=35-8=27,b=a+11=27+11=38.
3.已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到χ2=7.235,则根据小概率值α=________的χ2独立性检验,分析喜欢该项体育运动与性别有关.
0.01
因为6.635<7.235<10.828,所以根据小概率值α=0.01的χ2独立性检验,分析喜欢该项体育运动与性别有关.
探究核心题型

二部

例1 (1)为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:
则a-b-c等于
A.7 B.8 C.9 D.10

题型一
列联表与χ2的计算
男 女 合计
喜欢 a b 73
不喜欢 c 25
合计 74
男 女 合计
喜欢 52 21 73
不喜欢 22 25 47
合计 74 46 120
根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21,
补充完整2×2列联表为:
∴a-b-c=52-21-22=9.
在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可得到χ2的值为
A.1.255 B.38.214 C.0.003 7 D.2.058
(2)为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如表:

体育课不及格 体育课及格 合计
文化课及格 57 221 278
文化课不及格 16 43 59
合计 73 264 337
2×2列联表是4行4列,计算时要准确无误,关键是对涉及的变量分清类别.
思维升华
会外语 不会外语 合计
男 a b 20
女 6 d
合计 18 50
跟踪训练1 某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的2×2列联表中,a+b+d=________.
44
由题意得a+b+d+6=50,
所以a+b+d=50-6=44.
每周使用次数 1次 2次 3次 4次 5次 6次及以上
男 8 6 6 14 16 60
女 12 10 8 8 12 40
合计 20 16 14 22 28 100
例2 (2023·吉林模拟)共享单车是指企业与政府合作,在校园、地铁站点、公交站点、居民区、商业区、公共服务区等提供单车共享服务,是共享经济的一种新形态.为了研究广大市民共享单车的使用情况,某公司在某市随机抽取了200名用户进行调查,得到如下数据:单位:人
题型二
列联表与独立性检验
(1)如果认为每周使用超过3次的用户为“喜欢骑行共享单车”,请完成2×2列联表;
单位:人
不喜欢骑行共享单车 喜欢骑行共享单车 合计


合计
由题中表格可得2×2列联表如下:
单位:人
不喜欢骑行共享单车 喜欢骑行共享单车 合计
男 20 90 110
女 30 60 90
合计 50 150 200
(2)根据小概率值α=0.05的独立性检验,分析 “喜欢骑行共享单车” 是否与性别有关.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
零假设为H0:“喜欢骑行共享单车”与性别无关.将2×2列联表中的数据代入公式计算得,
所以根据小概率值α=0.05的独立性检验,推断H0不成立,即认为“喜欢骑行共享单车”与性别有关.
独立性检验的一般步骤
(1)根据样本数据制成2×2列联表.
思维升华
(3)比较χ2与临界值的大小关系,作统计推断.
跟踪训练2 为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表:
单位:人
年龄段 认知情况 合计
知晓 不知晓
A组(90后与00后) 75 25 100
B组(70后与80后) 45 55 100
合计 120 80 200
(1)若从样本内知晓“绿色消费”意义的120人中用比例分配的分层随机抽样方法随机抽取16人,问应在A组、B组中各抽取多少人?
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
(2)能否依据小概率值α=0.001的独立性检验,分析对“绿色消费”意义的认知情况与年龄有关?
零假设为H0:对“绿色消费”意义的认知情况与年龄无关.
故依据小概率值α=0.001的独立性检验,推断H0不成立,即认为对“绿色消费”意义的认知情况与年龄有关.
例3 体育运动是强身健体的重要途径,《中国儿童青少年体育健康促进行动方案(2020-2030)》(下面简称“体育健康促进行动方案”)中明确提出青少年学生每天在校内参与不少于60分钟的中高强度身体活动的要求.随着“体育健康促进行动方案”的发布,体育运动受到各地中小学的高度重视,众多青少年的体质健康得到很大的改善.某中学教师为了了解体育运动对学生的数学成绩的影响情况,现从该中学高三年级的一次月考中随机抽取1 000名学生,调查他们平均每天的体育运动情况以及本次月考的数学成绩情况,
题型三
独立性检验的综合应用
得到如表数据:
数学成 绩(分) [30,50) [50,70) [70,90) [90,110) [110,130) [130,150]
人数(人) 25 125 350 300 150 50
运动达标 的人数(人) 10 45 145 200 107 43
约定:平均每天进行体育运动的时间不少于60分钟的为“运动达标”,数学成绩排在年级前50%以内(含50%)的为“数学成绩达标”.
(1)求该中学高三年级本次月考数学成绩的65%分位数;
每组的频率依次为0.025,0.125,0.350,0.300,0.150,0.050,
∵0.025+0.125+0.350=0.500<0.65,0.025+0.125+0.350+0.300=0.800>0.65,
高三年级本次月考数学成绩的65%分位数位于[90,110)内,且为[90,110)的中点100,
该中学高三年级本次月考数学成绩的65%分位数为100.
(2)请估计该中学高三年级本次月考数学成绩的平均分(同一组中的数据用该组区间的中点值作代表);
该中学高三年级本次月考数学成绩的平均分
估计该中学高三年级本次月考数学成绩的平均分为91.50分.
(3)请根据已知数据完成下列列联表,并根据小概率值α=0.001的独立性检验,分析“数学成绩达标”是否与“运动达标”相关.
α 0.010 0.005 0.001
xα 6.635 7.879 10.828
数学成绩达标人数 数学成绩不达标人数 合计
运动达标人数
运动不达标人数
合计
列联表如表所示:
零假设为H0:“数学成绩达标”与“运动达标”无关,
数学成绩达标人数 数学成绩不达标人数 合计
运动达标人数 350 200 550
运动不达标人数 150 300 450
合计 500 500 1 000
∴根据小概率值α=0.001的独立性检验,推断H0不成立,即认为“数学成绩达标”与“运动达标”有关.
独立性检验的考查,往往与概率和抽样统计图等一起考查,这类问题的求解往往按各小题及提问的顺序,一步步进行下去,是比较容易解答的,考查单纯的独立性检验往往用小题的形式,而且χ2的公式一般会在原题中给出.
思维升华
跟踪训练3 某网红奶茶品牌公司计划在W市某区开设加盟分店,为了确定在该区开设分店的个数,该公司对该市已开设分店的5个区域的数据作了初步处理后得到下列表格,记x表示在5个区域开设分店的个数,y表示这x个分店的年收入之和.
(1)该公司经过初步判断,可用经验回归模型拟合y与x的关系,求y关于x的经验回归方程;
x(个) 2 3 4 5 6
y(十万元) 2.5 3 4 4.5 6
(2)如果该公司最终决定在该区选择两个合适的地段各开设一个分店,根据市场调查得到如下统计数据,第一分店每天的顾客平均为30人,其中
5人会购买该品牌奶茶,第二分店每天的顾客平均为80人,其中20人会购买该品牌奶茶.依据小概率值α=0.1的独立性检验,分析两个店的顾客下单率有无差异.
x0.1=2.706.
零假设为H0:两个店的顾客下单率无差异,则
由题意可知2×2列联表如表所示:
不下单 下单 合计
分店一 25 5 30
分店二 60 20 80
合计 85 25 110
∴根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,即两个店的顾客下单率没有差异.
课时精练

三部

观察等高堆积条形图易知D选项两个分类变量之间关系最强.
1.观察下列各图,其中两个分类变量x,y之间关系最强的是
1
2
3
4
5
6
7
8
9
10
11
12
13
14

基础保分练
2.下列关于独立性检验的说法正确的是
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以100%确定两个变量之间是否具有某种关系
C.利用χ2独立性检验推断吸烟与患肺病的关联中,若有99%的把握认为吸
烟与患肺病有关系时,则我们可以说在100个吸烟的人中,有99人患肺病
D.对于独立性检验,随机变量χ2的值越小,判定“两变量有关系”犯错误
的概率越大

1
2
3
4
5
6
7
8
9
10
11
12
13
14
对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,
并非检验二者是否是线性相关,故错误;
对于B,独立性检验并不能100%确定两个变量相关,故错误;
对于C,99%是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,故错误;
对于D,根据卡方计算的定义可知该选项正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
下表是χ2独立性检验中几个常用的小概率值和相应的临界值:
3.为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
药物 流感
患流感 未患流感
服用 2 18
未服用 8 12
α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
根据表中数据,计算χ2= ,若由此认为“该药物
预防流感有效果”,则该结论出错的概率不超过
A.0.05 B.0.1 C.0.01 D.0.005

α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
药物 流感
患流感 未患流感
服用 2 18
未服用 8 12
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由临界值表可知,认为“该药物预防流感有效果”,则该结论出错的概率不超过0.05.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
4.(多选)(2022·郑州模拟)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的2×2列联表中,由列联表中的数据计算得χ2≈9.616.参照附表,下列结论正确的是
附表:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.根据小概率值α=0.001的独立性检验,分析认为“药物有效”
B.根据小概率值α=0.001的独立性检验,分析认为“药物无效”
C.根据小概率值α=0.005的独立性检验,分析认为“药物有效”
D.根据小概率值α=0.005的独立性检验,分析认为“药物无效”


1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
因为χ2≈9.616,所以7.879<χ2<10.828,所以根据小概率值α=0.001的独立性检验,分析认为“药物无效”.
根据小概率值α=0.005的独立性检验,分析认为“药物有效”.
5.(多选)(2023·南通模拟)根据分类变量x与y的观察数据,计算得到χ2=2.974,依据表中给出的χ2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是
A.根据小概率值α=0.05的独立性检验,分析变量x与y相互独立
B.根据小概率值α=0.05的独立性检验,分析变量x与y不相互独立
C.变量x与y相互独立,这个结论犯错误的概率不超过0.1
D.变量x与y不相互独立,这个结论犯错误的概率不超过0.1
1
2
3
4
5
6
7
8
9
10
11
12
13
14


α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
因为χ2=2.974>2.706,所以变量x与y不相互独立,这个结论犯错误的概率不超过0.1.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
营养品 身高 合计
有明显增长 无明显增长
食用 a 10 50
未食用 b 30 50
合计 60 40 100
6.为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表,由表可知下列说法正确的是
1
2
3
4
5
6
7
8
9
10
11
12
13
14
参考数据:
A.a=b=30
B.χ2≈12.667
C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿
童的概率是
D.根据小概率值α=0.001的独立性检验,可以认为该营养品对儿童身高
增长有影响

1
2
3
4
5
6
7
8
9
10
11
12
13
14
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
所以根据小概率值α=0.001的独立性检验,
可以认为该营养品对儿童身高增长有影响,所以B错误,D正确;
从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是 所以C错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由题可知a=50-10=40,b=50-30=20,所以A错误;
喜欢运动 不喜欢运动 合计
男 40 28 68
女 5 12 17
合计 45 40 85
7.如表是对于“喜欢运动”与性别是否有关的2×2列联表,依据表中的数据,得到χ2≈________(结果保留到小数点后3位).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
4.722
8.一项研究同年龄段的男、女生的注意力差别的脑功能实验,其实验数据如表所示:
则χ2=________(精确到小数点后三位),依据概率值α=0.05的独立性检验,该实验________该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持).
注意力稳定 注意力不稳定
男生 29 7
女生 33 5
0.538
支持
1
2
3
4
5
6
7
8
9
10
11
12
13
14
所以没有充分证据认为学生在注意力的稳定性上与性别有关,
即该实验支持该年龄段的学生在注意力的稳定性上对于性别没有显著差异.
由表中数据可知a=29,b=7,c=33,d=5,n=a+b+c+d=74,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
9.(2021·全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)依据小概率值α=0.01的独立性检验能否认为甲机床的产品质量与乙机床的产品质量有差异?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
零假设为H0:甲机床的产品质量与乙机床的产品质量无差异,
根据题表中的数据可得
所以依据小概率值α=0.01的独立性检验,推断H0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异.
10.某花圃为提高某品种花苗质量,开展技术创新活动,A,B在实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,
将每株所得的综合评分制成如图所
示的频率分布直方图.记综合评分为
80 及以上的花苗为优质花苗.
(1)求图中a的值,并求综合评分的中
位数;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由直方图的性质可知,0.005×10+0.010×10+0.025×10+10a+0.020×10=1,
解得a=0.040,
因为(0.02+0.04)×10=0.6>0.5,
所以中位数位于[80,90)内,
设中位数为x,则有0.020×10+
0.040×(90-x)=0.5,解得x=82.5.
故综合评分的中位数为82.5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)填写下面的2×2列联表,并根据小概率值α=0.01的独立性检验,分析优质花苗与培育方法是否有关,请说明理由.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
优质花苗 非优质花苗 合计
甲培育法 20
乙培育法 10
合计
1
2
3
4
5
6
7
8
9
10
11
12
13
14
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由(1)得优质花苗的频率为0.6,
所以样本中优质花苗的数量为60,
得如下列联表:
优质花苗 非优质花苗 合计
甲培育法 20 30 50
乙培育法 40 10 50
合计 60 40 100
1
2
3
4
5
6
7
8
9
10
11
12
13
14
零假设为H0:优质花苗与培育方法无关,
所以根据小概率值α=0.01的独立性检验,推断H0不成立,即认为优质花苗与培育方法有关.
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 50
未注射疫苗 30 50
合计 30 100
11.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
综合提升练
A.0.001 B.0.05 C.0.01 D.0.005
计算可知,根据小概率值α=________的独立性检验,分析 “给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14

1
2
3
4
5
6
7
8
9
10
11
12
13
14
完善2×2列联表如下:
零假设为H0:“给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果”.
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 40 50
未注射疫苗 20 30 50
合计 30 70 100
1
2
3
4
5
6
7
8
9
10
11
12
13
14
所以根据小概率值α=0.05的独立性检验,推断H0不成立,
即认为“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”.
其中a,15-a均为大于5的整数,若依据α=0.05的独立性检验可以认为X与Y有关,则a的可能取值为
A.6 B.7 C.8 D.9
12.(多选)有两个分类变量X,Y,其列联表如表所示.
X Y 合计
Y1 Y2
X1 a 20-a 20
X2 15-a 30+a 45
合计 15 50 65
1
2
3
4
5
6
7
8
9
10
11
12
13
14


1
2
3
4
5
6
7
8
9
10
11
12
13
14
根据a>5且15-a>5,a∈Z,知a可取6,7,8,9.由表中数据及题意,得
结合选项,知a的可能取值为8,9.
性别 晕机 合计
晕机者 未晕机者
男 a 15 c
女 6 b d
合计 e 28 46
13.(多选)在一次恶劣天气的飞行航程中,调查男、女乘客在飞机上晕机的情况,得到如下列联表:(单位:人),则
1
2
3
4
5
6
7
8
9
10
11
12
13
14
拓展冲刺练
B.χ2<2.706
C.依据小概率值α=0.1的独立性检验,可以认为在恶劣天气的飞行航程中,
是否晕机与性别有关
D.依据小概率值α=0.1的独立性检验,可以认为在恶劣天气的飞行航程
中,是否晕机与性别无关

1
2
3
4
5
6
7
8
9
10
11
12
13
14

1
2
3
4
5
6
7
8
9
10
11
12
13
14
所以得到如下列联表:
性别 晕机 合计
晕机者 未晕机者
男 12 15 27
女 6 13 19
合计 18 28 46
1
2
3
4
5
6
7
8
9
10
11
12
13
14
零假设为H0:在恶劣天气的飞行航程中,是否晕机与性别无关,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
依据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,
即在恶劣天气的飞行航程中,是否晕机与性别无关,所以B,D正确,C错误.
14.为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:
若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为________.(其中a≥40且a∈N*)(参考数据:
药物 疾病 合计
未患病 患病
服用 a 50-a 50
未服用 80-a a-30 50
合计 80 20 100
1
2
3
4
5
6
7
8
9
10
11
12
13
14
46
1
2
3
4
5
6
7
8
9
10
11
12
13
14
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解得a≥45.16或a≤34.84,
又因为a≥40且a∈N*,
所以a≥46,
所以a的最小值为46.
整理得(100a-4 000)2≥502×42×6.635,
1
2
3
4
5
6
7
8
9
10
11
12
13
14§9.4 列联表与独立性检验
考试要求 1.通过实例,理解2×2列联表的统计意义.2.通过实例,了解独立性检验及其应用.
知识梳理
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
2.列联表与独立性检验
(1)关于分类变量X和Y的抽样数据的2×2列联表:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
(2)计算随机变量χ2=,利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验.
如表为5个常用的小概率值和相应的临界值.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
思考辨析
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)2×2列联表中的数据是两个分类变量的频数.( √ )
(2)事件A和B的独立性检验无关,即两个事件互不影响.( × )
(3)χ2的大小是判断事件A和B是否相关的统计量.( √ )
(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.( × )
教材改编题
1.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,用下列最适合的统计方法是(  )
A.均值 B.方差
C.独立性检验 D.回归分析
答案 C
解析 由题意可知,“爱玩网游”与“性别”是两类变量,其是否有关,应用独立性检验判断.
2.如表是2×2列联表,则表中a,b的值分别为(  )
y1 y2 合计
x1 a 8 35
x2 11 34 45
合计 b 42 80
A.27,38 B.28,38
C.27,37 D.28,37
答案 A
解析 a=35-8=27,b=a+11=27+11=38.
3.已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到χ2=7.235,则根据小概率值α=________的χ2独立性检验,分析喜欢该项体育运动与性别有关.
答案 0.01
解析 因为6.635<7.235<10.828,所以根据小概率值α=0.01的χ2独立性检验,分析喜欢该项体育运动与性别有关.
题型一 列联表与χ2的计算
例1 (1)为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:
男 女 合计
喜欢 a b 73
不喜欢 c 25
合计 74
则a-b-c等于(  )
A.7 B.8 C.9 D.10
答案 C
解析 根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21,
补充完整2×2列联表为:
男 女 合计
喜欢 52 21 73
不喜欢 22 25 47
合计 74 46 120
∴a-b-c=52-21-22=9.
(2)为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如表:
体育课不及格 体育课及格 合计
文化课及格 57 221 278
文化课不及格 16 43 59
合计 73 264 337
在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可得到χ2的值为(  )
A.1.255 B.38.214
C.0.003 7 D.2.058
答案 A
解析 χ2=
=≈1.255.
思维升华 2×2列联表是4行4列,计算时要准确无误,关键是对涉及的变量分清类别.
跟踪训练1 某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的2×2列联表中,a+b+d=________.
会外语 不会外语 合计
男 a b 20
女 6 d
合计 18 50
答案 44
解析 由题意得a+b+d+6=50,
所以a+b+d=50-6=44.
题型二 列联表与独立性检验
例2 (2023·吉林模拟)共享单车是指企业与政府合作,在校园、地铁站点、公交站点、居民区、商业区、公共服务区等提供单车共享服务,是共享经济的一种新形态.为了研究广大市民共享单车的使用情况,某公司在某市随机抽取了200名用户进行调查,得到如下数据:单位:人
每周使用次数 1次 2次 3次 4次 5次 6次及以上
男 8 6 6 14 16 60
女 12 10 8 8 12 40
合计 20 16 14 22 28 100
(1)如果认为每周使用超过3次的用户为“喜欢骑行共享单车”,请完成2×2列联表;
单位:人
不喜欢骑行共享单车 喜欢骑行共享单车 合计


合计
(2)根据小概率值α=0.05的独立性检验,分析 “喜欢骑行共享单车”是否与性别有关.
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解 (1)由题中表格可得2×2列联表如下:
单位:人
不喜欢骑行共享单车 喜欢骑行共享单车 合计
男 20 90 110
女 30 60 90
合计 50 150 200
(2)零假设为H0:“喜欢骑行共享单车”与性别无关.将2×2列联表中的数据代入公式计算得,
χ2=≈6.06>3.841=x0.05,
所以根据小概率值α=0.05的独立性检验,推断H0不成立,即认为“喜欢骑行共享单车”与性别有关.
思维升华 独立性检验的一般步骤
(1)根据样本数据制成2×2列联表.
(2)根据公式χ2=计算.
(3)比较χ2与临界值的大小关系,作统计推断.
跟踪训练2 为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表:
单位:人
年龄段 认知情况 合计
知晓 不知晓
A组(90后与00后) 75 25 100
B组(70后与80后) 45 55 100
合计 120 80 200
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
(1)若从样本内知晓“绿色消费”意义的120人中用比例分配的分层随机抽样方法随机抽取16人,问应在A组、B组中各抽取多少人?
(2)能否依据小概率值α=0.001的独立性检验,分析对“绿色消费”意义的认知情况与年龄有关?
解 (1)由题意知,在A组中抽取的人数为16×=10.在B组中抽取的人数为16×=6.
(2)零假设为H0:对“绿色消费”意义的认知情况与年龄无关.
由题意,得χ2==18.75>10.828=x0.001,
故依据小概率值α=0.001的独立性检验,推断H0不成立,即认为对“绿色消费”意义的认知情况与年龄有关.
题型三 独立性检验的综合应用
例3 体育运动是强身健体的重要途径,《中国儿童青少年体育健康促进行动方案(2020-2030)》(下面简称“体育健康促进行动方案”)中明确提出青少年学生每天在校内参与不少于60分钟的中高强度身体活动的要求.随着“体育健康促进行动方案”的发布,体育运动受到各地中小学的高度重视,众多青少年的体质健康得到很大的改善.某中学教师为了了解体育运动对学生的数学成绩的影响情况,现从该中学高三年级的一次月考中随机抽取1 000名学生,调查他们平均每天的体育运动情况以及本次月考的数学成绩情况,得到如表数据:
数学成绩(分) [30,50) [50,70) [70,90) [90,110) [110,130) [130,150]
人数(人) 25 125 350 300 150 50
运动达标 的人数(人) 10 45 145 200 107 43
约定:平均每天进行体育运动的时间不少于60分钟的为“运动达标”,数学成绩排在年级前50%以内(含50%)的为“数学成绩达标”.
(1)求该中学高三年级本次月考数学成绩的65%分位数;
(2)请估计该中学高三年级本次月考数学成绩的平均分(同一组中的数据用该组区间的中点值作代表);
(3)请根据已知数据完成下列列联表,并根据小概率值α=0.001的独立性检验,分析“数学成绩达标”是否与“运动达标”相关.
数学成绩达标人数 数学成绩不达标人数 合计
运动达标人数
运动不达标人数
合计
附:χ2=(n=a+b+c+d).
α 0.010 0.005 0.001
xα 6.635 7.879 10.828
解 (1)每组的频率依次为0.025,0.125,0.350,0.300,0.150,0.050,
∵0.025+0.125+0.350=0.500<0.65,0.025+0.125+0.350+0.300=0.800>0.65,
且=0.65,
高三年级本次月考数学成绩的65%分位数位于[90,110)内,且为[90,110)的中点100,
该中学高三年级本次月考数学成绩的65%分位数为100.
(2)该中学高三年级本次月考数学成绩的平均分
=0.025×40+0.125×60+0.350×80+0.300×100+0.150×120+0.050×140=91.50,
估计该中学高三年级本次月考数学成绩的平均分为91.50分.
(3)列联表如表所示:
数学成绩达标人数 数学成绩不达标人数 合计
运动达标人数 350 200 550
运动不达标人数 150 300 450
合计 500 500 1 000
零假设为H0:“数学成绩达标”与“运动达标”无关,
χ2==≈90.9>10.828=x0.001,
∴根据小概率值α=0.001的独立性检验,推断H0不成立,即认为“数学成绩达标”与“运动达标”有关.
思维升华 独立性检验的考查,往往与概率和抽样统计图等一起考查,这类问题的求解往往按各小题及提问的顺序,一步步进行下去,是比较容易解答的,考查单纯的独立性检验往往用小题的形式,而且χ2的公式一般会在原题中给出.
跟踪训练3 某网红奶茶品牌公司计划在W市某区开设加盟分店,为了确定在该区开设分店的个数,该公司对该市已开设分店的5个区域的数据作了初步处理后得到下列表格,记x表示在5个区域开设分店的个数,y表示这x个分店的年收入之和.
x(个) 2 3 4 5 6
y(十万元) 2.5 3 4 4.5 6
(1)该公司经过初步判断,可用经验回归模型拟合y与x的关系,求y关于x的经验回归方程;
(2)如果该公司最终决定在该区选择两个合适的地段各开设一个分店,根据市场调查得到如下统计数据,第一分店每天的顾客平均为30人,其中5人会购买该品牌奶茶,第二分店每天的顾客平均为80人,其中20人会购买该品牌奶茶.依据小概率值α=0.1的独立性检验,分析两个店的顾客下单率有无差异.
参考公式:=,=-;χ2=,x0.1=2.706.
解 (1)由题意可得,==4,
==4,
iyi=2×2.5+3×3+4×4+5×4.5+6×6=88.5,
=22+32+42+52+62=90,
设y关于x的经验回归方程为=x+,
则===0.85,
=-=4-0.85×4=0.6,
∴y关于x的经验回归方程为=0.85x+0.6.
(2)零假设为H0:两个店的顾客下单率无差异,则
由题意可知2×2列联表如表所示:
不下单 下单 合计
分店一 25 5 30
分店二 60 20 80
合计 85 25 110
∴χ2==≈0.863<2.706=x0.1,
∴根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,即两个店的顾客下单率没有差异.
课时精练
1.观察下列各图,其中两个分类变量x,y之间关系最强的是(  )
答案 D
解析 观察等高堆积条形图易知D选项两个分类变量之间关系最强.
2.下列关于独立性检验的说法正确的是(  )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以100%确定两个变量之间是否具有某种关系
C.利用χ2独立性检验推断吸烟与患肺病的关联中,若有99%的把握认为吸烟与患肺病有关系时,则我们可以说在100个吸烟的人中,有99人患肺病
D.对于独立性检验,随机变量χ2的值越小,判定“两变量有关系”犯错误的概率越大
答案 D
解析 对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,
并非检验二者是否是线性相关,故错误;
对于B,独立性检验并不能100%确定两个变量相关,故错误;
对于C,99%是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,故错误;
对于D,根据卡方计算的定义可知该选项正确.
3.为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:
药物 流感
患流感 未患流感
服用 2 18
未服用 8 12
下表是χ2独立性检验中几个常用的小概率值和相应的临界值:
α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
根据表中数据,计算χ2=,若由此认为“该药物预防流感有效果”,则该结论出错的概率不超过(  )
A.0.05 B.0.1 C.0.01 D.0.005
答案 A
解析 由题意知,χ2==4.8>3.841=x0.05,
由临界值表可知,认为“该药物预防流感有效果”,则该结论出错的概率不超过0.05.
4.(多选)(2022·郑州模拟)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的2×2列联表中,由列联表中的数据计算得χ2≈9.616.参照附表,下列结论正确的是(  )
附表:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.根据小概率值α=0.001的独立性检验,分析认为“药物有效”
B.根据小概率值α=0.001的独立性检验,分析认为“药物无效”
C.根据小概率值α=0.005的独立性检验,分析认为“药物有效”
D.根据小概率值α=0.005的独立性检验,分析认为“药物无效”
答案 BC
解析 因为χ2≈9.616,所以7.879<χ2<10.828,所以根据小概率值α=0.001的独立性检验,分析认为“药物无效”.
根据小概率值α=0.005的独立性检验,分析认为“药物有效”.
5.(多选)(2023·南通模拟)根据分类变量x与y的观察数据,计算得到χ2=2.974,依据表中给出的χ2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是(  )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.根据小概率值α=0.05的独立性检验,分析变量x与y相互独立
B.根据小概率值α=0.05的独立性检验,分析变量x与y不相互独立
C.变量x与y相互独立,这个结论犯错误的概率不超过0.1
D.变量x与y不相互独立,这个结论犯错误的概率不超过0.1
答案 AD
解析 因为χ2=2.974>2.706,所以变量x与y不相互独立,这个结论犯错误的概率不超过0.1.
6.为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表,由表可知下列说法正确的是(  )
营养品 身高 合计
有明显增长 无明显增长
食用 a 10 50
未食用 b 30 50
合计 60 40 100
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.a=b=30
B.χ2≈12.667
C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是
D.根据小概率值α=0.001的独立性检验,可以认为该营养品对儿童身高增长有影响
答案 D
解析 由题可知a=50-10=40,b=50-30=20,所以A错误;
χ2=≈16.667 >10.828=x0.001,
所以根据小概率值α=0.001的独立性检验,
可以认为该营养品对儿童身高增长有影响,所以B错误,D正确;
从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是=,所以C错误.
7.如表是对于“喜欢运动”与性别是否有关的2×2列联表,依据表中的数据,得到χ2≈________(结果保留到小数点后3位).
喜欢运动 不喜欢运动 合计
男 40 28 68
女 5 12 17
合计 45 40 85
答案 4.722
解析 χ2=≈4.722.
8.一项研究同年龄段的男、女生的注意力差别的脑功能实验,其实验数据如表所示:
注意力稳定 注意力不稳定
男生 29 7
女生 33 5
则χ2=________(精确到小数点后三位),依据概率值α=0.05的独立性检验,该实验________该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持).
答案 0.538 支持
解析 由表中数据可知a=29,b=7,c=33,d=5,n=a+b+c+d=74,
根据χ2=,
计算可知χ2=≈0.538<3.841=x0.05,
所以没有充分证据认为学生在注意力的稳定性上与性别有关,
即该实验支持该年龄段的学生在注意力的稳定性上对于性别没有显著差异.
9.(2021·全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)依据小概率值α=0.01的独立性检验能否认为甲机床的产品质量与乙机床的产品质量有差异?
附:χ2=,n=a+b+c+d.
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
解 (1)根据题表中数据知,甲机床生产的产品中一级品的频率是=0.75,乙机床生产的产品中一级品的频率是=0.6.
(2)零假设为H0:甲机床的产品质量与乙机床的产品质量无差异,
根据题表中的数据可得
χ2=
=≈10.256>6.635=x0.01,
所以依据小概率值α=0.01的独立性检验,推断H0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异.
10.某花圃为提高某品种花苗质量,开展技术创新活动,A,B在实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80 及以上的花苗为优质花苗.
(1)求图中a的值,并求综合评分的中位数;
(2)填写下面的2×2列联表,并根据小概率值α=0.01的独立性检验,分析优质花苗与培育方法是否有关,请说明理由.
优质花苗 非优质花苗 合计
甲培育法 20
乙培育法 10
合计
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解 (1)由直方图的性质可知,0.005×10+0.010×10+0.025×10+10a+0.020×10=1,
解得a=0.040,
因为(0.02+0.04)×10=0.6>0.5,所以中位数位于[80,90)内,
设中位数为x,则有0.020×10+0.040×(90-x)=0.5,解得x=82.5.
故综合评分的中位数为82.5.
(2)由(1)得优质花苗的频率为0.6,
所以样本中优质花苗的数量为60,
得如下列联表:
优质花苗 非优质花苗 合计
甲培育法 20 30 50
乙培育法 40 10 50
合计 60 40 100
零假设为H0:优质花苗与培育方法无关,
χ2=≈16.667>6.635=x0.01,
所以根据小概率值α=0.01的独立性检验,推断H0不成立,即认为优质花苗与培育方法有关.
11.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 50
未注射疫苗 30 50
合计 30 100
计算可知,根据小概率值α=________的独立性检验,分析 “给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”(  )
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.0.001 B.0.05
C.0.01 D.0.005
答案 B
解析 完善2×2列联表如下:
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 40 50
未注射疫苗 20 30 50
合计 30 70 100
零假设为H0:“给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果”.
因为χ2=≈4.762,3.841<4.762<6.635,
所以根据小概率值α=0.05的独立性检验,推断H0不成立,
即认为“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”.
12.(多选)有两个分类变量X,Y,其列联表如表所示.
X Y 合计
Y1 Y2
X1 a 20-a 20
X2 15-a 30+a 45
合计 15 50 65
其中a,15-a均为大于5的整数,若依据α=0.05的独立性检验可以认为X与Y有关,则a的可能取值为(  )
A.6 B.7 C.8 D.9
答案 CD
解析 根据a>5且15-a>5,a∈Z,知a可取6,7,8,9.由表中数据及题意,得
χ2==≥3.841=x0.05,结合选项,知a的可能取值为8,9.
13.(多选)在一次恶劣天气的飞行航程中,调查男、女乘客在飞机上晕机的情况,得到如下列联表:(单位:人),则(  )
性别 晕机 合计
晕机者 未晕机者
男 a 15 c
女 6 b d
合计 e 28 46
A.<
B.χ2<2.706
C.依据小概率值α=0.1的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别有关
D.依据小概率值α=0.1的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别无关
答案 BD
解析 由题中列联表数据,知
解得
所以得到如下列联表:
性别 晕机 合计
晕机者 未晕机者
男 12 15 27
女 6 13 19
合计 18 28 46
所以==>=,即A错误;
零假设为H0:在恶劣天气的飞行航程中,是否晕机与性别无关,
由列联表中的数据,得χ2=≈0.775<2.706=x0.1,
依据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,
即在恶劣天气的飞行航程中,是否晕机与性别无关,所以B,D正确,C错误.
14.为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:
药物 疾病 合计
未患病 患病
服用 a 50-a 50
未服用 80-a a-30 50
合计 80 20 100
若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为________.(其中a≥40且a∈N*)(参考数据:≈2.58,≈3.29)
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
答案 46
解析 由题意可得χ2=≥6.635,
整理得(100a-4 000)2≥502×42×6.635,
所以100a-4 000≥200×≈200×2.58=516或100a-4 000≤-200×≈-200
×2.58=-516,
解得a≥45.16或a≤34.84,
又因为a≥40且a∈N*,
所以a≥46,
所以a的最小值为46.§9.4 列联表与独立性检验
考试要求 1.通过实例,理解2×2列联表的统计意义.2.通过实例,了解独立性检验及其应用.
知识梳理
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
2.列联表与独立性检验
(1)关于分类变量X和Y的抽样数据的2×2列联表:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
(2)计算随机变量χ2=,利用χ2的取值推断分类变量X和Y________________的方法称为χ2独立性检验.
如表为5个常用的小概率值和相应的临界值.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
思考辨析
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)2×2列联表中的数据是两个分类变量的频数.(  )
(2)事件A和B的独立性检验无关,即两个事件互不影响.(  )
(3)χ2的大小是判断事件A和B是否相关的统计量.(  )
(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.(  )
教材改编题
1.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,用下列最适合的统计方法是(  )
A.均值 B.方差
C.独立性检验 D.回归分析
2.如表是2×2列联表,则表中a,b的值分别为(  )
y1 y2 合计
x1 a 8 35
x2 11 34 45
合计 b 42 80
A.27,38 B.28,38
C.27,37 D.28,37
3.已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到χ2=7.235,则根据小概率值α=________的χ2独立性检验,分析喜欢该项体育运动与性别有关.
题型一 列联表与χ2的计算
例1 (1)为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:
男 女 合计
喜欢 a b 73
不喜欢 c 25
合计 74
则a-b-c等于(  )
A.7 B.8 C.9 D.10
(2)为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如表:
体育课不及格 体育课及格 合计
文化课及格 57 221 278
文化课不及格 16 43 59
合计 73 264 337
在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可得到χ2的值为(  )
A.1.255 B.38.214
C.0.003 7 D.2.058
听课记录:______________________________________________________________
________________________________________________________________________
思维升华 2×2列联表是4行4列,计算时要准确无误,关键是对涉及的变量分清类别.
跟踪训练1 某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的2×2列联表中,a+b+d=________.
会外语 不会外语 合计
男 a b 20
女 6 d
合计 18 50
题型二 列联表与独立性检验
例2 (2023·吉林模拟)共享单车是指企业与政府合作,在校园、地铁站点、公交站点、居民区、商业区、公共服务区等提供单车共享服务,是共享经济的一种新形态.为了研究广大市民共享单车的使用情况,某公司在某市随机抽取了200名用户进行调查,得到如下数据:单位:人
每周使用次数 1次 2次 3次 4次 5次 6次及以上
男 8 6 6 14 16 60
女 12 10 8 8 12 40
合计 20 16 14 22 28 100
(1)如果认为每周使用超过3次的用户为“喜欢骑行共享单车”,请完成2×2列联表;
单位:人
不喜欢骑行共享单车 喜欢骑行共享单车 合计


合计
(2)根据小概率值α=0.05的独立性检验,分析 “喜欢骑行共享单车” 是否与性别有关.
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
思维升华 独立性检验的一般步骤
(1)根据样本数据制成2×2列联表.
(2)根据公式χ2=计算.
(3)比较χ2与临界值的大小关系,作统计推断.
跟踪训练2 为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表:
单位:人
年龄段 认知情况 合计
知晓 不知晓
A组(90后与00后) 75 25 100
B组(70后与80后) 45 55 100
合计 120 80 200
附:χ2=,
n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
(1)若从样本内知晓“绿色消费”意义的120人中用比例分配的分层随机抽样方法随机抽取16人,问应在A组、B组中各抽取多少人?
(2)能否依据小概率值α=0.001的独立性检验,分析对“绿色消费”意义的认知情况与年龄有关?
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
题型三 独立性检验的综合应用
例3 体育运动是强身健体的重要途径,《中国儿童青少年体育健康促进行动方案(2020-2030)》(下面简称“体育健康促进行动方案”)中明确提出青少年学生每天在校内参与不少于60分钟的中高强度身体活动的要求.随着“体育健康促进行动方案”的发布,体育运动受到各地中小学的高度重视,众多青少年的体质健康得到很大的改善.某中学教师为了了解体育运动对学生的数学成绩的影响情况,现从该中学高三年级的一次月考中随机抽取1 000名学生,调查他们平均每天的体育运动情况以及本次月考的数学成绩情况,得到如表数据:
数学成绩(分) [30,50) [50,70) [70,90) [90,110) [110,130) [130,150]
人数(人) 25 125 350 300 150 50
运动达标 的人数(人) 10 45 145 200 107 43
约定:平均每天进行体育运动的时间不少于60分钟的为“运动达标”,数学成绩排在年级前50%以内(含50%)的为“数学成绩达标”.
(1)求该中学高三年级本次月考数学成绩的65%分位数;
(2)请估计该中学高三年级本次月考数学成绩的平均分(同一组中的数据用该组区间的中点值作代表);
(3)请根据已知数据完成下列列联表,并根据小概率值α=0.001的独立性检验,分析“数学成绩达标”是否与“运动达标”相关.
数学成绩达标人数 数学成绩不达标人数 合计
运动达标人数
运动不达标人数
合计
附:χ2=(n=a+b+c+d).
α 0.010 0.005 0.001
xα 6.635 7.879 10.828
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
思维升华 独立性检验的考查,往往与概率和抽样统计图等一起考查,这类问题的求解往往按各小题及提问的顺序,一步步进行下去,是比较容易解答的,考查单纯的独立性检验往往用小题的形式,而且χ2的公式一般会在原题中给出.
跟踪训练3 某网红奶茶品牌公司计划在W市某区开设加盟分店,为了确定在该区开设分店的个数,该公司对该市已开设分店的5个区域的数据作了初步处理后得到下列表格,记x表示在5个区域开设分店的个数,y表示这x个分店的年收入之和.
x(个) 2 3 4 5 6
y(十万元) 2.5 3 4 4.5 6
(1)该公司经过初步判断,可用经验回归模型拟合y与x的关系,求y关于x的经验回归方程;
(2)如果该公司最终决定在该区选择两个合适的地段各开设一个分店,根据市场调查得到如下统计数据,第一分店每天的顾客平均为30人,其中5人会购买该品牌奶茶,第二分店每天的顾客平均为80人,其中20人会购买该品牌奶茶.依据小概率值α=0.1的独立性检验,分析两个店的顾客下单率有无差异.
参考公式:=,=-;χ2=,x0.1=2.706.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________

展开更多......

收起↑

资源列表