第8章第3节 2×2列联表 高中数学选择性必修二同步复习讲义(沪教版2020)

资源下载
  1. 二一教育资源

第8章第3节 2×2列联表 高中数学选择性必修二同步复习讲义(沪教版2020)

资源简介

第8章第3节 2×2列联表
题型1 等高堆积条形图 题型2 独立性检验
▉题型1 等高堆积条形图
【知识点的认识】
﹣等高堆积条形图:用于显示分类数据的组成部分,条形的高度代表总体数值的累积.
【解题方法点拨】
﹣绘制:将不同分类的数值堆叠在条形上,展示每部分的相对比例.
1.现行普通高中学生在高一时面临着选科的问题,某学校抽取了部分男、女同学选科意愿的一份样本,制作出如图两个等高堆积条形图.根据这两幅图中的信息,下列哪个统计结论是不正确的(  )
A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
2.为考察A,B两种药物对预防某疾病的效果,进行了动物实验,根据样本数据制作出如下两个等高堆积条形图.根据这两幅图中的信息,下列说法最佳的一项是(  )
A.样本中的药物A,B对该疾病均有显著的预防效果
B.样本中的药物A,B对该疾病均没有预防效果
C.样本中的药物B的预防效果优于药物A的预防效果
D.样本中的药物A的预防效果优于药物B的预防效果
(多选)3.2020年12月26日太原地铁2号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁2号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如图等高堆积条形图,根据图中信息,下列结论正确的是(  )
A.样本中男性比女性更关注地铁2号线开通
B.样本中多数女性是35岁及以上
C.样本中35岁以下的男性人数比35岁及以上的女性人数多
D.样本中35岁及以上的人对地铁2号线的开通关注度更高
▉题型2 独立性检验
【知识点的认识】
1、分类变量:
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2、原理:假设性检验(类似反证法原理).
一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X和Y有关系”.(表中的k就是K2的观测值,即k=K2).
其中n=a+b+c+d(考试给出)
3、2×2列联表:
4、范围:K2∈(0,+∞);性质:K2越大,说明变量间越有关系.
5、解题步骤:
(1)认真读题,取出相关数据,作出2×2列联表;
(2)根据2×2列联表中的数据,计算K2的观测值k;
(3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.
4.下列说法中,正确的是(  )
A.经验回归直线必经过样本点中心
B.样本相关系数r的值越大,两个变量的相关程度越强
C.在残差图中,残差点所在的水平带状区域越宽,回归方程的预报精确度越高
D.根据分类变量X与Y的成对样本数据,计算得到χ2≈3.56,根据小概率值α=0.05的χ2独立性检验x0.05=3.841),可判断X与Y有关联,此推断犯错误的概率不超过0.05
5.为了预防肥胖,某校对“学生性别和喜欢吃甜食”是否有关做了一次调查,其中被调查的女生人数是男生人数的两倍,男生喜欢吃甜食的人数占男生人数的,女生喜欢吃甜食的人数占女生人数的,根据小概率值α=0.01 的独立性检验,推断出“学生性别和喜欢吃甜食”有关,则被调查的男生人数最少为(  )
参考公式及数据:,其中n=a+b+c+d.
附:
α 0.05 0.01
xα 3.841 6.635
A.12人 B.13人 C.14人 D.15人
6.某市准备安排该市所有中学教师进行体检,同时调查去年该市教师体检情况,并随机抽取100名高中教师与100名初中教师,经过统计得到如下2×2列联表:
去年体检人数 去年未体检人数 合计
高中教师 70 30 100
初中教师 e f 100
合计 m n 200
若根据列联表得χ2,则这200名教师中,去年未体检的人数为(  )
(附:χ2,n=a+b+c+d)
A.20 B.30 C.40 D.50
7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀 非优秀 总计
甲班 10 b
乙班 c 30
合计
附:
P(K2≥k0) 0.05 0.025 0.010 0.005
k0 3.841 5.024 6.635 7.879
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是(  )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系”
8.根据分类变量x与y的成对样本数据,计算得到χ2=8.988.依据α=0.001的独立性检验,正确的结论为(  )(附:x0.01=6.635,x0.005=7.879,x0.001=10.828)
A.变量x与y不独立
B.变量x与y不独立,这个结论犯错误的概率不超过0.001
C.变量x与y独立
D.变量x与y独立,这个结论犯错误的概率不超过0.001
9.某课外兴趣小组为研究数学成绩优秀是否与性别有关,通过随机抽样调查,得到成对样本观测数据的分类统计结果,并计算得出χ2≈6.816,经查阅χ2独立性检验的小概率值和相应的临界值,知x0.01=6.635,则下列判断正确的是(  )
A.若某人数学成绩优秀,那么他为男生的概率是0.010
B.每100个数学成绩优秀的人中就会有1名是女生
C.数学成绩优秀与性别有关,此推断犯错误的概率不大于0.01
D.在犯错误的概率不超过1%的前提下认为数学成绩优秀与性别无关
10.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为(  )
附x2,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
A.130 B.190 C.240 D.250
(多选)11.下列结论错误的是(  )
A.两个变量的相关性越强,相关系数r越大
B.利用样本点求经验回归方程,则样本点可能都不在回归直线上
C.对于独立性检验,χ2的观测值越大,判断“两变量有关联”犯错误的概率越大
D.在2×2列联表中,若每个数据都变为原来的2倍,则χ2变为原来的2倍(χ2)
12.某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如表所示,其中x∈N*,且x<16,若有90%的把握可以认为性别与对工作的满意程度具有相关性,则x的值是    .
对工作满意 对工作不满意
男 5x 5x
女 4x 6x
附:,其中n=a+b+c+d.
P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001
k0 2.706 3.841 5.024 6.635 7.879 10.828
13.ChatGPT爆火以来,各种人工智能平台如雨后春笋般层出不穷.某人工智能服务商提供了A,B两种会员服务套餐,购买会员服务的既有个人用户也有公司用户.后台随机调取m名会员的基本信息,统计发现购买B套餐的用户数占总用户数的,购买B套餐的用户中公司用户数是个人用户数的倍,购买A套餐的用户中公司用户数是个人用户数的一半.根据独立性检验,有99.5%的把握认为购买的套餐类型与用户类型有关系,则m的最小值为    .
附:.
P(χ2>k) 0.050 0.010 0.005 0.001
k 3.841 6.635 7.879 10.828
14.为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:
药物 疾病 合计
未患病 患病
服用 a 50﹣a 50
未服用 80﹣a a﹣30 50
合计 80 20 100
若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,
则a的最小值为    .(其中a≥40且a∈N*)(参考数据:,)
附:,n=a+b+c+d
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
15.在科技飞速发展的今天,人工智能领域迎来革命性的突破,各种AI的人工智能大模型拥有强大的解决问题的能力.某机构分别用A,B两种人工智能大模型进行对比研究,检验这两种大模型在答题时哪种更可靠,从某知识领域随机选取180个问题进行分组回答,其中A人工智能大模型回答100个问题,有91个正确;B人工智能大模型回答剩下的80个问题,有65个正确.
(1)完成下列2×2列联表,并根据小概率值α=0.10的独立性检验,能否认为人工智能大模型的选择与回答正确有关?
回答正确 回答错误 合计
A人工智能大模型
B人工智能大模型
合计
(Ⅱ)将频率视为概率,用A人工智能大模型随机回答该知识领域的n(n≥2)道题目,且各题回答正确与否,相互之间没有影响.记其中恰有2个问题回答错误的概率为Pn,求Pn取得最大值时n的值.
参考公式及参考数据:χ2,n=a+b+c+d.
α 0.15 0.10 0.05 0.010
xα 2.072 2.706 3.841 6.635
16.某校开设劳动教育课程,共设置了两类课程:家政和园艺,共有400名学生参加.学校对选择了这两类课程的学生人数的分布进行了统计,相关数据记录在如下表格中,但其中有缺失.已知男生中选择家政课的比例为80%.
课程 性别 合计
男 女
家政 160
园艺 120
合计 400
(1)根据小概率值α=0.001的独立性检验,能否认为学生选择不同劳动教育课程与性别有关联?
(2)学校对某一课程中教授同一知识点教师的教授时长与学生任务完成率进行了跟进,授课时长x(分钟)和学生任务完成率y%的对应数据如下:
时长x 20 24 28 32 36 40
完成率y% 50 70 60 66 72 84
在任务完成率不全相等的条件下,学校为了调研是否存在学生任务完成率与平均完成率偏差过大的情况,需计算偏差系数φ(n),现给出以下两种数据处理方式:
甲:,乙:,已知偏差系数越大的处理方式,对于数据中大偏差数据的存在体现得越明显.
①用两种处理方式分别计算学生任务完成率的偏差系数φ(n),并指出哪一种数据处理方式对大偏差数据的存在体现更明显;
②判断此后学校每次调研均采用①中对大偏差数据的存在体现更明显的数据处理方式是否合理,并证明你的判断.
附:,n=a+b+c+d.
α 0.1 0.01 0.001
xα 2.706 6.635 10.828
17.为了了解高中学生语文成绩与数学成绩之间的联系,从某校抽取了200名学生的成绩样本,进行了统计,得到如下的2×2列联表.
语文成统 数学成绩 合计
优秀 不优秀
优秀 50 40
不优秀
合计 75 200
(1)请将上面的2×2列联表补充完整;
(2)是否有90%的把握认为语文成绩与数学成绩有关?
附:.
α=P(χ2≥k) 0.15 0.10 0.05 0.025
k 2.072 2.706 3.841 5.024
18.近年来,食品添加剂泛滥引起消费者关注,某媒体对消费者在购买预包装食品时是否关注配料表进行调查,调查了100名男性消费者与100名女性消费者,关注配料表的消费者共有80人,其中女性30人.
(1)用2×2列联表表示上述数据;
(2)依据小概率值α=0.01的独立性检验,能否认为消费者购买预包装食品时是否关注配料表与性别有关?
附:,其中n=a+b+c+d.
α 0.1 0.05 0.025 0.010
xα 2.706 3.841 5.024 6.635
19.近年来,食品添加剂泛滥引起消费者关注,某媒体对消费者在购买预包装食品时是否关注配料表进行调查,调查了100名男性消费者与100名女性消费者,关注配料表的消费者共有80人,其中女性30人.
(1)用2×2列联表表示上述数据;
(2)是否有99%的把握认为消费者购买预包装食品时是否关注配料表与性别有关?
附:χ2,其中n=a+b+c+d.
α=P(χ2≥k) 0.1 0.05 0.025 0.010
k 2.706 3.841 5.024 6.635
20.2024年9月16日,沈阳市举行马拉松比赛,全球马拉松爱好者积极参与本场比赛,某服务部门为提升服务质量,随机采访了120名参赛人员,得到下表:
满意度 性别 合计
女性 男性
比较满意 r s 50
非常满意 t 40 70
合计 60 l 120
(1)求的值;
(2)能否有90%的把握认为不同性别的参赛人员对该部门服务质量的评价有差异?
(3)用频率估计概率,现随机采访本场比赛的1名女性参赛人员与2名男性参赛人员,已知3人中恰有一人对该部门服务非常满意,求该人为女性的概率.
附:.
α 0.1 0.01 0.001
xα 2.706 6.635 10.828
21.目前电动车的电池有石墨烯电池与铅酸电池两种,某公司为了了解该市电动车消费者对这两种电池电动车的偏好,随机调查了500名电动车用户,其中男性用户300名,在被调查的女性用户中偏好铅酸电池电动车的占,得到以下的2×2列联表:
偏好石墨烯电池电动车 偏好铅酸电池电动车 合计
男性用户 200 300
女性用户
合计 500
(1)根据以上数据,完成2×2列联表,依据小概率值α=0.005的独立性检验,能否认为该市电动车用户对这两种电池的电动车的偏好与性别有关;
(2)从偏好石墨烯电池电动车的用户中按性别比例用分层随机抽样的方法随机抽取7人进行问卷调查,再从这7名用户中抽取2人进行座谈,在有女性用户参加座谈的条件下,求恰有两名女性用户参加座谈的概率;
(3)用样本的频率估计概率,在该市所有女性电动车用户中随机抽取3名进行新车试驾,记3名参加试驾的女性用户中偏好石墨烯电池电动车的人数为X,求X的分布列.
参考公式:χ2,其中n=a+b+c+d.
参考数据:
α 0.100 0.050 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
22.某校在两个班级进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):
80分及80分以上 80分以下 总计
实验班 35 15 50
对照班 20 m 50
总计 55 45 n
(1)求m,n;
(2)根据表中数据回答:有99%的把握认为“教学方式与成绩有关系”吗?
A 总计
B a b a+b
c d c+d
总计 a+c b+d a+b+c+d
附:①2×2列联表:记n=a+b+c+d.
②χ2计算公式:
③常用的显著水平α以及相应的分位数k如下表所示.
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828第8章第3节 2×2列联表
题型1 等高堆积条形图 题型2 独立性检验
▉题型1 等高堆积条形图
【知识点的认识】
﹣等高堆积条形图:用于显示分类数据的组成部分,条形的高度代表总体数值的累积.
【解题方法点拨】
﹣绘制:将不同分类的数值堆叠在条形上,展示每部分的相对比例.
1.现行普通高中学生在高一时面临着选科的问题,某学校抽取了部分男、女同学选科意愿的一份样本,制作出如图两个等高堆积条形图.根据这两幅图中的信息,下列哪个统计结论是不正确的(  )
A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
【答案】D
【解答】解:由条形图得女生数量多于男生数量,故A正确;
有两理一文意原属的学生数量多于有两文一理意愿的学生数量,故B正确;
男生偏爱两理一文,故C正确;
女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D错误.
故选:D.
2.为考察A,B两种药物对预防某疾病的效果,进行了动物实验,根据样本数据制作出如下两个等高堆积条形图.根据这两幅图中的信息,下列说法最佳的一项是(  )
A.样本中的药物A,B对该疾病均有显著的预防效果
B.样本中的药物A,B对该疾病均没有预防效果
C.样本中的药物B的预防效果优于药物A的预防效果
D.样本中的药物A的预防效果优于药物B的预防效果
【答案】D
【解答】解:根据两个等高条形图可知:
药物A实验显示不服药与服药时患病的差异较药物B实验显示明显大,
故样本中的药物A的预防效果优于药物B的预防效果.
故选:D.
(多选)3.2020年12月26日太原地铁2号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁2号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如图等高堆积条形图,根据图中信息,下列结论正确的是(  )
A.样本中男性比女性更关注地铁2号线开通
B.样本中多数女性是35岁及以上
C.样本中35岁以下的男性人数比35岁及以上的女性人数多
D.样本中35岁及以上的人对地铁2号线的开通关注度更高
【答案】ABD
【解答】解:设等高条形图对应2×2列联表如下:
35岁及以上 35岁以下 总计
男性 a c a+c
女性 b d b+d
总计 a+b c+d a+b+c+d
根据第1个等高条形图可知,35岁及以上男性比35岁及以上女性多,即a>b,
35岁以下男性比35岁以下女性多,即c>d,
根据第2个等高条形图可知,男性中35岁及以上的比35岁以下的多,即a>c,
女性中35岁及以上的比35岁以下的多,即b>d,
对于选项A,男性人数为a+c,女性人数为b+d,因为a>b,c>d,所以a+c>b+d,故A正确;
对于选项B,35岁及以上女性人数为b,35岁以下女性人数为d,因为b>d,故B正确;
对于选项C,35岁以下男性人数为c,35岁及以上女性人数为b,无法从图中直接判断b与c的大小关系,
故C不一定正确;
对于选项D,35岁及以上的人数为a+b,35岁以下的人数为c+d,因为a>c,b>d,
所以a+b>c+d,故D正确.
故选:ABD.
▉题型2 独立性检验
【知识点的认识】
1、分类变量:
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2、原理:假设性检验(类似反证法原理).
一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X和Y有关系”.(表中的k就是K2的观测值,即k=K2).
其中n=a+b+c+d(考试给出)
3、2×2列联表:
4、范围:K2∈(0,+∞);性质:K2越大,说明变量间越有关系.
5、解题步骤:
(1)认真读题,取出相关数据,作出2×2列联表;
(2)根据2×2列联表中的数据,计算K2的观测值k;
(3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.
4.下列说法中,正确的是(  )
A.经验回归直线必经过样本点中心
B.样本相关系数r的值越大,两个变量的相关程度越强
C.在残差图中,残差点所在的水平带状区域越宽,回归方程的预报精确度越高
D.根据分类变量X与Y的成对样本数据,计算得到χ2≈3.56,根据小概率值α=0.05的χ2独立性检验x0.05=3.841),可判断X与Y有关联,此推断犯错误的概率不超过0.05
【答案】A
【解答】解:对于A,经验回归方程必经过中心点,故A正确;
对于B,相关系数r的绝对值|r|越接近于1,两个变量的相关程度越强,故B错误;
对于C,在残差图中,残差点所在的水平带状区域越窄,回归方程的预报精确度越高,
区域越宽,回归方程的预报精确度越低,故C错误;
对于D,由χ2≈3.56<3.841=x0.05,根据小概率值α=0.05的χ2独立性检验,
没有充分证据推断X与Y有关联,不可以判断此推断犯错误的概率不超过0.05,故D错误.
故选:A.
5.为了预防肥胖,某校对“学生性别和喜欢吃甜食”是否有关做了一次调查,其中被调查的女生人数是男生人数的两倍,男生喜欢吃甜食的人数占男生人数的,女生喜欢吃甜食的人数占女生人数的,根据小概率值α=0.01 的独立性检验,推断出“学生性别和喜欢吃甜食”有关,则被调查的男生人数最少为(  )
参考公式及数据:,其中n=a+b+c+d.
附:
α 0.05 0.01
xα 3.841 6.635
A.12人 B.13人 C.14人 D.15人
【答案】C
【解答】解:已知被调查的女生人数是男生人数的两倍,男生喜欢吃甜食的人数占男生人数的,女生喜欢吃甜食的人数占女生人数的,
由题意可设男生的人数为:5m(m∈N*),则女生的人数为10m(m∈N*),
根据题意可列出如下的2×2列联表:
男生 女生 合计
喜欢吃甜食 2m 8m 10m
不喜欢吃甜食 3m 2m 5m
合计 5m 10m 15m
χ22.4m,
因为根据小概率值α=0.01的独立性检验,推断出“学生性别和喜欢吃甜食”有关,
所以2.4m>6.635;解得:m>2.765,所以5m>13.823,
因为m∈N*,所以5m的最小值为14.
故选:C.
6.某市准备安排该市所有中学教师进行体检,同时调查去年该市教师体检情况,并随机抽取100名高中教师与100名初中教师,经过统计得到如下2×2列联表:
去年体检人数 去年未体检人数 合计
高中教师 70 30 100
初中教师 e f 100
合计 m n 200
若根据列联表得χ2,则这200名教师中,去年未体检的人数为(  )
(附:χ2,n=a+b+c+d)
A.20 B.30 C.40 D.50
【答案】D
【解答】解:χ2,
又m=70+e,n=30+f,100=e+f,200=m+n,
联立可得,38n2﹣4600n+13500=0,解得n=50或n(舍去).
故选:D.
7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀 非优秀 总计
甲班 10 b
乙班 c 30
合计
附:
P(K2≥k0) 0.05 0.025 0.010 0.005
k0 3.841 5.024 6.635 7.879
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是(  )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系”
【答案】C
【解答】解:由题意知,成绩优秀的学生数是,
成绩非优秀的学生数是75,所以c=20,b=45,
选项A、B错误;
根据列联表中的数据,
得到
因此有97.5%的把握认为“成绩与班级有关系”.
故C正确,D错误.
故选:C.
8.根据分类变量x与y的成对样本数据,计算得到χ2=8.988.依据α=0.001的独立性检验,正确的结论为(  )(附:x0.01=6.635,x0.005=7.879,x0.001=10.828)
A.变量x与y不独立
B.变量x与y不独立,这个结论犯错误的概率不超过0.001
C.变量x与y独立
D.变量x与y独立,这个结论犯错误的概率不超过0.001
【答案】C
【解答】解:因为χ2=8.988<10.828=x0.001,
所以依据α=0.001的独立性检验,可以认为变量x与y独立.
故选:C.
9.某课外兴趣小组为研究数学成绩优秀是否与性别有关,通过随机抽样调查,得到成对样本观测数据的分类统计结果,并计算得出χ2≈6.816,经查阅χ2独立性检验的小概率值和相应的临界值,知x0.01=6.635,则下列判断正确的是(  )
A.若某人数学成绩优秀,那么他为男生的概率是0.010
B.每100个数学成绩优秀的人中就会有1名是女生
C.数学成绩优秀与性别有关,此推断犯错误的概率不大于0.01
D.在犯错误的概率不超过1%的前提下认为数学成绩优秀与性别无关
【答案】C
【解答】解:因为χ2≈6.816>6.635=x0.01,
所以数学成绩优秀与性别有关,此推断犯错误的概率不大于0.01.
故选:C.
10.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为(  )
附x2,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
A.130 B.190 C.240 D.250
【答案】B
【解答】解:依题意,设男、女生的人数各为5x,建立2×2列联表如下所示:
喜欢网络课程 不喜欢网络课程 总计
男生 4x x 5x
女生 3x 2x 5x
总计 7x 3x 10x
由表中数据,计算K2,
由题可知6.63510.828,
得139.335≤10x<227.388,结合选项可知,被调查的男、女学生总数量可能为190.
故选:B.
(多选)11.下列结论错误的是(  )
A.两个变量的相关性越强,相关系数r越大
B.利用样本点求经验回归方程,则样本点可能都不在回归直线上
C.对于独立性检验,χ2的观测值越大,判断“两变量有关联”犯错误的概率越大
D.在2×2列联表中,若每个数据都变为原来的2倍,则χ2变为原来的2倍(χ2)
【答案】AC
【解答】解:A选项,两个变量的相关性越强,|r|越大,A选项错误;
B选项,由经验回归方程的实际意义,样本点有可能都不在直线上,B选项正确;
C选项,χ2的观测值越大,判断“两变量有关联”犯错误的概率越小,C选项错误;
D选项,若,每个数据都变为原来的2倍,
则,D选项正确.
故选:AC.
12.某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如表所示,其中x∈N*,且x<16,若有90%的把握可以认为性别与对工作的满意程度具有相关性,则x的值是  14或15  .
对工作满意 对工作不满意
男 5x 5x
女 4x 6x
附:,其中n=a+b+c+d.
P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001
k0 2.706 3.841 5.024 6.635 7.879 10.828
【答案】14或15.
【解答】解:根据独立性检验思想可得,,
得x>13.3947,
因为x∈N*且x<16,所以x=14或x=15,
则x的的取值为14或15.
故答案为:14或15.
13.ChatGPT爆火以来,各种人工智能平台如雨后春笋般层出不穷.某人工智能服务商提供了A,B两种会员服务套餐,购买会员服务的既有个人用户也有公司用户.后台随机调取m名会员的基本信息,统计发现购买B套餐的用户数占总用户数的,购买B套餐的用户中公司用户数是个人用户数的倍,购买A套餐的用户中公司用户数是个人用户数的一半.根据独立性检验,有99.5%的把握认为购买的套餐类型与用户类型有关系,则m的最小值为  170  .
附:.
P(χ2>k) 0.050 0.010 0.005 0.001
k 3.841 6.635 7.879 10.828
【答案】170.
【解答】解:由题意可得用户类型与购买的套餐类型2×2列联表如下:
A B 总计
个人用户
公司用户
总计 m

解得m>165.459,又因为m必须是10的倍数,所以m的最小值为170.
故答案为:170.
14.为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:
药物 疾病 合计
未患病 患病
服用 a 50﹣a 50
未服用 80﹣a a﹣30 50
合计 80 20 100
若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,
则a的最小值为  46  .(其中a≥40且a∈N*)(参考数据:,)
附:,n=a+b+c+d
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
【答案】46.
【解答】解:由题意可得,
整理得(100a﹣4000)2≥502×42×6.635,
解得a≥45.16或a≤34.84,
又因为a≥40且a∈N*,
所以a≥46,
所以a的最小值为46.
故答案为:46.
15.在科技飞速发展的今天,人工智能领域迎来革命性的突破,各种AI的人工智能大模型拥有强大的解决问题的能力.某机构分别用A,B两种人工智能大模型进行对比研究,检验这两种大模型在答题时哪种更可靠,从某知识领域随机选取180个问题进行分组回答,其中A人工智能大模型回答100个问题,有91个正确;B人工智能大模型回答剩下的80个问题,有65个正确.
(1)完成下列2×2列联表,并根据小概率值α=0.10的独立性检验,能否认为人工智能大模型的选择与回答正确有关?
回答正确 回答错误 合计
A人工智能大模型
B人工智能大模型
合计
(Ⅱ)将频率视为概率,用A人工智能大模型随机回答该知识领域的n(n≥2)道题目,且各题回答正确与否,相互之间没有影响.记其中恰有2个问题回答错误的概率为Pn,求Pn取得最大值时n的值.
参考公式及参考数据:χ2,n=a+b+c+d.
α 0.15 0.10 0.05 0.010
xα 2.072 2.706 3.841 6.635
【答案】(Ⅰ)2×2列联表如下:
回答正确 回答错误 合计
A人工智能大模型 91 9 100
B人工智能大模型 65 15 80
合计 156 24 180
能;
(Ⅱ)22.
【解答】解:(Ⅰ)根据题意,完成2×2列联表如下:
回答正确 回答错误 合计
A人工智能大模型 91 9 100
B人工智能大模型 65 15 80
合计 156 24 180
零假设H0:人工智能大模型的选择与回答正确无关,
则χ23.656>2.706,
根据小概率值α=0.10的独立性检验,我们推断H0不成立,即认为人工智能大模型的选择与回答正确有关;
(Ⅱ)将频率视为概率,用A人工智能大模型随机回答该知识领域的1道题目,答对的概率为,答错的概率为,
则Pn,
假设n=k时,Pn取得最大值,
则,
解得,
又因为k∈N,
所以k=22,
即Pn取得最大值时n的值为22.
16.某校开设劳动教育课程,共设置了两类课程:家政和园艺,共有400名学生参加.学校对选择了这两类课程的学生人数的分布进行了统计,相关数据记录在如下表格中,但其中有缺失.已知男生中选择家政课的比例为80%.
课程 性别 合计
男 女
家政 160
园艺 120
合计 400
(1)根据小概率值α=0.001的独立性检验,能否认为学生选择不同劳动教育课程与性别有关联?
(2)学校对某一课程中教授同一知识点教师的教授时长与学生任务完成率进行了跟进,授课时长x(分钟)和学生任务完成率y%的对应数据如下:
时长x 20 24 28 32 36 40
完成率y% 50 70 60 66 72 84
在任务完成率不全相等的条件下,学校为了调研是否存在学生任务完成率与平均完成率偏差过大的情况,需计算偏差系数φ(n),现给出以下两种数据处理方式:
甲:,乙:,已知偏差系数越大的处理方式,对于数据中大偏差数据的存在体现得越明显.
①用两种处理方式分别计算学生任务完成率的偏差系数φ(n),并指出哪一种数据处理方式对大偏差数据的存在体现更明显;
②判断此后学校每次调研均采用①中对大偏差数据的存在体现更明显的数据处理方式是否合理,并证明你的判断.
附:,n=a+b+c+d.
α 0.1 0.01 0.001
xα 2.706 6.635 10.828
【答案】(1)能认为(见解析);
(2)①甲的计算公式计算为,乙的计算公式计算为,乙;②是,证明见解析.
【解答】解:校开设劳动教育课程,共设置了两类课程:家政和园艺,共有400名学生参加.学校对选择了这两类课程的学生人数的分布进行了统计,
(1)设男生有x人,故x 80%=160,解得x=200,
故男生中选择园艺课的人数为40人,又因为其有400人参加课程、所以女生有200人,女生中选掸家政课的人数为80人.
完善列联表,
课程 性别 合计
男 女
家政 160 80 240
园艺 40 120 160
合计 200 200 400
零假设为H0:选择不同劳动教育课程与性别无关联.
因为,
故依据小概率值α=0.001的独立性检验,我们推断H0不成立,
即认为学生选择不同劳动教育课程与性别有关联,此推断犯错误的概率不大于0.001.
(2)学校对某一课程中教授同一知识点教师的教授时长与学生任务完成率进行了跟进,
①,
根据甲的计算公式计算:,故;
根据乙的计算公式计算:,
易知,因此乙的偏差系数大,从而乙对大偏差数据的存在体现更明显.
②采用①中对大偏差数据的存在体现更明显的数据处理方式,即乙的处理方式是合理的.
证明:不妨设,只需证明T≥S恒成立.
不妨设,则对于任意的bi,设函数,
即,
则二次函数f(x)的Δ≤0,
即,
从而对于原式,令bi=1,有,即T≥S恒成立,
故此后学校每次调研均采用①中对大偏差数据的存在体现更明显的数据处理方式是合理的.
17.为了了解高中学生语文成绩与数学成绩之间的联系,从某校抽取了200名学生的成绩样本,进行了统计,得到如下的2×2列联表.
语文成统 数学成绩 合计
优秀 不优秀
优秀 50 40
不优秀
合计 75 200
(1)请将上面的2×2列联表补充完整;
(2)是否有90%的把握认为语文成绩与数学成绩有关?
附:.
α=P(χ2≥k) 0.15 0.10 0.05 0.025
k 2.072 2.706 3.841 5.024
【答案】(1)列联表见解析;
(2)有90%的把握认为与数学成绩有关.
【解答】解:(1)根据题意可得如下2×2列联表.
语文成绩 数学成绩 合计
优秀 不优秀
优秀 50 40 90
不优秀 75 35 110
合计 125 75 200
(2)由列联表可得χ2,
所以有90%的把握认为语文成绩与数学成绩有关.
18.近年来,食品添加剂泛滥引起消费者关注,某媒体对消费者在购买预包装食品时是否关注配料表进行调查,调查了100名男性消费者与100名女性消费者,关注配料表的消费者共有80人,其中女性30人.
(1)用2×2列联表表示上述数据;
(2)依据小概率值α=0.01的独立性检验,能否认为消费者购买预包装食品时是否关注配料表与性别有关?
附:,其中n=a+b+c+d.
α 0.1 0.05 0.025 0.010
xα 2.706 3.841 5.024 6.635
【答案】(1)2×2列联表如下:
女性 男性 合计
关注配料表 30 50 80
不关注配料表 70 50 120
合计 100 100 200
(2)根据小概率值α=0.01的独立性检验,认为消费者购买预包装食品时是否关注配料表与性别有关.
【解答】解:(1)2×2列联表如下:
女性 男性 合计
关注配料表 30 50 80
不关注配料表 70 50 120
合计 100 100 200
(2)零假设H0:消费者购买预包装食品时是否关注配料表与性别无关,
则,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为消费者购买预包装食品时是否关注配料表与性别有关.
19.近年来,食品添加剂泛滥引起消费者关注,某媒体对消费者在购买预包装食品时是否关注配料表进行调查,调查了100名男性消费者与100名女性消费者,关注配料表的消费者共有80人,其中女性30人.
(1)用2×2列联表表示上述数据;
(2)是否有99%的把握认为消费者购买预包装食品时是否关注配料表与性别有关?
附:χ2,其中n=a+b+c+d.
α=P(χ2≥k) 0.1 0.05 0.025 0.010
k 2.706 3.841 5.024 6.635
【答案】(1)2×2列联表如下:
关注 不关注 合计
男性消费者 50 50 100
女性消费者 30 70 100
合计 80 120 200
(2)有99%的把握认为消费者购买预包装食品时是否关注配料表与性别有关.
【解答】解:(1)依题意,2×2列联表如下:
关注 不关注 合计
男性消费者 50 50 100
女性消费者 30 70 100
合计 80 120 200
(2)零假设H0:消费者购买预包装食品时是否关注配料表与性别无关,
则χ28.333>6.635,
依据小概率值α=0.010的独立性检验,我们推断H0不成立,即有99%的把握认为消费者购买预包装食品时是否关注配料表与性别有关.
20.2024年9月16日,沈阳市举行马拉松比赛,全球马拉松爱好者积极参与本场比赛,某服务部门为提升服务质量,随机采访了120名参赛人员,得到下表:
满意度 性别 合计
女性 男性
比较满意 r s 50
非常满意 t 40 70
合计 60 l 120
(1)求的值;
(2)能否有90%的把握认为不同性别的参赛人员对该部门服务质量的评价有差异?
(3)用频率估计概率,现随机采访本场比赛的1名女性参赛人员与2名男性参赛人员,已知3人中恰有一人对该部门服务非常满意,求该人为女性的概率.
附:.
α 0.1 0.01 0.001
xα 2.706 6.635 10.828
【答案】(1);
(2)有90%的把握认为不同性别的参赛人员对该部门服务质量的评价有差异,理由见解析;
(3).
【解答】解:(1)由题意可知,t=70﹣40=30,r=60﹣t=60﹣30=30,s=50﹣r=50﹣30=20,l=s+40=20+40=60,
所以;
(2)2×2列联表如下:
满意度 性别 合计
女性 男性
比较满意 30 20 50
非常满意 30 40 70
合计 60 60 120
零假设H0:不同性别的参赛人员对该部门服务质量的评价无差异,
则,
故依据小概率值α=0.1的独立性检验,我们推断H0不成立,即有90%的把握认为不同性别的参赛人员对该部门服务质量的评价有差异;
(3)女性对服务满意的概率为,女性对服务不满意的概率为,男性对服务满意的概率为,男性对服务不满意的概率为,
设事件A为“采访1名女性参赛人员与2名男性参赛人员中,3人中恰有一人对该部门服务非常满意”,事件B为“该人为女性”,
则,P(AB),
所以P(B|A).
21.目前电动车的电池有石墨烯电池与铅酸电池两种,某公司为了了解该市电动车消费者对这两种电池电动车的偏好,随机调查了500名电动车用户,其中男性用户300名,在被调查的女性用户中偏好铅酸电池电动车的占,得到以下的2×2列联表:
偏好石墨烯电池电动车 偏好铅酸电池电动车 合计
男性用户 200 300
女性用户
合计 500
(1)根据以上数据,完成2×2列联表,依据小概率值α=0.005的独立性检验,能否认为该市电动车用户对这两种电池的电动车的偏好与性别有关;
(2)从偏好石墨烯电池电动车的用户中按性别比例用分层随机抽样的方法随机抽取7人进行问卷调查,再从这7名用户中抽取2人进行座谈,在有女性用户参加座谈的条件下,求恰有两名女性用户参加座谈的概率;
(3)用样本的频率估计概率,在该市所有女性电动车用户中随机抽取3名进行新车试驾,记3名参加试驾的女性用户中偏好石墨烯电池电动车的人数为X,求X的分布列.
参考公式:χ2,其中n=a+b+c+d.
参考数据:
α 0.100 0.050 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)列联表见解析,能;
(2);
(3)分布列见解析.
【解答】解:(1)被调查的女性市民人数为500﹣200﹣100=200,
其中偏好铅酸电池电动车的女性市民人数为.
偏好石墨烯电池电动车的女性市民人数为200﹣120=80,
所以2×2列联表为:
偏好石墨烯电池电动车 偏好铅酸电池电动车 合计
男性市民 200 100 300
女性市民 80 120 200
合计 280 220 500
零假设H0:市民对这两种电池的电动车的偏好与市民的性别无关,
根据列联表中的数据可以求得

由于χ2=34.632>7.879,
根据小概率值α=0.005的独立性检验,我们推断H0不成立,
即认为市民对这两种电池的电动车的偏好与市民的性别有关.
(2)因为偏好石墨烯电池电动车的市民中,男性市民与女性市民的比为,
所以采用分层抽样的方法抽取7的人中,男性市民有5人,女性市民有2人,
设“恰有两名女性市民参加座谈”为事件B,“有女性市民参加座谈”为事件A,
则,,
所以.
(3)根据频率估计概率知,女性用户中偏好石墨烯电池电动车的概率为,
偏好铅酸电池电动车的概率为,
参加试驾的女性用户中偏好石墨烯电池电动车的人数为X,X可能取值为0,1,2,3,



故X的分布列如下:
X 0 1 2 3
P
22.某校在两个班级进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):
80分及80分以上 80分以下 总计
实验班 35 15 50
对照班 20 m 50
总计 55 45 n
(1)求m,n;
(2)根据表中数据回答:有99%的把握认为“教学方式与成绩有关系”吗?
A 总计
B a b a+b
c d c+d
总计 a+c b+d a+b+c+d
附:①2×2列联表:记n=a+b+c+d.
②χ2计算公式:
③常用的显著水平α以及相应的分位数k如下表所示.
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
【答案】(1)m=30,n=100;
(2)有.
【解答】解:(1)由题意可知,m=45﹣15=30,n=50+50=100;
(2)由题意可知,χ2 9.091,
因为9.091>6.635,
所以有99%的把握认为“教学方式与成绩有关系”.

展开更多......

收起↑

资源列表