8.3.1分类变量与列联表8.3.2独立性检验第三课 学案+练习(含解析,共2份打包) 高中数学人教A版(2019)选择性必修第三册

资源下载
  1. 二一教育资源

8.3.1分类变量与列联表8.3.2独立性检验第三课 学案+练习(含解析,共2份打包) 高中数学人教A版(2019)选择性必修第三册

资源简介

8.3.1分类变量与列联表+8.3.2独立性检验
第三练 能力提升拔高
【试题来源】来自各地期中期末的联考试题,进行整理和改编;
【试题难度】本次训练试题难度较大,适合学完第三课后,起到提升解题能力和素养的目的.
【目标分析】
1.独立性检验的应用.如第1,2题.
2.与独立性检验有关的综合问题.如第12,13题.
一、单选题
(22-23高二下·河南南阳·阶段练习)
1.在一次独立性检验中,得出2×2列联表如下:
A 合计
B 200 800 1000
180 a 180+a
合计 380 800+a 1180+a
且最后发现,两个分类变量A和B没有任何关系,则a的可能值是( )
A.200 B.720 C.100 D.180
(23-24高三上·四川成都·期末)
2.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 50
未注射疫苗 30 50
合计 30 100
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果” ( )
附:,.
A.0.001 B.0.05 C.0.01 D.0.005
(23-24高二下·河南南阳·阶段练习)
3.某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.若有的把握认为喜欢短视频和性别相关联,则的最小值为( )(附
A.18 B.20 C.22 D.24
(23-24高二上·全国·单元测试)
4.某校团委对“喜欢吃水果和学生性别是否有关”进行了一次调查,其中被调查的女生人数是男生人数的,男生喜欢吃水果的人数占被调查的男生人数的,女生喜欢吃水果的人数占被调查的女生人数的,若有99%的把握认为喜欢吃水果和学生性别有关,则被调查的男生至少有( )
0.10 0.05 0.010 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
A.12人 B.18人
C.24人 D.30人
(22-23高二下·江苏·课后作业)
5.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀 非优秀 总计
甲班
乙班
总计 105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是(  )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
(22-23高二下·江苏·单元测试)
6.在2×2列联表中,若每个数据变为原来的2倍,则的值变为原来的倍数为( )
A.8倍 B.4倍
C.2倍 D.不变
二、多选题
(22-23高二下·江苏·课时练习)
7.有两个分类变量x,y,其2×2列联表如下所示:
y1 y2 合计
x1 a 20-a 20
x2 15-a 30+a 45
合计 15 50 65
其中a,15-a均为大于5的整数,现有95%的把握认为x,y有关,则a的值为( )
A.6 B.7 C.8 D.9
(2024·广东湛江·一模)
8.某养老院有110名老人,经过一年的跟踪调查,过去的一年中他们是否患过某流行疾病和性别的相关数据如下表所示:
性别 是否患过某流行疾病 合计
患过该疾病 未患过该疾病
男 b
女 c
合计 80 110
下列说法正确的有( )
参考公式:,其中.
附表:
0.1 0.05 0.025 0.01 0.001
2.706 3.841 5.024 6.635 10.828
A.
B.
C.根据小概率值的独立性检验,认为是否患过该流行疾病与性别有关联
D.根据小概率值的独立性检验,没有充分的证据推断是否患过该流行疾病与性别有关联
(2024·湖北·一模)
9.某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过分层抽样的方式随机抽取100名学生进行问卷调查,将调查的结果得到如下等高堆积条形图和列联表,则( )
性别 数学兴趣 合计
感兴趣 不感兴趣
女生
男生
合计 100
参考数据:本题中
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.表中
B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多
C.根据小概率值的独立性检验,可以认为性别与对数学的兴趣有差异
D.根据小概率值的独立性检验,可以认为性别与对数学的兴趣没有差异
三、填空题
(22-23高二·全国·课时练习)
10.在一次独立性检验中,得出2×2列联表如下:
总计
200 800 1000
180 m
总计 380
最后发现,两个分类变量x和y没有任何关系,则m的可能值是 .
(22-23高三·全国·课后作业)
11.某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的,女生喜欢网络游戏的人数占女生人数的.若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有 人.(请将所有可能的结果都填在横线上)
附表:,其中.
0.050 0.010
3.841 6.635
四、解答题
(23-24高三下·河南·阶段练习)
12.近日,欧冠拉开帷幕,引得无数球迷的纷纷关注,成了体育竞技赛事的又一热点,为此某中学组织人员对在校学生“是否热爱踢足球”做了一次随机调查.共随机调查了18名男生和12名女生,调查发现,男、女生中分别有12人和6人喜爱该项运动,其余不喜爱.
(1)根据以上数据完成以下列联表.
喜欢踢足球 不喜欢踢足球 合计


合计
依据小概率值的独立性检验,分析性别与喜欢踢足球是否有关
(2)从被调查的女生中随机抽取3人,若其中喜爱踢足球的人数为,求的分布列及数学期望.
附:,其中.
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
(2024·四川遂宁·二模)
13.某校在课外活动期间设置了文化艺术类活动和体育锻炼类活动,为了解学生对这两类活动的参与情况,统计了如下数据:
文化艺术类 体育锻炼类 合计
男 100 300 400
女 50 100 150
合计 150 400 550
(1)通过计算判断,有没有90%的把握认为该校学生所选择课外活动的类别与性别有关系?
(2)“投壶”是中国古代宴饮时做的一种投掷游戏,也是一种礼仪.该校文化艺术类课外活动中,设置了一项“投壶”活动.已知甲、乙两人参加投壶活动,投中1只得1分,未投中不得分,据以往数据,甲每只投中的概率为,乙每只投中的概率为,若甲、乙两人各投2只,记两人所得分数之和为,求的分布列和数学期望.

附表及公式:
0.15 0.10 0.05 0.025 0.010
2.072 2.706 3.841 5.024 6.635
其中,.
【易错题目】第题、第题
【复盘要点】独立性检验与其它知识的综合应用
【典例】(23-24高二下·江西吉安·阶段练习)某校对学生餐厅的就餐环境 菜品种类与质量等方面进行了改造与提升,随机抽取100名男生与100名女生对就餐满意度进行问卷评分(满分100分)调查,调查结果统计如下表:男生:
评分分组 70分以下
人数 3 27 38 32
女生:
评分分组 70分以下
频数 5 35 34 26
学校规定:评分大于或等于80分为满意,小于80分为不满意.
(1)由以上数据完成下面的列联表,并判断是否有的把握认为学生的就餐满意度与性别有关联?
满意 不满意 总计
男生
女生
总计
(2)从男生、女生中评分在70分以下的学生中任意选取3人座谈调研,记为3人中男生的人数,求的分布列及数学期望.
附:,其中.
0.1 0.05 0.01
2.706 3.841 6.635
【答案】(1)列联表见详解;没有的把握认为学生的就餐满意度与性别有关联
(2)
【分析】(1)先根据统计表完成列联表,再根据独立性检验公式算出卡法,判定是否独立;
(2)根据题意可得男生的评分在70分以下的有3人,女生的评分在70分以下的有5人,则抽取的男生人数为服从超几何分布,再根据公式算出分布列及期望即可.
【详解】(1)依统计表可得列联表如下:
满意 不满意 总计
男生 70 30 100
女生 60 40 100
总计 130 70 200
则,
故没有的把握认为学生的就餐满意度与性别有关联.
(2)男生的评分在70分以下的有3人,女生的评分在70分以下的有5人,则为0,1,2,3.
则,,,,
所以的分布列为
0 1 2 3
P

【易错警示】
1.关于分类变量X和Y的抽样数据的2×2列联表
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
记n=a+b+c+d,则随机变量χ2=.
2.超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.超几何分布的特征是:
①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体数X的概率分布.
【复盘要点】
(23-24高三下·四川绵阳·阶段练习)
14.乒乓球,被称为中国的“国球”.某中学对学生参加乒乓球运动的情况进行调查,将每周参加乒乓球运动超过2小时的学生称为“乒乓球爱好者”,否则称为“非乒乓球爱好者”,从调查结果中随机抽取100份进行分析,得到数据如表所示:
乒乓球爱好者 非乒乓球爱好者 总计
男 40 56
女 24
总计 100
(1)补全列联表,并判断我们能否有的把握认为是否为“乒乓球爱好者”与性别有关?
(2)为了解学生的乒乓球运动水平,现从抽取的“乒乓球爱好者”学生中按性别采用分层抽样的方法抽取3人,与体育老师进行乒乓球比赛,其中男乒乓球爱好者获胜的概率为,女乒乓球爱好者获胜的概率为,每次比赛结果相互独立,记这3人获胜的人数为,求的分布列和数学期望.
0.05 0.010 0.005 0.001
3.841 6.635 7.879 10.828
参考公式:.
(2024·吉林·模拟预测)
15.短视频已成为当下宣传的重要手段,东北某著名景点利用短视频宣传增加旅游热度,为调查某天南北方游客来此景点旅游是否与收看短视频有关,该景点对当天前来旅游的500名游客调查得知,南方游客有300人,因收看短视频而来的280名游客中南方游客有200人.
(1)依据调查数据完成如下列联表,根据小概率值的独立性检验,分析南北方游客来此景点旅游是否与收看短视颍有关联:单位:人
游客 短视频 合计
收看 未看
南方游客
北方游客
合计
(2)为了增加游客的旅游乐趣,该景点设置一款5人传球游戏,每个人得到球后都等可能地传给其余4人之一,现有甲、乙等5人参加此游戏,球首先由甲传出.
(i)求经过次传递后球回到甲的概率;
(ii)记前次传递中球传到乙的次数为,求的数学期望.
参考公式:,其中;
附表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
(23-24高二下·广东深圳·阶段练习)
16.时下流行的直播带货与主播的学历层次有某些相关性,某调查小组就两者的关系进行调查,从网红的直播中得到容量为200的样本,将所得直播带货和主播的学历层次的样本观测数据整理如下:
主播的学历层次 直播带货评级 合计
优秀 良好
本科及以上 60 40 100
专科及以下 30 70 100
合计 90 110 200
(1)依据小概率值的独立性检验,分析直播带货的评级与主播学历层次是否有关?
(2)现从主播学历层次为本科及以上的样本中,按分层抽样的方法选出5人组成一个小组,从抽取的5人中再抽取3人参加主播培训,求这3人中,主播带货优秀的人数的概率分布和数学期望;
(3)统计学中常用表示在事件条件下事件发生的优势,称为似然比,当时,我们认为事件条件下发生有优势.现从这200人中任选1人,表示“选到的主播带货良好”,表示“选到的主播学历层次为专科及以下”,请利用样本数据,估计的值,并判断事件条件下发生是否有优势.
附:,
0.050 0.010 0.001
3.841 6.635 10.828
(2024·宁夏固原·一模)
17.2023年9月23日至10月8日,第19届亚洲运动会在中国杭州举行,这是我国继北京、广州亚运会后第三次举办亚运会,浙江某市一调研机构为了解本市市民对“亚运会”相关知识的认知程度,举办了一次“亚运会”网络知识竞赛,满分100分,并规定成绩不低于80分的市民获得优秀奖,成绩不低于70分的市民则认为成绩达标,现从参加了竞赛的男、女市民中各抽取了100名市民的竞赛成绩作为样本进行数据分析,对男市民的竞赛成绩进行统计后,得到如下图所示的成绩频率分布直方图.
(1)试分别估计男市民成绩达标以及获得优秀奖的概率;
(2)已知样本中女市民获得优秀奖的人数占比为5%,则是否有99.9%的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关?
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
(23-24高二下·湖南长沙·阶段练习)
18.产品质量是企业的生命线,为提高产品质量.企业非常重视产品生产线的质量,某企业引进了生产同一种产品的A,B两条生产线,为比较两条生产线的质量,从A,B生产线生产的产品中各自随机抽取了100件产品进行检测,把产品等级结果和频数制成了如图的统计图.
(1)请完成列联表:并依据小概率值的独立性检验,分析一级品率是否与生产线有关?
一级品 非一级品 合计
A生产线
B生产线
合计
(2)生产一件一级品可盈利100元,生产一件二级品可盈利50元,生产一件三级品则亏损20元,以频率估计概率.
①分别估计A,B生产线生产一件产品的平均利润;
②你认为哪条生产线的利润较为稳定?并说明理由.
附:①参考公式:,其中.
②临界表值:
0.10 0.02 0.010 0.005 0.001
2.706 3.841 6.635 7.897 10.828
试卷第1页,共3页
试卷第1页,共3页
参考答案:
1.B
【分析】把列联表中所给的数据代入求的公式,建立不等式,代入验证可知a的可能值.
【详解】两个分类变量A和B没有任何关系,

代入选项验证可知满足条件.
故选:B
2.B
【分析】计算卡方,再根据独立性检验的概念判断即可.
【详解】完善列联表如下:
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 40 50
未注射疫苗 20 30 50
合计 30 70 100
假设:“给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果”.
因为:,而,
所以根据小概率值的独立性检验,推断不成立.
即认为“给基因编辑小鼠注射该疫苗能起到预防该病毒感染的效果”.
故选:B
3.B
【分析】由已知数据计算,根据独立性检验的结论,列不等式求的m取值范围得最小值.
【详解】根据题意,写出列联表如下:
喜欢 不喜欢 合计
男 3m 3m 6m
女 4m 2m 6m
合计 7m 5m 12m
则.
因为有的把握认为喜欢短视频和性别相关联,
所以,解得,所以的最小值为20
故选:B
4.B
【分析】设被调查的男生人数为x,根据题意可得列联表,进而可得,运算求解即可.
【详解】设被调查的男生人数为x,被调查的女生人数为,则得到2×2列联表如下:
喜欢吃水果情况 总计
喜欢 不喜欢
学生 性别 男生
女生
总计
则,解得,
又因为男、女人数为整数,所以被调查的男生至少有18人.
故选:B.
5.D
【分析】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.
【详解】依题意,解得,由解得.
补全列联表如下:
优秀 非优秀 总计
甲班
乙班
总计 105
甲班的优秀率为,乙班的优秀率为,
,所以成绩与班级有关.所以D选项正确,ABC选项错误.
故选:D
6.C
【分析】根据公式分析判断即可
【详解】由公式中所有值变为原来的2倍,

故也变为原来的2倍.
故选:C.
7.CD
【分析】先求得的值,再根据有95%的把握认为x,y有关建立不等式求解.
【详解】解:由题意可知,
=,
又因为a>5且15-a>5,a∈Z,
所以当a=8或9时满足题意.
故选:CD
8.ABC
【分析】利用表格中提供数据可判断A正确,代入计算可判断B正确,结合附表参考数据可得C正确,D错误.
【详解】根据列联表中的数据可求得;
对于A,代入计算可得,正确;
对于B,经计算可得,可得B正确;
对于CD,结合附表数值以及独立性检验的实际意义,可认为根据小概率值的独立性检验,认为是否患过该流行疾病与性别有关联,即C正确,D错误;
故选:ABC
9.ACD
【分析】根据分层抽样的定义及等高条形图的特点即可得出的列联表中的数据,利用列联表中的数据计算观测值,再跟临界值进行比较即可求解.
【详解】由题可知,抽取男生人数为人,女生抽取的人数人,
由等高条形图知,抽取男生感兴趣的人数为人,抽取男生不感兴趣的人数为人,
抽取女生感兴趣的人数为人,抽取女生不感兴趣的人数为人,
的列联表如下
性别 数学兴趣 合计
感兴趣 不感兴趣
女生
男生
合计 100
由此表可知,,故A正确;
女生不感兴趣的人数约为人,男生不感兴趣的人数约为人,
所以估计该校高一新生中对数学不感兴趣的女生人数比男生少,故B 错误;
零假设为:性别与对数学的兴趣没有差异
依据小概率值的独立性检验,有充分证据推断不成立,
因此可以认为不成立,即可以认为性别与对数学的兴趣有差异;故C正确;
零假设为:性别与对数学的兴趣没有差异
依据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即可以认为性别与对数学的兴趣没有差异;故D正确.
故选:ACD.
10.720
【分析】根据题意可推出,解出即可得到.
【详解】由题意知,两个分类变量x和y没有任何关系,则应有,
即,即,解得.
故答案为:.
11.45,50,55,60,65
【分析】利用独立性检验表达列联表及观测值可解得答案.
【详解】设男生有x人,由题意可得列联表如下,
喜欢 不喜欢 合计
男生 x
女生 x
合计
若认为喜欢网络游戏和性别有关,且该推断犯错误的概率超过0.01但不超过0.05,
则.
∵,
∴,解得,
又x为5的整数倍,∴被调查的学生中男生可能人数为45,50,55,60,65.
故答案为:45,50,55,60,65.
12.(1)列联表见解析,
(2)分布列见解析,
【分析】(1)由题意可列出列联表,计算出卡方后与比较即可得;
(2)的可能取值为、、、,借助超几何分布的概率公式计算即可得其分布列,即可得其期望.
【详解】(1)列联表如下:
喜欢踢足球 不喜欢踢足球 合计
男 12 6 18
女 6 6 12
合计 18 12 30
零假设为:性别与喜欢踢足球无关,

故依据小概率值的独立性检验,可得性别与喜欢踢足球无关;
(2)的可能取值为、、、,
则,,
,,
故其分布列为:
其期望为:.
13.(1)有90%的把握认为该校学生所选择课外活动的类别与性别有关,
(2)分布列见解析,期望为
【分析】(1)根据表中数据计算卡方,即可求解,
(2)根据独立事件的概率乘法公式即可求解概率,进而可求解分布列以及期望.
【详解】(1)零假设没有90%的把握认为该校学生所选择课外活动的类别与性别有关,

故有90%的把握认为该校学生所选择课外活动的类别与性别有关,
(2)的可能取值为,
,




故的分布列为:
0 1 2 3 4
数学期望
14.(1)列联表见解析;有
(2)分布列见解析;期望为
【分析】(1)列出列联表,求出并与比较即可;
(2)分别求抽取的3人中男生和女生的人数,写出的可能取值,求出概率,求出期望.
【详解】(1)依题意可得列联表如下:
乒乓球爱好者 非乒乓球爱好者 总计
男 40 16 56
女 20 24 44
总计 60 40 100

我们有的把握认为是否为“乒乓球爱好者”与性别有关;
(2)由(1)得抽取的3人中人为男生,人为女生,
则的可能取值为、、、,
所以,,
,,
所以的分布列为:
0 1 2 3
所以.
15.(1)列联表见解析,无关
(2)(i);(ii)
【分析】(1)利用已知条件,完成列联表,利用独立性检验公式求解判断即可;
(2)(i)设经过次传递后回到甲的概率为,求出关系式,得到通项公式;(ii)方法一:设第次传递时甲接到球的次数为,则服从两点分布,,设前次传递中球传到甲的次数为,利用公式求期望即可.方法二:设第次传递时,乙接到球的概率和次数分别为与,则服从两点分布,,利用公式求期望即可.
【详解】(1)将所给数据进行整理,得到如下列联表:
游客 短视频 合计
收看 未看
南方游客 200 100 300
北方游客 80 120 200
合计 280 220 500
零假设:南北方游客来此景点旅游与短视频无关联.
根据小概率值的独立性检验,我们推断不成立,
即认为南北方游客来此景点旅游与收看短视频有关联,此推断犯错误的概率不大于0.001
(2)(i)设经过次传递后回到甲的概率为,
,,
又,
所以是首项为,公比为的等比数列,
所以.
(ii)(方法一)
设第次传递时甲接到球的次数为,则服从两点分布,,
设前次传递中球传到甲的次数为,

因为,所以.
(方法二)
设第次传递时,乙接到球的概率和次数分别为与,则服从两点分布,
,由题可知,,
又,所以,所以是首项为,公比为的等比数列,
,,

故.
【点睛】关键点点睛:本题第2问(ii)的解决关键是,根据题意得到的关系,利用构造法分析出是首项为,公比为的等比数列,由此得解.
16.(1)有;
(2)分布列见解析,;
(3),在事件条件下发生有优势
【分析】(1)根据列联表计算卡方,与临界值比较即可求解,
(2)根据分层抽样得带货优秀的有3人,直播带货良好的有2人,即可利用超几何分布的概率公式求解概率,由期望公式求解即可,
(3)根据所给的公式,结合条件概率公式可得,结合表中数据即可求解.
【详解】(1)由题意得,
由于,依据小概率值的独立性检验,
可以认为直播带货的评级与主播的学历层次有关联;
(2)按照分层抽样,直播带货优秀的有3人,直播带货良好的有2人,
随机变量的可能取值为1,2,3,
,,

所以的分布列为:
1 2 3
所以数学期望;
(3),
因为,所以认为在事件条件下发生有优势.
17.(1)
(2)有99.9%的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关.
【分析】(1)由频率分布直方图计算频率的公式分别计算即可得解;
(2)根据条件列出列联表,由的计算公式计算可判断结果.
【详解】(1)设取得的成绩为,
男市民成绩打标的概率为,
男市民获得优秀奖的概率为:.
(2)因为女市民获得优秀奖的人数占比为5%,所以女市民优秀人数为:人,男市民优秀人数为人,
列联表如图:
分类 优秀 不优秀 总计
女市民 5 95 100
男市民 25 75 100
总计 30 170 200

所以有99.9%的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关.
18.(1)列联表见解析,有关联
(2)①46元、50元;②A生产线的利润更为稳定,理由见解析
【分析】(1)根据题中频数图完成列联表,作出零假设,由卡方计算公式计算卡方并比较临界值即可得出结论;
(2)①记A、B生产线生产一件产品的利润为X,Y,根据频数图计算相应的概率,从而分别得到相应的分布列,由均值计算公式即可分别计算两个随机变量的均值,②由方差计算公式分别计算两个随机变量的方差,并比较大小即可说明其含义.
【详解】(1)根据已知数据可建立列联表如下:
一级品 非一级品 合计
A生产线 20 80 100
B生产线 35 65 100
合计 55 145 200
零假设为:一级品率与生产线无关联.
计算得:,
依据小概率值的独立性检验,我们推断不成立,
即认为一级品率与生产线有关联,此推断犯错误概率不大于0.05.
(2)A生产线生产一件产品为一、二、三级品的概率分别为,,.
记A生产线生产一件产品的利润为X,则X的取值为100,50,,
其分布列为
X 100 50
P
B生产线生产一件产品为一、二、三级品的概率分别为,,.
记B生产线生产一件产品的利润为Y,则Y的取值为100,50,,
其分布列为
Y 100 50
P
①;
.
故A,B生产线生产一件产品的平均利润分别为46元、50元.
②;
.
因为,所以A生产线的利润更为稳定.
答案第1页,共2页
答案第1页,共2页8.3.1分类变量与列联表+8.3.2独立性检验
第三课 知识扩展延伸
扩展1:独立性检验的综合应用
(2024·黑龙江吉林·二模)
例1.恰逢盛世,风调雨顺.某稻米产地今秋获得大丰收,为促进当地某品牌大米销售,甲、乙两位驻村干部通过直播宣传销售所驻村生产的该品牌大米.通过在某时段100名顾客在观看直播后选择在甲、乙两位驻村干部的直播间(下简称甲直播间、乙直播间)购买的情况进行调查(假定每人只在一个直播间购买大米),得到以下数据:
网民类型 在直播间购买大米的情况 合计
在甲直播间购买 在乙直播间购买
本地区网民 50 5 55
外地区网民 30 15 45
合计 80 20 100
(1)依据小概率值的独立性检验,能否认为网民选择在甲、乙直播间购买大米与网民所处地区有关;
(2)用样本分布的频率分布估计总体分布的概率,若共有名网民在甲、乙直播间购买大米,且网民选择在甲、乙两个直播间购买大米互不影响,记其中在甲直播间购买大米的网民数为X,求使事件“”的概率取最大值时k的值.
附:,其中.
0.1 0.05 0.01 0.005
2.706 3.841 6.635 7.879
【答案】(1)能认为网民选择在甲、乙直播间购买大米与网民所处地区有关
(2)
【分析】(1)根据列联表信息,计算出的观测值,结合临界值表可得出结论;
(2)根据二项分布求出在甲直播间购买大米的网民人数为的概率,利用作商法判断概率的大小即可得解.
【详解】(1)提出零假设:网民选择在甲、乙直播间购买大米与网民所处地区没有关联,
经计算得,
依据小概率值的独立性检验,我们推断不成立,
即认为网民选择在甲、乙直播间购买大米与网民所处地区有关联.
(2)利用样本分布的频率估计总体分布的概率,
可知网民选择在甲直播间购买夏橙的概率为,
则,记,,
则,
则问题等价于求当取何值时取最大值,
因为,,
又,
所以当时,;
当时,;
当时,;
所以,

所以当时,取最大值,
即使事件“”的概率取最大值的的值为.
【点睛】关键点点睛:本题第2小问解决的关键是,借助参数,,简化了计算,从而得解.
【方法总结】独立性检验
基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
【举一反三1-1】
(2024·陕西咸阳·二模)
1.陕西省从2022年秋季启动新高考,新高考“3+1+2”模式中“3”为全国统一高考科目的语文、数学、外语,“1”为首选科目.要求从物理、历史2门科目中确定1门,“2”为再选科目,要求从思想政治、地理、化学、生物学4门科目中确定2门,共计产生12种组合.某班有学生50名,在选科时,首选科目选历史和物理的统计数据如下表所示:
历史 物理 合计
男生 1 24 25
女生 9 16 25
合计 10 40 50
附:,其中.
0.100 0.050 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
(1)根据表中的数据,判断是否有99.5%的把握认为学生选择历史与性别有关;
(2)从选择物理类的40名学生中按照分层抽样,任意抽取5名同学成立学习小组,该小组设正、副组长各一名,求正、副组长中至少有一名女同学的概率.
【举一反三1-2】
(23-24高三下·上海浦东新·阶段练习)
2.环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量(单位:辆)和空气中的的平均浓度(单位:). 调研人员采集了50天的数据,制作了关于的散点图,并用直线与将散点图分成如图所示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的列联表,并判断至少有多大把握认为“平均浓度不小于与“汽车日流量不小于1500辆”有关;
汽车日流量 汽车日流量 合计
的平均浓度
的平均浓度
合计
(2)经计算得回归方程为,且这50天的汽车日流量的标准差,的平均浓度的标准差.
①求相关系数,并判断该回归方程是否有价值;
②若这50天的汽车日流量满足,试推算这50天的日均浓度的平均数.(精确到0.1)
参考公式:,其中.
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
回归方程,其中.
相关系数. 若,则认为与有较强的线性相关性.
(湖南·高考真题)
3.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 总计
爱好 40 20 60
不爱好 20 30 50
总计 60 50 110

附表:
0.050 0.010 0.001
3.841 6.635 10.828
参照附表,得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
(江西·高考真题)
4.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是(  )
表1
成绩性别 不及格 及格 总计
男 6 14 20
女 10 22 32
总计 16 36 52
表2
视力性别 好 差 总计
男 4 16 20
女 12 20 32
总计 16 36 52
表3
智商性别 偏高 正常 总计
男 8 12 20
女 8 24 32
总计 16 36 52
表4
阅读量性别 丰富 不丰富 总计
男 14 6 20
女 2 30 32
总计 16 36 52
A.成绩 B.视力 C.智商 D.阅读量
(2023·全国·高考真题)
5.一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(1)计算试验组的样本平均数;
(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表
对照组
试验组
(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?
附:,
0.100 0.050 0.010
2.706 3.841 6.635
(2022·全国·高考真题)
6.甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附:,
0.100 0.050 0.010
2.706 3.841 6.635
(2022·全国·高考真题)
7.一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:;
(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.
附,
0.050 0.010 0.001
k 3.841 6.635 10.828
(2021·全国·高考真题)
8.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
(海南·高考真题)
9.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:

32 18 4
6 8 12
3 7 10
(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
(2)根据所给数据,完成下面的列联表:

(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?
附:,
0.050 0.010 0.001
3.841 6.635 10.828
(山东·高考真题)
10.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:
(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
(2)根据所给数据,完成下面的列联表:
(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?
附:,
(全国·高考真题)
11.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次空气质量等级 [0,200] (200,400] (400,600]
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400 人次>400
空气质量好
空气质量不好
附:,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
(全国·高考真题)
12.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意 不满意
男顾客 40 10
女顾客 30 20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:.
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
试卷第1页,共3页
试卷第1页,共3页
参考答案:
1.(1)有
(2)
【分析】(1)根据列联表中的数据,计算的值,与比较可得结果;
(2)问题转化成古典概型,利用古典概型的概率计算公式计算可得.
【详解】(1)将表中的数据带入,得到

所以有99.5%的把握认为学生选择历史与性别有关.
(2)由题意知,抽取的5名同学中,男生有3名,设为A,B,C,女生2名,设为D,E,
从这5名同学中选取2名同学担任正副组长,所有的可能情况有:
,,,,,,,,,,共计10种基本情况,且每种情况的发生是等可能的,
其中至少有一名女生的情况有,,,,,,,共计有7种情况,
所以(至少有一名女生).
2.(1)列联表见解析,至少有的把握;
(2)① 0.84,有价值;②
【分析】(1)根据题意,完成列联表,再计算,结合表格即可求得结果.
(2)代入公式计算可判断与的相关性强弱,由可得,结合回归直线必过样本中心可求得的值.
【详解】(1)列联表如下:
汽车日流量 汽车日流量 合计
的平均浓度 16 8 24
的平均浓度 6 20 26
合计 22 28 50
零假设:“PM2.5平均浓度不小于100μg/m3”与“汽车日流量不小于1500辆”无关,
因为,
所以至少有的把握(但还不能有的把握)认为“平均浓度不小于”与“汽车日流量不小于1500辆有关”.
(2)①因为回归方程为,所以,
又因为,,
所以.
与有较强的相关性,该回归方程有价值.
②,解得
而样本中心点位于回归直线上,
因此可推算.
3.A
【详解】由,而,故由独立性检验的意义可知选A
4.D
【分析】根据公式分别计算得观察值,比较大小即可得结果.
【详解】根据公式分别计算得:A.;
;
;
选项D的值最大,所以与性别有关联的可能性最大,故选D.
【点睛】本题主要考查独立性检验的应用,意在考查灵活应用所学知识解决实际问题的能力,属于中档题.
5.(1)
(2)(i);列联表见解析,(ii)能
【分析】(1)直接根据均值定义求解;
(2)(i)根据中位数的定义即可求得,从而求得列联表;
(ii)利用独立性检验的卡方计算进行检验,即可得解.
【详解】(1)试验组样本平均数为:
(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,
由原数据可得第11位数据为,后续依次为,
故第20位为,第21位数据为,
所以,
故列联表为:
合计
对照组 6 14 20
试验组 14 6 20
合计 20 20 40
(ii)由(i)可得,,
所以能有的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.
6.(1)A,B两家公司长途客车准点的概率分别为,
(2)有
【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;
(2)根据表格中数据及公式计算,再利用临界值表比较即可得结论.
【详解】(1)根据表中数据,A共有班次260次,准点班次有240次,
设A家公司长途客车准点事件为M,
则;
B共有班次240次,准点班次有210次,
设B家公司长途客车准点事件为N,
则.
A家公司长途客车准点的概率为;
B家公司长途客车准点的概率为.
(2)列联表
准点班次数 未准点班次数 合计
A 240 20 260
B 210 30 240
合计 450 50 500
=,
根据临界值表可知,有的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
7.(1)答案见解析
(2)(i)证明见解析;(ii);
【分析】(1)由所给数据结合公式求出的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)根据(i)结合已知数据求.
【详解】(1)由已知,
又,,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)因为,
所以
所以,
(ii)
由已知,,
又,,
所以
8.(1)75%;60%;
(2)能.
【分析】根据给出公式计算即可
【详解】(1)甲机床生产的产品中的一级品的频率为,
乙机床生产的产品中的一级品的频率为.
(2),
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.
9.(1);(2)答案见解析;(3)有.
【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;
(2)根据表格中数据可得列联表;
(3)计算出,结合临界值表可得结论.
【详解】(1)由表格可知,该市100天中,空气中的浓度不超过75,且浓度不超过150的天数有天,
所以该市一天中,空气中的浓度不超过75,且浓度不超过150的概率为;
(2)由所给数据,可得列联表为:
合计
64 16 80
10 10 20
合计 74 26 100
(3)根据列联表中的数据可得

因为根据临界值表可知,有的把握认为该市一天空气中浓度与浓度有关.
【点睛】本题考查了古典概型的概率公式,考查了完善列联表,考查了独立性检验,属于中档题.
10.(1);(2)答案见解析;(3)有.
【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;
(2)根据表格中数据可得列联表;
(3)计算出,结合临界值表可得结论.
【详解】(1)由表格可知,该市100天中,空气中的浓度不超过75,且浓度不超过150的天数有天,
所以该市一天中,空气中的浓度不超过75,且浓度不超过150的概率为;
(2)由所给数据,可得列联表为:
合计
64 16 80
10 10 20
合计 74 26 100
(3)根据列联表中的数据可得

因为根据临界值表可知,有的把握认为该市一天空气中浓度与浓度有关.
【点睛】本题考查了古典概型的概率公式,考查了完善列联表,考查了独立性检验,属于中档题.
11.(1)该市一天的空气质量等级分别为、、、的概率分别为、、、;(2);(3)有,理由见解析.
【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为、、、的概率;
(2)利用每组的中点值乘以频数,相加后除以可得结果;
(3)根据表格中的数据完善列联表,计算出的观测值,再结合临界值表可得结论.
【详解】(1)由频数分布表可知,该市一天的空气质量等级为的概率为,等级为的概率为,等级为的概率为,等级为的概率为;
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为
(3)列联表如下:
人次 人次
空气质量好
空气质量不好

因此,有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.
12.(1);
(2)能有的把握认为男、女顾客对该商场服务的评价有差异.
【分析】(1)从题中所给的列联表中读出相关的数据,利用满意的人数除以总的人数,分别算出相应的频率,即估计得出的概率值;
(2)利用公式求得观测值与临界值比较,得到能有的把握认为男、女顾客对该商场服务的评价有差异.
【详解】(1)由题中表格可知,50名男顾客对商场服务满意的有40人,
所以男顾客对商场服务满意率估计为,
50名女顾客对商场满意的有30人,
所以女顾客对商场服务满意率估计为,
(2)由列联表可知,
所以能有的把握认为男、女顾客对该商场服务的评价有差异.
【点睛】该题考查的是有关概率与统计的知识,涉及到的知识点有利用频率来估计概率,利用列联表计算的值,独立性检验,属于简单题目.
答案第1页,共2页
答案第1页,共2页

展开更多......

收起↑

资源列表