资源简介 第03讲 8.3 列联表与独立性检验(8.3.1分类变量与列联表+8.3.2独立性检验)课程标准 学习目标①了解分类变量与数值变量的区别,了解回归与相关的区别。 ②通过实例,理解通过比较相关比率,利用2×2列联表或等高图可以初步检验两个随机变量的独立性. 理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误。 ③理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误。 本节课要求会通过比较相关比率,判断两个随机变量的独立性. 会对简单的数据分析案例进行初步独立性分析.恰当构造卡方统计量及利用小概率事件原理实现对两个分类变量的是否独立的科学检验.能解决简单的与独立性检验相关的实际问题知识点1:分类变量与列联表(1)分类变量为了方便,会使用一种特殊的随机变量,区别不同的现象或性质,这随机变量称为分类变量.(2)列联表①2×2列联表给出了两个分类变量数据的交叉分类频数.②定义一对分类变量和,我们整理数据如下表所示:合计合计知识点2:独立性检验(1)独立性检验定义:利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”.简称独立性检验.(2)独立性检验公式:其中(注意使用公式时分子的平方不要忽略了)【即学即练1】(2024上·江西九江·高二统考期末)某校随机调查了100名高中生是否喜欢篮球,按照男女区分得到列联表,经计算得.根据独立性检验的相关知识,对照下表,可以认为有( )把握喜欢篮球与性别有关.0.05 0.01 0.005 0.0013.841 6.635 7.879 10.828A. B. C. D.【答案】B【详解】,有把握认为与性别有关,故选:B.题型01通过等高堆积条形图判断两个分类变量是否存在差异【典例1】(2014·吉林长春·统考三模)观察下列各图,其中两个分类变量x,y之间关系最强的是( )A. B.C. D.【典例2】(2017·广东佛山·统考一模)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男 女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的( )A.样本中的女生数量多于男生数量B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C.样本中的男生偏爱两理一文D.样本中的女生偏爱两文一理【典例3】(2012下·山东青岛·高二山东省青岛第一中学校考期中)为了了解某高校学生喜欢使用手机支付是否与性别有关,抽取了部分学生作为样本,统计后作出如图所示的等高条形图,则下列说法正确的是( )A.喜欢使用手机支付与性别无关B.样本中男生喜欢使用手机支付的约C.样本中女生喜欢使用手机支付的人数比男生多D.女生比男生喜欢使用手机支付的可能性大些【变式1】(2021·高二课时练习)在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )A.与 B.与C.与 D.与【变式2】(2023·四川达州·统考一模)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是( )A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数C.样本中选择物理学科的人数较多D.样本中男生人数少于女生人数题型02 独立性检验的概念及辨析【典例1】(2024上·全国·高三专题练习)根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为( )A.变量与不独立,这个结论犯错误的概率不超过B.变量与不独立,这个结论犯错误的概率不超过C.变量与独立,这个结论犯错误的概率不超过D.变量与独立,这个结论犯错误的概率不超过【典例2】(2024·全国·高三专题练习)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生 女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为( )附:,附表:0.05 0.013.841 6.635A.7 B.8 C.9 D.10【变式1】(2024上·全国·高三专题练习)北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为( )参考公式:,其中.参考数据:A. B. C. D.【变式2】(多选)(2024上·全国·高三期末)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中,由列联表中的数据计算得.参照附表,下列结论正确的是( )附表:A.根据小概率值的独立性检验,分析认为“药物有效”B.根据小概率值的独立性检验,分析认为“药物无效”C.根据小概率值的独立性检验,分析认为“药物有效”D.根据小概率值的独立性检验,分析认为“药物无效”题型03卡方的计算【典例1】(2024上·湖南长沙·高三湖南师大附中校考阶段练习)为检验预防某种疾病的两种疫苗的免疫效果,随机抽取接种疫苗的志愿者各100名,化验其血液中某项医学指标(该医学指标范围为,统计如下:该项医学指标接种疫苗人数 10 50接种疫苗人数 30 40个别数据模糊不清,用含字母的代数式表示.(1)为检验该项医学指标在内的是否需要接种加强针,先从医学指标在的志愿者中,按接种疫苗分层抽取8人,再次抽血化验进行判断.从这8人中随机抽取4人调研医学指标低的原因,记这4人中接种疫苗的人数为,求的分布列与数学期望;(2)根据(1)化验研判结果,医学认为该项医学指标低于50,产生抗体较弱,需接种加强针,该项医学指标不低于50,产生抗体较强,不需接种加强针.请先完成下面的列联表,若根据小概率的独立性检验,认为接种疫苗与志愿者产生抗体的强弱有关联,求的最大值.疫苗 抗体 合计抗体弱 抗体强疫苗疫苗合计附:,其中.0.25 0.025 0.0051.323 5.024 7.879【典例2】(2024·云南楚雄·云南省楚雄彝族自治州民族中学模拟预测)全国“村BA”篮球赛点燃了全民的运动激情,深受广大球迷的喜爱.每支球队都有一个或几个主力队员,现有一支“村BA”球队,其中甲球员是其主力队员,经统计该球队在某个赛季的所有比赛中,甲球员是否上场时该球队的胜负情况如表.甲球员是否上场 球队的胜负情况 合计胜 负上场 40 45未上场 3合计 42(1)完成列联表,并判断依据小概率值的独立性检验,能否认为球队的胜负与甲球员是否上场有关;(2)由于队员的不同,甲球员主打的位置会进行调整,根据以往的数据统计,甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.(i)当甲球员上场参加比赛时,求球队赢球的概率;(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,求甲球员打中锋的概率.(精确到0.01)附:,.0.15 0.10 0.05 0.025 0.010 0.0012.072 2.706 3.841 5.024 6.635 10.828【典例3】(2024上·广西北海·高二统考期末)在对人们休闲方式的一次调查中,共调查了120人,其中女性70人,男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.(1)根据以上数据完成以下列联表;休闲方式 性别 看电视 运动 合计女男合计(2)能否有把握认为性别与休闲方式有关系?附:,其中.0.15 0.1 0.05 0.025 0.01 0.0012.072 2.706 3.841 5.024 6.635 10.828【变式1】(2024上·四川成都·高三成都七中校考期末)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):被某病毒感染 未被某病毒感染 合计注射疫苗 10 50未注射疫苗 30 50合计 30 1000.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果” ( )附:,.A.0.001 B.0.05 C.0.01 D.0.005【变式2】(2024上·江西鹰潭·高二统考期末)积化和差的重要应用在于求解傅里叶级数.为了解学生掌握该组公式的情况,在高一 高三两个年级中随机抽取了100名学生进行考查,其中高三年级的学生占,其他相关数据如下表:合格 不合格 总计高三年级学生 54高一年级学生 16总计 100(1)请完成2×2列联表,依据小概率值1的独立性检验,分析“对公式的掌握情况”与“学生所在年级”是否有关?(2)以频率估计概率,从该校高一年级学生中抽取3名学生,记合格的人数为X,求X的分布列和数学期望.附表及公式:0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828其中【变式3】(2024上·福建泉州·高三统考期末)教育部印发的《国家学生体质健康标准》,要求学校每学年开展全校学生的体质健康测试工作.某中学为提高学生的体质健康水平,组织了“坐位体前屈”专项训练.现随机抽取高一男生和高二男生共60人进行“坐位体前屈”专项测试.高一男生成绩的频率分布直方图如图所示,其中成绩在的男生有4人.高二男生成绩(单位:)如下:10.2 12.8 6.4 6.6 14.3 8.3 16.8 15.9 9.7 17.518.6 18.3 19.4 23.0 19.7 20.5 24.9 20.5 25.1 17.5(1)估计高一男生成绩的平均数和高二男生成绩的第40百分位数;(2)《国家学生体质健康标准》规定,高一男生“坐位体前屈”成绩良好等级线为,高二男生为.已知该校高一年男生有600人,高二年男生有500人,完成下列列联表,依据小概率值的独立性检验,能否认为该校男生“坐位体前屈”成绩优良等级与年级有关?等级 年级 良好及以上 良好以下 合计高一高二合计附:,其中.0.05 0.010 0.005 0.0013.841 6.635 7.879 10.828题型04独立性检验的基本思想【典例1】(2024·四川绵阳·绵阳南山中学实验学校校考模拟预测)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):被某病毒感染 未被某病毒感染 合计注射疫苗 10 50未注射疫苗 30 50合计 30 100计算可知,根据小概率值α=________的独立性检验,分析 “给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”( )附:,n=a+b+c+d.α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828A.0.001 B.0.05C.0.01 D.0.005【典例2】(2024上·全国·高三专题练习)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对学生体育锻炼的经常性有影响,为此随机抽取了40名学生,按照性别和体育锻炼情况整理得到如下的列联表:性别 锻炼 合计不经常 经常女生 5 10 15男生 5 20 25合计 10 30 40(1)根据上表数据,依据小概率值的独立性检验,能否认为性别因素会影响学生体育锻炼的经常性?(2)如果将表中的数据都扩大为原来的倍,在相同的检验标准下,得到与(1)中不一样的结论.(i)求的最小值;(ii)如果抽样方式不变,你认为(1)和(2)的结论哪个更可靠,并说明理由.附:,其中0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828【变式1】(多选)(2024上·安徽·高三合肥市第八中学校联考开学考试)电影《八角笼中》是由王宝强导演并参演的一部电影,讲述了年轻人为理想而努力奋斗的故事. 该电影一上映就引起了广大观众的热议,票房也超出了预期,现随机抽取若干名观众进行调查,所得数据统计如下表所示,则( )喜欢该电影 不喜欢该电影男性观众 160 40女性观众 140 60附:.0. 10 0. 05 0. 01 0. 0012. 706 3. 841 6. 635 10. 828A.若在被调查的观众中随机抽取1人,则抽到喜欢该电影的男性观众的概率为B.在被调查的观众中,男性不喜欢该电影的比例高于女性C.根据小概率值的独立性检验,可以认为被调查观众的性别与对电影的喜爱程度有差异D.根据小概率值的独立性检验,可以认为被调查观众的性别与对电影的喜爱程度有差异【变式2】(2024上·全国·高三专题练习)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:跳绳 性别 合计男 女爱好 40 20 60不爱好 20 30 50合计 60 50 110已知,0.05 0.01 0.0013.841 6.635 10.828则以下结论正确的是( )A.根据小概率值的独立性检验,爱好跳绳与性别无关B.根据小概率值的独立性检验,爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001C.根据小概率值的独立性检验,有99%以上的把握认为“爱好跳绳与性别无关”D.根据小概率值的独立性检验,在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别无关”题型05独立性检验解决实际问题【典例1】(2024·湖南长沙·统考一模)某厂为了考察设备更新后的产品优质率,质检部门根据有放回简单随机抽样得到的样本测试数据,制作了如下列联表:产品 优质品 非优质品更新前 24 16更新后 48 12(1)依据小概率值的独立性检验,分析设备更新后能否提高产品优质率?(2)如果以这次测试中设备更新后的优质品频率作为更新后产品的优质率.质检部门再次从设备更新后的生产线中抽出5件产品进行核查,核查方案为:若这5件产品中至少有3件是优质品,则认为设备更新成功,提高了优质率;否则认为设备更新失败.①求经核查认定设备更新失败的概率;②根据的大小解释核查方案是否合理.附:0.050 0.010 0.0013.841 6.635 10.828【典例2】(2024上·吉林·高二长春市第二实验中学校联考期末)李连贵熏肉大饼是吉林省四平市极具传统特色的美味小吃,有着悠久的历史,创始于1908年,距今已经有着一百多年的历史了.李连贵熏肉大饼的制作方法十分考究,选用猪肉和面粉为主要原料,将猪肉制作成熏肉,在加上公丁香,肉 ,沙仁等几十种配料謷煮,最后加入调料抹在饼内,夹肉而食,吃起来外酥里软,美味可口,是一道集美味和药膳于一体的美味佳肴,很多外地游客慕名前往四平品尝.某调查机构从年龄在岁的游客中随机抽取100人,对是否有意向购买熏肉大饼进行调查,结果如下表:年龄/岁抽取人数有意向购买熏肉大饼的人数(1)若以年龄40岁为分界线,由以上统计数据完成下面的列联表,并依据小概率值的独立性检验,能否认为购买熏肉大饼与人的年龄有关 年龄低于岁的人数 年龄不低于岁的人数 总计有意向购买熏肉大饼的人数无意向购买熏肉大饼的人数总计(2)用样本估计总体,用频率估计概率,从年龄在的所有游客中随机抽取3人,设这3人中打算购买熏肉大饼的人数为,求的分布列和数学期望.【参考数据及公式】,其中.【变式1】(2024上·甘肃·高三统考阶段练习)第18届亚洲杯将于2024年1月12日在卡塔尔举行,该比赛预计会吸引亿万球迷观看.为了了解某校大学生喜爱观看足球比赛是否与性别有关,该大学记者站随机抽取了100名学生进行统计,其中女生喜爱观看足球比赛的占女生人数的,男生有10人表示不喜欢看足球比赛.(1)完成下面列联表,试根据小概率值的独立性检验,判断能否认为喜爱观看足球比赛与性别有关联?男 女 合计喜爱看足球比赛不喜爱看足球比赛合计 60(2)在不喜爱观看足球比赛的观众中,按性别用分层随机抽样的方式抽取8人,再从这8人中随机抽取2人参加校记者站的访谈节目,设抽到的男生人数为,求的分布列和期望.附:,其中.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828【变式2】(2024上·广东·高三统考期末)学校为了让学生的学习与活动两不误,在延时课开设篮球、书法两项活动,为了了解学生的选择意向,随机调查了部分同学,得到如下列联表.性别 选择篮球 选择书法男生 40 10女生 25 25(1)根据上表,分别估计该校男、女生选择篮球的概率;(2)试根据小概率值的独立性检验,分析性别与选择意向是否有关联.附:,其中.0.05 0.025 0.01 0.005 0.0013.841 5.024 6.635 7.879 10.828A夯实基础 B能力提升A夯实基础一、单选题1.(2024下·全国·高二随堂练习)下列关于独立性检验的说法正确的是( )A.独立性检验是对两个变量是否具有线性相关关系的一种检验B.独立性检验可以确定两个变量之间是否具有某种关系C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大2.(2024下·全国·高二随堂练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:每年体检 每年未体检 合计老年人 7年轻人 6合计 50已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )A. B.C. D.3.(2024下·全国·高二随堂练习)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )A. B. C. D. 4.(2024下·全国·高二随堂练习)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了地区A的100天日落和夜晚天气,得到如下2×2列联表(单位:天),并计算得到,下列小波对地区A天气的判断不正确的是( )日落云里走 夜晚天气 下雨 未下雨出现 25 5未出现 25 45参考公式:临界值参照表:0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828A.夜晚下雨的概率约为B.未出现“日落云里走”,夜晚下雨的概率约为C.据小概率值的独立性检验,认为“日落云里走”是否出现与夜晚天气有关D.出现“日落云里走”, 据小概率值的独立性检验,可以认为夜晚会下雨5.(2024上·全国·高三专题练习)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:优秀 非优秀 总计甲班乙班总计 105已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.列联表中c的值为20,b的值为50D.由列联表可看出成绩与班级有关系6.(2024上·全国·高三专题练习)假设有两个变量x与y的列联表如下表:a bc d对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )A.,,, B.,,,C.,,, D.,,,7.(2024·全国·高三专题练习)在新高考改革中,浙江省新高考实行的是7选3的模式,即语数外三门为必考科目,然后从物理、化学、生物、政治、历史、地理、技术(含信息技术和通用技术)7门课中选考3门.某校高二学生选课情况如下列联表一和列联表二(单位:人)选物理 不选物理 总计男生 340 110 450女生 140 210 350总计 480 320 800表一选生物 不选生物 总计男生 150 300 450女生 150 200 350总计 300 500 800表二试根据小概率值的独立性检验,分析物理和生物选课与性别是否有关( )附:A.选物理与性别有关,选生物与性别有关B.选物理与性别无关,选生物与性别有关C.选物理与性别有关,选生物与性别无关D.选物理与性别无关,选生物与性别无关8.(2024·全国·高三专题练习)在一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下2×2列联表:优秀 非优秀 合计甲班人数 50乙班人数 20合计 30 110附:,其中.根据独立性检验,可以认为数学考试成绩与班级有关系的把握为( )A. B. C. D.二、多选题9.(2024上·山西运城·高三校考期末)某校有在校学生900人,其中男生400人,女生500人,为了解该校学生对学校课后延时服务的满意度,随机调查了40名男生和50名女生.每位被调查的学生都对学校的课后延时服务给出了满意或不满意的评价,统计过程中发现随机从这90人中抽取一人,此人评价为满意的概率为.在制定列联表时,由于某些因素缺失了部分数据,而获得如下列联表,下列结论正确的是( )满意 不满意 合计男 10女合计 90参考公式与临界值表,其中.0.100 0.050 0.025 0.010 0.0012.706 3.841 5.024 6.635 10.828A.满意度的调查过程采用了分层抽样的抽样方法B.50名女生中对课后延时服务满意的人数为20C.的观测值为9D.根据小概率的独立性检验,不可以认为“对课后延时服务的满意度与性别有关系”10.(2024上·贵州·高三统考开学考试)某学校高三年级于2023年5月初进行了一次高三数学备考前测考试.按照分数大于或等于120的同学评价为“优秀生”,其它分数的同学评价为“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽取1人,成绩优秀的概率为,根据表(2)的数据可断定下列说法正确的是( )班级 战绩 合计优秀生 潜力生甲班 10 b乙班 c 30合计 105表(1)0.05 0.01 0.0013.841 6.635 10.828表(2)A.列联表中c的值为30,b的值为35B.列联表中c的值为20,b的值为45C.根据列联表中的数据,有95%的把握认为成绩与班级有关D.根据列联表中的数据,没有95%的把握认为成绩与班级有关三、填空题11.(2024下·全国·高二随堂练习)为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:药物 疾病 合计未患病 患病服用 a 50未服用 50合计 80 20 100若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为 .(其中且)(参考数据:,)附:,α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.82812.(2024下·全国·高二随堂练习)2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:了解 不了解 总计年龄不小于60岁 a b a+b年龄小于60岁 c d c+d总计 a+c b+d a+b+c+d给出下列4组数据:① ;② ;③ ;④ .则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是 .(填序号)四、解答题13.(2024上·河南焦作·高二统考期末)近年来,直播带货逐渐兴起,成为乡村振兴的新动力,为了解甲 乙两个推销农产品的直播间的销售情况,统计了两个直播间一段时间内观众下单的相关数据,得到如下的表格:下单的观众数 未下单的观众数甲直播间 120 80乙直播间 60 80(1)分别估计甲 乙直播间的观众下单的概率;(2)是否有的把握认为两个直播间观众的下单意愿有差异?附.0.05 0.01 0.0013.841 6.635 10.82814.(2024上·山东日照·高三山东省五莲县第一中学校考期末)某花圃为提高某品种花苗质量,开展技术创新活动,A,B在实验地分别用甲、乙方法培育该品种花苗,为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图,记综合评分为80及以上的花苗为优质花苗. (1)求图中a的值,并求综合评分的中位数;(2)填写下面的列联表,并根据小概率值的独立性检验,分析优质花苗与培育方法是否有关,请说明理由.优质花苗 非优质花苗 合计甲培育法 20乙培育法 10合计附:,其中.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828B能力提升15.(2024上·河北唐山·高三统考期末)目前,国际上常用身体质量指数(Body Mass Index,缩写BMI)来测量人体胖瘦程度以及是否健康,其计算公式是.中国成人的BMI数值标如下表所示:BMI <18.5 ≥28体重情况 过轻 正常 超重 肥胖为了解某单位职工的身体情况,研究人员从单位职工体检数据中,采用分层随机抽样方法抽取了90名男职工、50名女职工的身高和体重数据,计算得到他们的BMI值,并进行分类统计,如右表所示:性别 BMI 合计过轻 正常 超重 肥胖男 10 60 11 9 90女 15 25 5 5 50合计 25 85 16 14 140(1)参照附表,对小概率值a逐一进行独立性检验,依据检验,指出能认为职工体重是否正常与性别有关联的a的一个值;(2)在该单位随机抽取一位职工的BMI值,发现其BMI值不低于28.由上表可知男女职工的肥胖率都为0.1,视频率为概率,能否认为该职工的性别是男还是女的可能性相同?若认为相同则说明理由,若认为不相同,则需要比较可能性的大小.a 0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828附:16.(2024上·广东汕头·高三统考期末)《国家学生体质健康标准》是我国对学生体质健康方面的基本要求,是综合评价学生综合素质的重要依据.为促进学生积极参加体育锻炼,养成良好的锻炼习惯,提高体质健康水平,某学校从全校学生中随机抽取200名学生进行“是否喜欢体育锻炼”的问卷调查.获得如下信息:①男生所占比例为;②不喜欢体育锻炼的学生所占比例为;③喜欢体育锻炼的男生比喜欢体育锻炼的女生多50人.(1)完成列联表,依据小概率值的独立性检验,分析喜欢体育锻炼与性别是否有关联?性别 体育锻炼 合计喜欢 不喜欢男女合计(2)(ⅰ)从这200名学生中采用按比例分配的分层随机抽样方法抽取20人,再从这20人中随机抽取3人.记事件“至少有2名男生”、“至少有2名喜欢体育锻炼的男生”、“至多有1名喜欢体育锻炼的女生”.请计算和的值.(ⅱ)对于随机事件,,,试分析与的大小关系,并给予证明参考公式及数据:,.0.10 0.05 0.010 0.0012.706 3.841 6.635 10.82821世纪教育网(www.21cnjy.com)第03讲 8.3 列联表与独立性检验(8.3.1分类变量与列联表+8.3.2独立性检验)课程标准 学习目标①了解分类变量与数值变量的区别,了解回归与相关的区别。 ②通过实例,理解通过比较相关比率,利用2×2列联表或等高图可以初步检验两个随机变量的独立性. 理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误。 ③理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误。 本节课要求会通过比较相关比率,判断两个随机变量的独立性. 会对简单的数据分析案例进行初步独立性分析.恰当构造卡方统计量及利用小概率事件原理实现对两个分类变量的是否独立的科学检验.能解决简单的与独立性检验相关的实际问题知识点1:分类变量与列联表(1)分类变量为了方便,会使用一种特殊的随机变量,区别不同的现象或性质,这随机变量称为分类变量.(2)列联表①2×2列联表给出了两个分类变量数据的交叉分类频数.②定义一对分类变量和,我们整理数据如下表所示:合计合计知识点2:独立性检验(1)独立性检验定义:利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”.简称独立性检验.(2)独立性检验公式:其中(注意使用公式时分子的平方不要忽略了)【即学即练1】(2024上·江西九江·高二统考期末)某校随机调查了100名高中生是否喜欢篮球,按照男女区分得到列联表,经计算得.根据独立性检验的相关知识,对照下表,可以认为有( )把握喜欢篮球与性别有关.0.05 0.01 0.005 0.0013.841 6.635 7.879 10.828A. B. C. D.【答案】B【详解】,有把握认为与性别有关,故选:B.题型01通过等高堆积条形图判断两个分类变量是否存在差异【典例1】(2014·吉林长春·统考三模)观察下列各图,其中两个分类变量x,y之间关系最强的是( )A. B.C. D.【答案】D【详解】观察等高条形图发现与相差很大,就判断两个分类变量之量关系最强.故选:D【典例2】(2017·广东佛山·统考一模)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男 女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的( )A.样本中的女生数量多于男生数量B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C.样本中的男生偏爱两理一文D.样本中的女生偏爱两文一理【答案】D【详解】解:由条形图知女生数量多于男生数量,故A正确;有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B正确;男生偏爱两理一文,故C正确;女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D错误.故选:D.【典例3】(2012下·山东青岛·高二山东省青岛第一中学校考期中)为了了解某高校学生喜欢使用手机支付是否与性别有关,抽取了部分学生作为样本,统计后作出如图所示的等高条形图,则下列说法正确的是( )A.喜欢使用手机支付与性别无关B.样本中男生喜欢使用手机支付的约C.样本中女生喜欢使用手机支付的人数比男生多D.女生比男生喜欢使用手机支付的可能性大些【答案】D【详解】A错误,根据等高条形图,喜欢和不喜欢使用手机支付的比例因性别差距很明显,所以喜欢使用手机支付与性别有关;B错误,样本中男生喜欢使用手机支付的约为40%;女生比男生喜欢使用手机支付的可能性大些,由于不知道男女生人数,所以不能认定女生喜欢使用手机支付的人数是否比男生多.所以C错误,D正确.故选:D【变式1】(2021·高二课时练习)在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )A.与 B.与C.与 D.与【答案】C【详解】由等高条形图可知与的值相差越大,|ad-bc|就越大,相关性就越强.故选:C【变式2】(2023·四川达州·统考一模)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是( )A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数C.样本中选择物理学科的人数较多D.样本中男生人数少于女生人数【答案】C【详解】根据等高条形图图1可知样本中选择物理学科的人数较多,故C正确;根据等高条形图图2可知样本中男生人数多于女生人数,故D错误;样本中选择物理学科的人数多于选择历史意愿的人数,而选择物理意愿的男生比例高,选择历史意愿的女生比例低,所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,故A错误;样本中女生选择历史意愿的人数不一定多于男生选择历史意愿的人数,故B错误.故选:C.题型02 独立性检验的概念及辨析【典例1】(2024上·全国·高三专题练习)根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为( )A.变量与不独立,这个结论犯错误的概率不超过B.变量与不独立,这个结论犯错误的概率不超过C.变量与独立,这个结论犯错误的概率不超过D.变量与独立,这个结论犯错误的概率不超过【答案】B【详解】因为时,所以,所以变量与不独立,且这个结论犯错误的概率不超过.故选:B.【典例2】(2024·全国·高三专题练习)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生 女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为( )附:,附表:0.05 0.013.841 6.635A.7 B.8 C.9 D.10【答案】C【详解】根据题意,不妨设,于是,由于依据的独立性检验认为喜欢短视频和性别不独立,根据表格可知,解得,于是最小值为.故选:C【变式1】(2024上·全国·高三专题练习)北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为( )参考公式:,其中.参考数据:A. B. C. D.【答案】C【详解】设男生人数为,则女生人数为,且,可得列联表如下:男生 女生 合计喜欢滑冰不喜欢滑冰合计所以,因为有的把握认为是否喜欢滑冰和性别有关,所以,解得,所以,结合选项只有,故选:C.【变式2】(多选)(2024上·全国·高三期末)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中,由列联表中的数据计算得.参照附表,下列结论正确的是( )附表:A.根据小概率值的独立性检验,分析认为“药物有效”B.根据小概率值的独立性检验,分析认为“药物无效”C.根据小概率值的独立性检验,分析认为“药物有效”D.根据小概率值的独立性检验,分析认为“药物无效”【答案】BC【【详解】因为,所以,所以根据小概率值的独立性检验,分析认为“药物无效”;根据小概率值的独立性检验,分析认为“药物有效”;故选:BC.题型03卡方的计算【典例1】(2024上·湖南长沙·高三湖南师大附中校考阶段练习)为检验预防某种疾病的两种疫苗的免疫效果,随机抽取接种疫苗的志愿者各100名,化验其血液中某项医学指标(该医学指标范围为,统计如下:该项医学指标接种疫苗人数 10 50接种疫苗人数 30 40个别数据模糊不清,用含字母的代数式表示.(1)为检验该项医学指标在内的是否需要接种加强针,先从医学指标在的志愿者中,按接种疫苗分层抽取8人,再次抽血化验进行判断.从这8人中随机抽取4人调研医学指标低的原因,记这4人中接种疫苗的人数为,求的分布列与数学期望;(2)根据(1)化验研判结果,医学认为该项医学指标低于50,产生抗体较弱,需接种加强针,该项医学指标不低于50,产生抗体较强,不需接种加强针.请先完成下面的列联表,若根据小概率的独立性检验,认为接种疫苗与志愿者产生抗体的强弱有关联,求的最大值.疫苗 抗体 合计抗体弱 抗体强疫苗疫苗合计附:,其中.0.25 0.025 0.0051.323 5.024 7.879【答案】(1)分布列见解析,(2)列联表见解析,2【详解】(1)从医学指标在的志愿者中,按接种疫苗分层抽取8人中,接种疫苗有2人,接种疫苗有6人,由题意可知,可能取值为,,的分布列为:2 3 4则;(2)列联表如下:疫苗 抗体 合计抗体弱 抗体强疫苗 100疫苗 100合计 60 140 200则,由题意可知,,整理得,,解得或,又,则,所以,故的最大值为2.【典例2】(2024·云南楚雄·云南省楚雄彝族自治州民族中学模拟预测)全国“村BA”篮球赛点燃了全民的运动激情,深受广大球迷的喜爱.每支球队都有一个或几个主力队员,现有一支“村BA”球队,其中甲球员是其主力队员,经统计该球队在某个赛季的所有比赛中,甲球员是否上场时该球队的胜负情况如表.甲球员是否上场 球队的胜负情况 合计胜 负上场 40 45未上场 3合计 42(1)完成列联表,并判断依据小概率值的独立性检验,能否认为球队的胜负与甲球员是否上场有关;(2)由于队员的不同,甲球员主打的位置会进行调整,根据以往的数据统计,甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.(i)当甲球员上场参加比赛时,求球队赢球的概率;(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,求甲球员打中锋的概率.(精确到0.01)附:,.0.15 0.10 0.05 0.025 0.010 0.0012.072 2.706 3.841 5.024 6.635 10.828【答案】(1)列联表见解析;有99%的把握认为球队的胜负与甲球员是否上场有关.(2)(i);(ii)【详解】(1)解:根据题意,可得的列联表:甲球员是否上场 球队的胜负情况 合计胜 负上场 40 5 45未上场 2 3 5合计 42 8 50零假设:球队的胜负与甲球员是否上场无关此时,所以,有99%的把握认为球队的胜负与甲球员是否上场有关.(2)解:由甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.(i)设事件:甲球员上场打前锋,事件:甲球员上场打中锋,事件:甲球员上场打后卫,事件:球队赢球,则,所以,当甲球员上场参加比赛时,球队赢球的概率:.(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,甲球员打中锋的概率为.【典例3】(2024上·广西北海·高二统考期末)在对人们休闲方式的一次调查中,共调查了120人,其中女性70人,男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.(1)根据以上数据完成以下列联表;休闲方式 性别 看电视 运动 合计女男合计(2)能否有把握认为性别与休闲方式有关系?附:,其中.0.15 0.1 0.05 0.025 0.01 0.0012.072 2.706 3.841 5.024 6.635 10.828【答案】(1)列联表见解析;(2)没有的把握认为性别与休闲方式有关.【详解】(1)休闲方式 性别 看电视 运动 合计女 40 30 70男 20 30 50合计 60 60 120(2)易知,由卡方公式可知:,故没有的把握认为性别与休闲方式有关.【变式1】(2024上·四川成都·高三成都七中校考期末)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):被某病毒感染 未被某病毒感染 合计注射疫苗 10 50未注射疫苗 30 50合计 30 1000.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果” ( )附:,.A.0.001 B.0.05 C.0.01 D.0.005【答案】B【详解】完善列联表如下:被某病毒感染 未被某病毒感染 合计注射疫苗 10 40 50未注射疫苗 20 30 50合计 30 70 100假设:“给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果”.因为:,而,所以根据小概率值的独立性检验,推断不成立.即认为“给基因编辑小鼠注射该疫苗能起到预防该病毒感染的效果”.故选:B【变式2】(2024上·江西鹰潭·高二统考期末)积化和差的重要应用在于求解傅里叶级数.为了解学生掌握该组公式的情况,在高一 高三两个年级中随机抽取了100名学生进行考查,其中高三年级的学生占,其他相关数据如下表:合格 不合格 总计高三年级学生 54高一年级学生 16总计 100(1)请完成2×2列联表,依据小概率值1的独立性检验,分析“对公式的掌握情况”与“学生所在年级”是否有关?(2)以频率估计概率,从该校高一年级学生中抽取3名学生,记合格的人数为X,求X的分布列和数学期望.附表及公式:0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828其中【答案】(1)填表见解析;认为“对公式的掌握情况”与“学生所在年级”有关;(2)分布列见解析;期望为.【详解】(1)由100名学生中高三年级的学生占,可知高三年级的学生有60人,高一年级的学生有40人.补充完整的列联表,如下:合格 不合格 合计高三年级的学生 54 6 60高一年级的学生 24 16 40合计 78 22 100提出零假设:“对公式的掌握情况”与“学生所在年级”无关.根据列联表中的数据,得.根据小概率值的独立性检验,我们推断H 不成立,即认为“对公式的掌握情况”与“学生所在年级”有关,此推断犯错误的概率不大于0.001.(2)由(1)得,高一年级的学生对公式的掌握情况合格的频率为.依题意,得则,,,.所以的分布列为0 1 2 3.【变式3】(2024上·福建泉州·高三统考期末)教育部印发的《国家学生体质健康标准》,要求学校每学年开展全校学生的体质健康测试工作.某中学为提高学生的体质健康水平,组织了“坐位体前屈”专项训练.现随机抽取高一男生和高二男生共60人进行“坐位体前屈”专项测试.高一男生成绩的频率分布直方图如图所示,其中成绩在的男生有4人.高二男生成绩(单位:)如下:10.2 12.8 6.4 6.6 14.3 8.3 16.8 15.9 9.7 17.518.6 18.3 19.4 23.0 19.7 20.5 24.9 20.5 25.1 17.5(1)估计高一男生成绩的平均数和高二男生成绩的第40百分位数;(2)《国家学生体质健康标准》规定,高一男生“坐位体前屈”成绩良好等级线为,高二男生为.已知该校高一年男生有600人,高二年男生有500人,完成下列列联表,依据小概率值的独立性检验,能否认为该校男生“坐位体前屈”成绩优良等级与年级有关?等级 年级 良好及以上 良好以下 合计高一高二合计附:,其中.0.05 0.010 0.005 0.0013.841 6.635 7.879 10.828【答案】(1)15,16.35(2)详见解析【详解】(1)依题意得,抽取高二男生20人,所以抽取高一男生40人.因为高一男生成绩在[5,10)的男生有4人,所以,解得.由,解得.由样本估计总体,可估计高一男生成绩的平均数.由,可知样本数据的第40百分位数是第8项和第9项数据的均值,高二男生“坐位体前屈”成绩在[5,15)有7人,[15,20) 有8人,所以第40百分位数在[15,20)中,故.由样本估计总体,可估计高二男生成绩的第40百分位数为 16.35.(2)根据样本,知高一男生成绩良好及以上占,良好以下占,高二男生成绩良好及以上占,良好以下占,由样本估计总体,可得列联表如下:良好及以上 良好以下 合计高一 300 300 600高二 300 200 500合计 600 500 1100零假设为:该校男生“坐位体前屈”成绩等级与年级之间无关.根据列联表中的数据,得根据小概率值的独立性检验,我们推断不成立,即认为“坐位体前屈”成绩等级与年级有关,此推断犯错误的概率不大于.题型04独立性检验的基本思想【典例1】(2024·四川绵阳·绵阳南山中学实验学校校考模拟预测)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):被某病毒感染 未被某病毒感染 合计注射疫苗 10 50未注射疫苗 30 50合计 30 100计算可知,根据小概率值α=________的独立性检验,分析 “给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”( )附:,n=a+b+c+d.α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828A.0.001 B.0.05C.0.01 D.0.005【答案】B【详解】完善2×2列联表如下:被某病毒感染 未被某病毒感染 合计注射疫苗 10 40 50未注射疫苗 20 30 50合计 30 70 100零假设为H0:“给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果”.因为χ2=,所以根据小概率值的独立性检验,推断H0不成立,即认为“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”.故选:B.【典例2】(2024上·全国·高三专题练习)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对学生体育锻炼的经常性有影响,为此随机抽取了40名学生,按照性别和体育锻炼情况整理得到如下的列联表:性别 锻炼 合计不经常 经常女生 5 10 15男生 5 20 25合计 10 30 40(1)根据上表数据,依据小概率值的独立性检验,能否认为性别因素会影响学生体育锻炼的经常性?(2)如果将表中的数据都扩大为原来的倍,在相同的检验标准下,得到与(1)中不一样的结论.(i)求的最小值;(ii)如果抽样方式不变,你认为(1)和(2)的结论哪个更可靠,并说明理由.附:,其中0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828【答案】(1)根据的独立性检验,没有充分证据推断不成立,因此认为成立,即学生体育锻炼的经常性与学生性别没有关系(2)(i)的最小值为8,(ii)在抽样方式不变的情况下,(2)中的结论更可靠,理由见解析【详解】(1):学生体育锻炼的经常性与学生性别没有关系.根据的独立性检验,没有充分证据推断不成立,因此认为成立,即学生体育锻炼的经常性与学生性别没有关系.(2)(i)当表中的数据都扩大为原来的倍时,根据的独立性检验,若推断不成立,即在犯错误的概率不超过0.01的前提下认为学生体育锻炼的经常性与学生性别有关系.则有:,解得,又,故的最小值为8.(ii)在抽样方式不变的情况下,(2)中的结论更可靠.这是因为对于随机样本而言,频率具有随机性,我们的推断可能犯错误,样本容量越小,犯错误的可能性会越大,因此在抽样方式不变的前提下,样本容量大的结果更可靠.【变式1】(多选)(2024上·安徽·高三合肥市第八中学校联考开学考试)电影《八角笼中》是由王宝强导演并参演的一部电影,讲述了年轻人为理想而努力奋斗的故事. 该电影一上映就引起了广大观众的热议,票房也超出了预期,现随机抽取若干名观众进行调查,所得数据统计如下表所示,则( )喜欢该电影 不喜欢该电影男性观众 160 40女性观众 140 60附:.0. 10 0. 05 0. 01 0. 0012. 706 3. 841 6. 635 10. 828A.若在被调查的观众中随机抽取1人,则抽到喜欢该电影的男性观众的概率为B.在被调查的观众中,男性不喜欢该电影的比例高于女性C.根据小概率值的独立性检验,可以认为被调查观众的性别与对电影的喜爱程度有差异D.根据小概率值的独立性检验,可以认为被调查观众的性别与对电影的喜爱程度有差异【答案】AC【详解】根据题意,喜欢该电影的男性观众有160人,可得,所以A正确;由男性不喜欢该电影的比例为,女性不喜欢该电影的比例为,可得,所以B错误;由,因为,所以C正确,D错误.故选:AC.【变式2】(2024上·全国·高三专题练习)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:跳绳 性别 合计男 女爱好 40 20 60不爱好 20 30 50合计 60 50 110已知,0.05 0.01 0.0013.841 6.635 10.828则以下结论正确的是( )A.根据小概率值的独立性检验,爱好跳绳与性别无关B.根据小概率值的独立性检验,爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001C.根据小概率值的独立性检验,有99%以上的把握认为“爱好跳绳与性别无关”D.根据小概率值的独立性检验,在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别无关”【答案】A【详解】由题知因为,所以爱好跳绳与性别无关且这个结论犯错误的概率超过0.001,故A正确,B错误,又因为,所以有99%以上的把握认为“爱好跳绳与性别有关,或在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别有关.故C和D错误.故选:A.题型05独立性检验解决实际问题【典例1】(2024·湖南长沙·统考一模)某厂为了考察设备更新后的产品优质率,质检部门根据有放回简单随机抽样得到的样本测试数据,制作了如下列联表:产品 优质品 非优质品更新前 24 16更新后 48 12(1)依据小概率值的独立性检验,分析设备更新后能否提高产品优质率?(2)如果以这次测试中设备更新后的优质品频率作为更新后产品的优质率.质检部门再次从设备更新后的生产线中抽出5件产品进行核查,核查方案为:若这5件产品中至少有3件是优质品,则认为设备更新成功,提高了优质率;否则认为设备更新失败.①求经核查认定设备更新失败的概率;②根据的大小解释核查方案是否合理.附:0.050 0.010 0.0013.841 6.635 10.828【答案】(1)可以认为设备更新后能够提高产品优质率(2)①0.05792;②合理【详解】(1)零假设为:设备更新与产品的优质率独立,即设备更新前与更新后的产品优质率没有差异.由列联表可计算,依据小概率值的独立性检验,我们可以推断不成立,因此可以认为设备更新后能够提高产品优质率.(2)根据题意,设备更新后的优质率为0.8.可以认为从生产线中抽出的5件产品是否优质是相互独立的.①设表示这5件产品中优质品的件数,则,可得②实际上设备更新后提高了优质率.当这5件产品中的优质品件数不超过2件时,认为更新失败,此时作出了错误的判断,由于作出错误判断的概率很小,则核查方案是合理的.【典例2】(2024上·吉林·高二长春市第二实验中学校联考期末)李连贵熏肉大饼是吉林省四平市极具传统特色的美味小吃,有着悠久的历史,创始于1908年,距今已经有着一百多年的历史了.李连贵熏肉大饼的制作方法十分考究,选用猪肉和面粉为主要原料,将猪肉制作成熏肉,在加上公丁香,肉 ,沙仁等几十种配料謷煮,最后加入调料抹在饼内,夹肉而食,吃起来外酥里软,美味可口,是一道集美味和药膳于一体的美味佳肴,很多外地游客慕名前往四平品尝.某调查机构从年龄在岁的游客中随机抽取100人,对是否有意向购买熏肉大饼进行调查,结果如下表:年龄/岁抽取人数有意向购买熏肉大饼的人数(1)若以年龄40岁为分界线,由以上统计数据完成下面的列联表,并依据小概率值的独立性检验,能否认为购买熏肉大饼与人的年龄有关 年龄低于岁的人数 年龄不低于岁的人数 总计有意向购买熏肉大饼的人数无意向购买熏肉大饼的人数总计(2)用样本估计总体,用频率估计概率,从年龄在的所有游客中随机抽取3人,设这3人中打算购买熏肉大饼的人数为,求的分布列和数学期望.【参考数据及公式】,其中.【答案】(1)列联表见解析,购买熏肉大饼与人的年龄有关(2)分布列见解析,【详解】(1)列联表如下:年龄低于 岁的人数 年龄不低于 岁的人数 总计有意向购买熏肉大饼的人数无意向购买熏肉大饼的人数总计零假设为购买熏肉大饼与人的年龄无关.根据表中数据计算得:,所以依据小概率值的独立性检验,我们推断不成立,即购买熏肉大饼与人的年龄有关,该推断犯错误的概率不超过.(2)由已知得,,,,,,.所以随机变量的分布列为:所以.【变式1】(2024上·甘肃·高三统考阶段练习)第18届亚洲杯将于2024年1月12日在卡塔尔举行,该比赛预计会吸引亿万球迷观看.为了了解某校大学生喜爱观看足球比赛是否与性别有关,该大学记者站随机抽取了100名学生进行统计,其中女生喜爱观看足球比赛的占女生人数的,男生有10人表示不喜欢看足球比赛.(1)完成下面列联表,试根据小概率值的独立性检验,判断能否认为喜爱观看足球比赛与性别有关联?男 女 合计喜爱看足球比赛不喜爱看足球比赛合计 60(2)在不喜爱观看足球比赛的观众中,按性别用分层随机抽样的方式抽取8人,再从这8人中随机抽取2人参加校记者站的访谈节目,设抽到的男生人数为,求的分布列和期望.附:,其中.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828【答案】(1)列联表见解析,认为喜爱观看足球比赛与性别有关联.(2)分布列见解析,【详解】(1)根据表格数据可知抽取的女生共40人,喜欢观看足球比赛的女生为人,可得得列联表如下:男 女 合计喜爱看足球比赛 50 10 60不喜爱看足球比赛 10 30 40合计 60 40 100根据列联表中的数据计算得,根据小概率值的独立性检验,即认为喜爱观看足球比赛与性别有关联.(2)按照分层随机抽样的方式抽取8人,根据抽样比可知其中男生2人,女生6人,则的可能取值为,,,所以的分布列为0 1 2期望值.【变式2】(2024上·广东·高三统考期末)学校为了让学生的学习与活动两不误,在延时课开设篮球、书法两项活动,为了了解学生的选择意向,随机调查了部分同学,得到如下列联表.性别 选择篮球 选择书法男生 40 10女生 25 25(1)根据上表,分别估计该校男、女生选择篮球的概率;(2)试根据小概率值的独立性检验,分析性别与选择意向是否有关联.附:,其中.0.05 0.025 0.01 0.005 0.0013.841 5.024 6.635 7.879 10.828【答案】(1);;(2)性别与选择意向有关联.【详解】(1)以频率估计概率,所以该校男生选择篮球的概率为,所以该校女生选择篮球的概率为.(2)结合题意:,整理计算得:,故能在犯错误的概率不超过0.01的条件下认为性别与选择意向有关.A夯实基础 B能力提升A夯实基础一、单选题1.(2024下·全国·高二随堂练习)下列关于独立性检验的说法正确的是( )A.独立性检验是对两个变量是否具有线性相关关系的一种检验B.独立性检验可以确定两个变量之间是否具有某种关系C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大【答案】D【分析】根据独立性检验的意义分别判断各选项.【详解】对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,并非检验二者是否是线性相关,故错误;对于B,独立性检验并不能确定两个变量相关,故错误;对于C,是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,故错误;对于D,根据卡方计算的定义可知该选项正确;故选:D.2.(2024下·全国·高二随堂练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:每年体检 每年未体检 合计老年人 7年轻人 6合计 50已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )A. B.C. D.【答案】D【分析】已知抽取的老年人、年轻人各有25名,计算各个变量的值,进而得到答案.【详解】因为,,,,,,所以,,,,.故选:D.3.(2024下·全国·高二随堂练习)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )A. B. C. D. 【答案】B【分析】根据题意,由等高条形图的意义分析可得答案.【详解】根据题意,在等高的条形图中,当,所占比例相差越大时,越有把握认为两个分类变量,之间有关系,由选项可得:B选项中,,所占比例相差无几,所以最有把握认为两个分类变量,之间没有关系,故选:B4.(2024下·全国·高二随堂练习)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了地区A的100天日落和夜晚天气,得到如下2×2列联表(单位:天),并计算得到,下列小波对地区A天气的判断不正确的是( )日落云里走 夜晚天气 下雨 未下雨出现 25 5未出现 25 45参考公式:临界值参照表:0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828A.夜晚下雨的概率约为B.未出现“日落云里走”,夜晚下雨的概率约为C.据小概率值的独立性检验,认为“日落云里走”是否出现与夜晚天气有关D.出现“日落云里走”, 据小概率值的独立性检验,可以认为夜晚会下雨【答案】D【分析】应用古典概型的概率求法求概率判断A、B,应用卡方计算公式求卡方值,与临界值比较,应用独立检验的基本思想得到结论,判断C、D.【详解】由列联表知:100天中有50天下雨,50天未下雨,因此夜晚下雨的概率约为,A正确;未出现“日落云里走”,夜晚下雨的概率约为,B正确;,因此据小概率值的独立性检验,认为“日落云里走”是否出现与夜晚天气有关,C正确,D错误.故选:D5.(2024上·全国·高三专题练习)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:优秀 非优秀 总计甲班乙班总计 105已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.列联表中c的值为20,b的值为50D.由列联表可看出成绩与班级有关系【答案】D【分析】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.【详解】依题意,解得,由解得.补全列联表如下:优秀 非优秀 总计甲班乙班总计 105甲班的优秀率为,乙班的优秀率为,,所以成绩与班级有关.所以D选项正确,ABC选项错误.故选:D6.(2024上·全国·高三专题练习)假设有两个变量x与y的列联表如下表:a bc d对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )A.,,, B.,,,C.,,, D.,,,【答案】B【分析】计算每个选项中的值,最大的即对同一样本能说明x与y有关系的可能性最大.【详解】对于A, ,对于B,,对于C,,对于D,显然B中最大,该组数据能说明x与y有关系的可能性最大,故选:B.7.(2024·全国·高三专题练习)在新高考改革中,浙江省新高考实行的是7选3的模式,即语数外三门为必考科目,然后从物理、化学、生物、政治、历史、地理、技术(含信息技术和通用技术)7门课中选考3门.某校高二学生选课情况如下列联表一和列联表二(单位:人)选物理 不选物理 总计男生 340 110 450女生 140 210 350总计 480 320 800表一选生物 不选生物 总计男生 150 300 450女生 150 200 350总计 300 500 800表二试根据小概率值的独立性检验,分析物理和生物选课与性别是否有关( )附:A.选物理与性别有关,选生物与性别有关B.选物理与性别无关,选生物与性别有关C.选物理与性别有关,选生物与性别无关D.选物理与性别无关,选生物与性别无关【答案】C【分析】结合题干数据,以及公式,分别计算物理和生物学科的值,与比较,分析即得解【详解】由题意,先分析物理课是否与性别有关:根据表格数据,结合题干表格数据,,因此,有充分证据推断选择物理学科与性别有关再分析生物课是否与性别有关:根据表格数据,结合题干表格数据,,因此,没有充分证据推断选择生物学科与性别有关故选:C8.(2024·全国·高三专题练习)在一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下2×2列联表:优秀 非优秀 合计甲班人数 50乙班人数 20合计 30 110附:,其中.根据独立性检验,可以认为数学考试成绩与班级有关系的把握为( )A. B. C. D.【答案】D【分析】先完成列联表,再计算,与临界值进行比较,最后下结论【详解】优秀 非优秀 合计甲班人数 50乙班人数 20合计 30 110由题表中的数据可得: ,因为,所以可以认为数学考试成绩与班级有失系的把握为.故选:D二、多选题9.(2024上·山西运城·高三校考期末)某校有在校学生900人,其中男生400人,女生500人,为了解该校学生对学校课后延时服务的满意度,随机调查了40名男生和50名女生.每位被调查的学生都对学校的课后延时服务给出了满意或不满意的评价,统计过程中发现随机从这90人中抽取一人,此人评价为满意的概率为.在制定列联表时,由于某些因素缺失了部分数据,而获得如下列联表,下列结论正确的是( )满意 不满意 合计男 10女合计 90参考公式与临界值表,其中.0.100 0.050 0.025 0.010 0.0012.706 3.841 5.024 6.635 10.828A.满意度的调查过程采用了分层抽样的抽样方法B.50名女生中对课后延时服务满意的人数为20C.的观测值为9D.根据小概率的独立性检验,不可以认为“对课后延时服务的满意度与性别有关系”【答案】AD【分析】根据题意计算男女比例,即可判断A选项;计算满意的总人数人数,根据男生满意人数即可得女生满意人数判断B选项;由列联表中数据计算的值即可判断C、D选项.【详解】A选项,因为在校学生中有400名男生,500名女生,随机调查了40名男生和50名女生,男女比例始终是4:5,所以采用了分层抽样的方法,故A正确;B选项,调查的90人中,对学校课后延时服务满意的人数为,其中男生满意的人数为,所以女生满意的人数为30,女生不满意的人数为20,故B错误;C选项,由B选项的分析,补全列联表如下:满意 不满意 合计男 30 10 40女 30 20 50合计 60 30 90由列联表可得,故C错误;D选项,:对课后延时服务的满意度与性别无关,由,根据小概率的独立性检验,没有充足的证据推断不成立,即不能认为“对课后延时服务的满意度与性别有关系”,故D正确.故选:AD.10.(2024上·贵州·高三统考开学考试)某学校高三年级于2023年5月初进行了一次高三数学备考前测考试.按照分数大于或等于120的同学评价为“优秀生”,其它分数的同学评价为“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽取1人,成绩优秀的概率为,根据表(2)的数据可断定下列说法正确的是( )班级 战绩 合计优秀生 潜力生甲班 10 b乙班 c 30合计 105表(1)0.05 0.01 0.0013.841 6.635 10.828表(2)A.列联表中c的值为30,b的值为35B.列联表中c的值为20,b的值为45C.根据列联表中的数据,有95%的把握认为成绩与班级有关D.根据列联表中的数据,没有95%的把握认为成绩与班级有关【答案】BC【分析】根据题目条件计算判断AB,再由卡方的计算判断CD.【详解】因为在这105人中随机抽取1人,成绩优秀的概率为,所以“优秀生”的人数为,“潜力生”的人数为,所以,,故A错B对;因为,所以有95%的把握认为成绩与班级有关,故C对D错.故选:BC.三、填空题11.(2024下·全国·高二随堂练习)为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:药物 疾病 合计未患病 患病服用 a 50未服用 50合计 80 20 100若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为 .(其中且)(参考数据:,)附:,α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828【答案】46【分析】根据公式列不等式求解.【详解】由题意可得,整理得,所以或,解得或,又因为且,所以,所以a的最小值为46.故答案为:46.12.(2024下·全国·高二随堂练习)2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:了解 不了解 总计年龄不小于60岁 a b a+b年龄小于60岁 c d c+d总计 a+c b+d a+b+c+d给出下列4组数据:① ;② ;③ ;④ .则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是 .(填序号)【答案】③【分析】根据当的值越大时,居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性越大,计算每组的值,比较大小可得答案。【详解】当的值越大时,居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性越大,在①中,,在②中,,在③中,,在④中,,故居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是③,故答案为:③四、解答题13.(2024上·河南焦作·高二统考期末)近年来,直播带货逐渐兴起,成为乡村振兴的新动力,为了解甲 乙两个推销农产品的直播间的销售情况,统计了两个直播间一段时间内观众下单的相关数据,得到如下的表格:下单的观众数 未下单的观众数甲直播间 120 80乙直播间 60 80(1)分别估计甲 乙直播间的观众下单的概率;(2)是否有的把握认为两个直播间观众的下单意愿有差异?附.0.05 0.01 0.0013.841 6.635 10.828【答案】(1)甲乙直播间观众下单概率分别为,;(2)有的把握认为两个直播间观众的下单意愿有差异.【分析】(1)根据表格中的数据,结合古典概型的概率计算公式,即可求解;(2)根据题意,得出的列联表,求得,结合附表,即可得到结论.【详解】(1)解:根据表格中的数据得,估计甲直播间观众下单的概率为,估计乙直播间观众下单的概率为.(2)解:根据题意,得到的列联表:下单的观众数 未下单的观众数 合计甲直播间 120 80 200乙直播间 60 80 140合计 180 160 340可得,因为,所以有的把握认为两个直播间观众的下单意愿有差异.14.(2024上·山东日照·高三山东省五莲县第一中学校考期末)某花圃为提高某品种花苗质量,开展技术创新活动,A,B在实验地分别用甲、乙方法培育该品种花苗,为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图,记综合评分为80及以上的花苗为优质花苗. (1)求图中a的值,并求综合评分的中位数;(2)填写下面的列联表,并根据小概率值的独立性检验,分析优质花苗与培育方法是否有关,请说明理由.优质花苗 非优质花苗 合计甲培育法 20乙培育法 10合计附:,其中.0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828【答案】(1),82.5(2)表格见解析,有关【分析】(1)根据题意,由频率分布直方图的性质可得,再由中位数的计算公式,代入计算,即可得到结果;(2)根据题意,由的计算公式,代入计算,即可得到结果.【详解】(1)由直方图的性质可知,,解得,因为,所以中位数位于内,设中位数为,则有,解得.故综合评分的中位数为82.5.(2)由(1)得优质花苗的频率为0.6,所以样本中优质花苗的数量为60,得如下列联表:优质花苗 非优质花苗 合计甲培育法 20 30 50乙培育法 40 10 50合计 60 40 100零假设为:优质花苗与培育方法无关,,所以根据小概率值的独立性检验,推断不成立,即认为优质花苗与培育方法有关.B能力提升15.(2024上·河北唐山·高三统考期末)目前,国际上常用身体质量指数(Body Mass Index,缩写BMI)来测量人体胖瘦程度以及是否健康,其计算公式是.中国成人的BMI数值标如下表所示:BMI <18.5 ≥28体重情况 过轻 正常 超重 肥胖为了解某单位职工的身体情况,研究人员从单位职工体检数据中,采用分层随机抽样方法抽取了90名男职工、50名女职工的身高和体重数据,计算得到他们的BMI值,并进行分类统计,如右表所示:性别 BMI 合计过轻 正常 超重 肥胖男 10 60 11 9 90女 15 25 5 5 50合计 25 85 16 14 140(1)参照附表,对小概率值a逐一进行独立性检验,依据检验,指出能认为职工体重是否正常与性别有关联的a的一个值;(2)在该单位随机抽取一位职工的BMI值,发现其BMI值不低于28.由上表可知男女职工的肥胖率都为0.1,视频率为概率,能否认为该职工的性别是男还是女的可能性相同?若认为相同则说明理由,若认为不相同,则需要比较可能性的大小.a 0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828附:【答案】(1)0.1(2)不能;是男性的可能性大于女性【分析】(1)列出体重是否正常与性别的关系的列联表,根据列联表计算出卡方,结合附表即可判断;(2)分别计算出该职工的性别是男还是女的概率即可得.【详解】(1)由表可得到与体重是否正常与性别之间的列联表:正常 不正常 合计男 60 30 90女 25 25 50合计 85 55 140则,由,故能认为职工体重是否正常与性别有关联的a的值为0.1;(2)设事件为“抽到的员工为男员工”、设事件为“抽到的员工BMI值不低于28”,则,,即不能认为该职工的性别是男还是女的可能性相同,且是男性的可能性大于女性.16.(2024上·广东汕头·高三统考期末)《国家学生体质健康标准》是我国对学生体质健康方面的基本要求,是综合评价学生综合素质的重要依据.为促进学生积极参加体育锻炼,养成良好的锻炼习惯,提高体质健康水平,某学校从全校学生中随机抽取200名学生进行“是否喜欢体育锻炼”的问卷调查.获得如下信息:①男生所占比例为;②不喜欢体育锻炼的学生所占比例为;③喜欢体育锻炼的男生比喜欢体育锻炼的女生多50人.(1)完成列联表,依据小概率值的独立性检验,分析喜欢体育锻炼与性别是否有关联?性别 体育锻炼 合计喜欢 不喜欢男女合计(2)(ⅰ)从这200名学生中采用按比例分配的分层随机抽样方法抽取20人,再从这20人中随机抽取3人.记事件“至少有2名男生”、“至少有2名喜欢体育锻炼的男生”、“至多有1名喜欢体育锻炼的女生”.请计算和的值.(ⅱ)对于随机事件,,,试分析与的大小关系,并给予证明参考公式及数据:,.0.10 0.05 0.010 0.0012.706 3.841 6.635 10.828【答案】(1)列联表见解析;有关联(2)(ⅰ),;(ii),证明见解析【分析】(1)依题意完善列联表,求得,从而利用独立性检验即可得解;(2)(i)分析分层抽样所得的样本情况,再分析事件与的意义,利用组合数结合古典概型的概率公式即可得解;;(ii)利用条件概率公式即可得证明.【详解】(1)因为男生所占比例为,所以男生有人,因为不喜欢体育锻炼的学生所占比例为,所以不喜欢体育锻炼的学生有人,则喜欢体育锻炼的学生有人,又喜欢体育锻炼的男生比喜欢体育锻炼的女生多50人,所以喜欢体育锻炼的男生有80人,喜欢体育锻炼的女生有30人,所以列联表如下:性别 体育锻炼 合计喜欢 不喜欢男 80 40 120女 30 50 80合计 110 90 200假设:是否喜欢体育锻炼与性别无关联.根据表中数据,计算得到,依据小概率值的独立性检验,我们推断不成立.即认为是否喜欢体育锻炼与性别有关联.(2)(ⅰ)依题意,随机抽取的20名学生中,喜欢体育锻炼的男生有人,不喜欢体育锻炼的男生有人,喜欢体育锻炼的女生有人,不喜欢体育锻炼的女生有人,事件表示:“在至少有2名男生的条件下,至少有2名男生喜欢体育锻炼”,事件表示:“2男生1女生都喜欢体育锻炼”和“3男生中至少两人喜欢体育锻炼”,所以,;(ⅰⅰ)对于随机事件,,,有,证明如下:.21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源预览