资源简介 (共66张PPT)§3 独立性检验问题 第七章 统计案例学习目标1.通过实例,理解2×2列联表的统计意义,培养数学抽象的 核心素养.2.理解判断两个变量是否有关联的方法.3.了解随机变量χ2的意义.4.通过实例,了解独立性检验及其应用,提升数据分析、数 学运算的核心素养.任务一 独立性检验的概念问题导思问题1.为了调查吸烟与患肺癌是否有关系,某机构随机调查了6 578人,得到如表所示的数据(单位:人):吸烟情况 患肺癌情况患肺癌 未患肺癌吸烟 56 1 932不吸烟 23 4 567我们应研究此表中的哪些量呢?提示:需要考虑两个变量:是否吸烟,是否患肺癌;每个变量应取两个值:吸烟、不吸烟,患肺癌、未患肺癌.新知构建1.2×2列联表一般地,假设有两个分类变量A和B,它们的取值分别为{A1,A2}和{B1,B2},其样本频数列联表(称为2×2列联表)为:A BB1 B2 总计A1 a b ______A2 c d ______总计 ______ ______ a+b+c+da+bc+da+cb+d2.独立性检验根据2×2列联表中的数据来判断两变量是否有关系或是否独立的问题,称为2×2列联表的独立性检验.在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,试作出性别与色盲的列联表.解:根据题目所给的数据作出如下的列联表.典例1性别 患色盲情况患色盲 不患色盲 总计男 38 442 480女 6 514 520总计 44 956 1 000规律方法制作2×2列联表的基本步骤第一步,合理选取两个变量,且每一个变量都可以取两个值;第二步,抽取样本,整理数据;第三步,作出2×2列联表.注意:(1)作2×2列联表时,注意应该是4行4列,计算时要准确无误.(2)作2×2列联表时,关键是对涉及的变量分清类别.对点练1.(双空题)为了解性别因素是否对某班学生爱运动有影响,对该班50名学生进行了问卷调查,得到如下的2×2列联表: 爱运动 不爱运动 合计男生 m 12 30女生 8 20合计 n 50则m= ,n= .1824由题意可得列联表如下:故m=18,n=24. 爱运动 不爱运动 合计男生 18 12 30女生 8 12 20合计 26 24 50返回任务二 独立性检验的基本思想问题导思问题2.回归分析和独立性检验都是研究两变量之间关系的,是相同的问题,对吗?提示:不对.回归分析是对两个变量之间的相关关系的一种分析,通过回归分析预测和估计两个变量之间具有的相关关系;独立性检验是分析这两个变量在多大程度上具有关系,但不能100%肯定这种关系.问题3.对于已经获取的成对样本观测数据,检验结论“两个变量之间没有关联”的实际含义是什么?提示:“两个变量之间没有关联”的实际含义是“两个变量之间无关系,相互独立”.新知构建a+b+c+d没有充分90%95%99%微思考某学校想了解该校学生对于某项运动的爱好是否与性别有关,通过随机抽查110名学生,由得到的2×2列联表算得:χ2≈7.82.下列结论正确的是附:A.有99.9%的把握认为“爱好该项运动与性别有关”B.有99.9%的把握认为“爱好该项运动与性别无关”C.有99%的把握认为“爱好该项运动与性别无关”D.有99%的把握认为“爱好该项运动与性别有关”典例2P(χ2≥k0) 0.1 0.05 0.01 0.005 0.001k0 2.706 3.841 6.635 7.879 10.828√因为χ2≈7.82>6.635,χ2≈7.82<10.828,所以有99%的把握认为“爱好该项运动与性别有关”.故选D.P(χ2≥k0) 0.1 0.05 0.01 0.005 0.001k0 2.706 3.841 6.635 7.879 10.828规律方法χ2统计量在2×2列联表的独立性检验中判断变量相关联的规则是:当χ2大于某设定临界值,就有相应多大的把握判断两变量有关联;当χ2小于某设定临界值,就没有充分的证据判断两变量有关联,即可以认为两变量是没有关联的.对点练2.有两个变量X与Y,X的取值为X1,X2,Y的取值为Y1,Y2,得到下表:其中a,15-a均为大于5的整数,则当a= 时,有90%的把握认为X与Y之间有关系.YX Y1 Y2X1 a 20-aX2 15-a 30+a8或9 YX Y1 Y2X1 a 20-aX2 15-a 30+a返回任务三 独立性检验的综合应用b 随着新高考改革,高中阶段学生选修分为物理方向和历史方向,为了判断学生选修物理方向和历史方向是否与性别有关,现随机抽取50名学生,得到如下列联表:典例3 物理方向 历史方向 总计男生 13 a 23女生 7 20 27总计 b c 50(1)计算a,b,c的值;解:由13+a=23,得a=10,由a+20=c,得c=10+20=30,由b+c=50,得b=50-30=20.P(χ2≥k0) 0.1 0.05 0.01 0.005 0.001k0 2.706 3.841 6.635 7.879 10.828变式探究(变条件)本例2×2列联表中的数据均变为原来的2倍,是否有99%的把握认为选修物理方向和历史方向与性别有关?解:2×2列联表如下: 物理方向 历史方向 总计男生 26 20 46女生 14 40 54总计 40 60 100规律方法1.独立性检验问题常与统计、概率相结合,解题时一定要认真审题,找出各数据的联系.2.解决独立性检验的应用问题,一定要按照如下独立性检验的步骤得出结论.对点练3.某学校有两个学生食堂,学生在就餐时,一食堂有2种套餐选择,二食堂有4种套餐选择;一食堂距离教学楼相比于二食堂要近很多,经调查发现,100名不同性别的学生在选择食堂就餐时,有如下表格: 男 女在一食堂就餐 40 20在二食堂就餐 15 25P(χ2≥k0) 0.025 0.01 0.005 0.001k0 5.024 6.635 7.879 10.828课堂小结任务再现 1.2×2列联表.2.统计量和独立性检验的基本思想.3.独立性检验的综合应用方法提炼 公式法易错警示 计算出错;计算后不能得出合理的结论返回随堂评价√1.如果有95%的把握判断事件A与B有关系,那么具体计算出的数据A.χ2>3.841 B.χ2<3.841C.χ2>6.635 D.χ2<6.635χ2的值与临界值比较,从而确定A与B有关的可信程度.当χ2>6.635时,有99%的把握判断A与B有关联;当χ2>3.841时,有95%的把握判断A与B有关联;当χ2≤2.706时,没有充分的证据判断A与B有关联.故选A.√2.若变量X和Y的列联表如下:则下列说法正确的是A.ad-bc越小,说明X与Y的相关联程度越弱B.ad-bc越大,说明X与Y的相关联程度越强C.(ad-bc)2越大,说明X与Y的相关联程度越强D.(ad-bc)2越接近于0,说明X与Y的相关联程度越强X YY1 Y2 总计X1 a b a+bX2 c d c+d总计 a+c b+d a+b+c+d X YY1 Y2 总计X1 a b a+bX2 c d c+d总计 a+c b+d a+b+c+d3.下面是两个分类变量的列联表:则表中a,b处的值分别为 .X Yy1 y2 总计x1 a 21 73x2 2 25 27总计 b 46 10052,54根据列联表的特点可以发现:73=21+a,b=a+2,解之得a=52,b=54. 患该疾病 不患该疾病 总计男 15 10 25女 5 20 25总计 20 30 50P(χ2≥k0) 0.05 0.01 0.001k0 3.841 6.635 10.828没有 返回 患该疾病 不患该疾病 总计男 15 10 25女 5 20 25总计 20 30 50课时分层评价√1.如果有不少于99%的把握判断事件A与B有关系,那么具体计算出的数据A.χ2>3.841 B.χ2<3.841C.χ2>6.635 D.χ2<6.635比较χ2的值和临界值的大小,95%的把握则χ2>3.841,χ2>6.635就有99%的把握.故选C.√2.某市对机动车单双号限行进行了调查,在参加调查的2 600名有车人中有1 700名持反对意见,2 500名无车人中有1 400名持反对意见,在运用这些数据说明“拥有车辆”与“反对机动车单双号限行”是否相关时,用下列哪种方法最有说服力A.均值 B.独立性检验C.随机误差 D.频率分布直方图独立性检验是检验两个不同分类的变量是否相关的方法,刚好符合题意,而均值、随机误差、频率分布直方图都不是分析两个不同分类的变量是否相关的方法,故采用独立性检验方法最有说服力.故选B.√3.某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:已知抽取的村民中老年人、年轻人各25人,则对列联表数据的分析错误的是A.a=18 B.b=19C.c+d=50 D.e-f=2 每年体检(人) 每年未体检(人) 合计(人)老年人 a 7 c年轻人 6 b d合计 e f 50因为抽取的村民中,老年人有25人,年轻人有25人,所以c=25,d=25,所以a=25-7=18,b=25-6=19,c+d=50,故A,B,C正确;所以e=a+6=18+6=24,f=7+b=7+19=26,则e-f=24-26=-2,故D错误.故选D. 每年体检(人) 每年未体检(人) 合计(人)老年人 a 7 c年轻人 6 b d合计 e f 50√由已知数据χ2=56.632>6.635,得有99%的把握认为“患肺癌与吸烟有关”,则选项D正确,其余都是错误的.故选D.√YX y1 y2 总计x1 10 18 28x2 m 26 m+26总计 m+10 44 m+54 YX y1 y2 总计x1 10 18 28x2 m 26 m+26总计 m+10 44 m+54√√若a>6.635,则有99%的把握认为变量x与y有关联,变量x与y不独立,若a<6.635,则没有99%的把握认为变量x与y有关联,变量x与y独立.故选AD.7.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是 . .男正教授人数,女正教授人数,男副教授人数,女副教授人数 男性 女性 合计满意 560 540 1 100不满意 40 60 100合计 600 600 1 200P(χ2≥k0) 0.1 0.05 0.01k0 2.706 3.841 6.6354.364有95%的把握认为满意度与性别有关联 男性 女性 合计满意 560 540 1 100不满意 40 60 100合计 600 600 1 200是否高于40岁 是否喜欢利物浦队不喜欢利物浦队 喜欢利物浦队 总计高于40岁 p q 50不高于40岁 15 35 50总计 a b 10095% 是否高于40岁 是否喜欢利物浦队不喜欢利物浦队 喜欢利物浦队 总计高于40岁 p q 50不高于40岁 15 35 50总计 a b 100 一级品 二级品 合计甲机床 150 50 200乙机床 120 80 200合计 270 130 400P(χ2≥k0) 0.1 0.05 0.01 0.005 0.001K0 2.706 3.841 6.635 7.879 10.828√ 支持 不支持男生 70-m 10+m女生 50+m 30-mP(χ2≥k0) 0.1 0.05 0.01 0.005 0.001k0 2.706 3.841 6.635 7.879 10.828 支持 不支持男生 70-m 10+m女生 50+m 30-m√√ 免疫 不免疫 合计注射疫苗 10 10 20未注射疫苗 6 34 40合计 16 44 60P(χ2≥k0) 0.1 0.05 0.01 0.001k0 2.706 3.841 6.635 10.828 免疫 不免疫 合计注射疫苗 10 10 20未注射疫苗 6 34 40合计 16 44 6012设男性患者有x人,则女性患者有2x人,得2×2列联表如下: A型病 B型病 总计男 x女 2x总计 3x A型病 B型病 总计男 x女 2x总计 3x 男 女 合计网购迷 20 非网购迷 47 合计 P(χ2≥k0) 0.1 0.05 0.01 0.001k0 2.706 3.841 6.635 10.828解:根据频率分布直方图得样本中网购迷的人数为100×(0.03×5+0.04× 5)=35,列联表如下: 男 女 合计网购迷 15 20 35非网购迷 47 18 65合计 62 38 100 患疾病A 不患疾病A 合计过量饮酒 3a b 不过量饮酒 a 2b 合计 400P(χ2≥k0) 0.1 0.05 0.01 0.001k0 2.706 3.841 6.635 10.828√√√ 患疾病A 不患疾病A 合计过量饮酒 30 120 150不过量饮酒 10 240 250合计 40 360 40016.为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为20k(k∈N+),则k= .5或6设男、女学生的总人数为2n,则2n=20k(k∈N+),并把2×2列联表的数据补充完整:是否喜欢网络课程性别 喜欢 不喜欢 合计男生 0.8n 0.2n n女生 0.6n 0.4n n合计 1.4n 0.6n 2n返回§3 独立性检验问题学习目标 1.通过实例,理解2×2列联表的统计意义,培养数学抽象的核心素养. 2.理解判断两个变量是否有关联的方法. 3.了解随机变量χ2的意义. 4.通过实例,了解独立性检验及其应用,提升数据分析、数学运算的核心素养.任务一 独立性检验的概念问题1.为了调查吸烟与患肺癌是否有关系,某机构随机调查了6 578人,得到如表所示的数据(单位:人):吸烟情况 患肺癌情况患肺癌 未患肺癌吸烟 56 1 932不吸烟 23 4 567我们应研究此表中的哪些量呢?提示:需要考虑两个变量:是否吸烟,是否患肺癌;每个变量应取两个值:吸烟、不吸烟,患肺癌、未患肺癌.1.2×2列联表一般地,假设有两个分类变量A和B,它们的取值分别为{A1,A2}和{B1,B2},其样本频数列联表(称为2×2列联表)为:A BB1 B2 总计A1 a b a+bA2 c d c+d总计 a+c b+d a+b+c+d2.独立性检验根据2×2列联表中的数据来判断两变量是否有关系或是否独立的问题,称为2×2列联表的独立性检验.在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,试作出性别与色盲的列联表.解:根据题目所给的数据作出如下的列联表.性别 患色盲情况患色盲 不患色盲 总计男 38 442 480女 6 514 520总计 44 956 1 000制作2×2列联表的基本步骤第一步,合理选取两个变量,且每一个变量都可以取两个值;第二步,抽取样本,整理数据;第三步,作出2×2列联表.注意:(1)作2×2列联表时,注意应该是4行4列,计算时要准确无误.(2)作2×2列联表时,关键是对涉及的变量分清类别.对点练1.(双空题)为了解性别因素是否对某班学生爱运动有影响,对该班50名学生进行了问卷调查,得到如下的2×2列联表:爱运动 不爱运动 合计男生 m 12 30女生 8 20合计 n 50则m= ,n= .答案:18 24解析:由题意可得列联表如下:爱运动 不爱运动 合计男生 18 12 30女生 8 12 20合计 26 24 50故m=18,n=24.任务二 独立性检验的基本思想问题2.回归分析和独立性检验都是研究两变量之间关系的,是相同的问题,对吗?提示:不对.回归分析是对两个变量之间的相关关系的一种分析,通过回归分析预测和估计两个变量之间具有的相关关系;独立性检验是分析这两个变量在多大程度上具有关系,但不能100%肯定这种关系.问题3.对于已经获取的成对样本观测数据,检验结论“两个变量之间没有关联”的实际含义是什么?提示:“两个变量之间没有关联”的实际含义是“两个变量之间无关系,相互独立”.1.χ2的计算公式χ2=,其中n=a+b+c+d.2.利用χ2临界值对变量的独立性进行判断当数据量较大时,在统计中,用以下结果对变量的独立性进行判断.(1)当χ2≤2.706时,没有充分的证据判断变量A,B有关联,可以认为变量A,B是没有关联的;(2)当χ2>2.706时,有90%的把握判断变量A,B有关联;(3)当χ2>3.841时,有95%的把握判断变量A,B有关联;(4)当χ2>6.635时,有99%的把握判断变量A,B有关联.[微思考] 设n=a+b+c+d,用估计P(A1B1),用估计P(A1),用估计P(B1),在什么情况下,A1与B1独立?提示:当=·时,A1与B1独立.某学校想了解该校学生对于某项运动的爱好是否与性别有关,通过随机抽查110名学生,由得到的2×2列联表算得:χ2≈7.82.下列结论正确的是( )附:P(χ2≥k0) 0.1 0.05 0.01 0.005 0.001k0 2.706 3.841 6.635 7.879 10.828A.有99.9%的把握认为“爱好该项运动与性别有关”B.有99.9%的把握认为“爱好该项运动与性别无关”C.有99%的把握认为“爱好该项运动与性别无关”D.有99%的把握认为“爱好该项运动与性别有关”答案:D解析:因为χ2≈7.82>6.635,χ2≈7.82<10.828,所以有99%的把握认为“爱好该项运动与性别有关”.故选D.χ2统计量在2×2列联表的独立性检验中判断变量相关联的规则是:当χ2大于某设定临界值,就有相应多大的把握判断两变量有关联;当χ2小于某设定临界值,就没有充分的证据判断两变量有关联,即可以认为两变量是没有关联的.对点练2.有两个变量X与Y,X的取值为X1,X2,Y的取值为Y1,Y2,得到下表:Y X Y1 Y2X1 a 20-aX2 15-a 30+a其中a,15-a均为大于5的整数,则当a= 时,有90%的把握认为X与Y之间有关系.答案:8或9解析:要有90%的把握认为X与Y之间有关系,则χ2>2.706,即χ2==>2.706.因为a>5且15-a>5,a∈Z,所以a=6,7,8,9,代入不等式验证可知8,9均满足要求.所以当a=8或9时,有90%的把握认为X与Y之间有关系.任务三 独立性检验的综合应用随着新高考改革,高中阶段学生选修分为物理方向和历史方向,为了判断学生选修物理方向和历史方向是否与性别有关,现随机抽取50名学生,得到如下列联表:物理方向 历史方向 总计男生 13 a 23女生 7 20 27总计 b c 50(1)计算a,b,c的值;(2)问是否有99%的把握认为选修物理方向和历史方向与性别有关?附:χ2=,n=a+b+c+d.P(χ2≥k0) 0.1 0.05 0.01 0.005 0.001k0 2.706 3.841 6.635 7.879 10.828解:(1)由13+a=23,得a=10,由a+20=c,得c=10+20=30,由b+c=50,得b=50-30=20.(2)χ2=≈4.844,因为4.844<6.635.故没有99%的把握认为选修物理方向和历史方向与性别有关.[变式探究](变条件)本例2×2列联表中的数据均变为原来的2倍,是否有99%的把握认为选修物理方向和历史方向与性别有关?解:2×2列联表如下:物理方向 历史方向 总计男生 26 20 46女生 14 40 54总计 40 60 100所以χ2=≈9.689,因为9.689>6.635,故有99%的把握认为选修物理方向和历史方向与性别有关.1.独立性检验问题常与统计、概率相结合,解题时一定要认真审题,找出各数据的联系.2.解决独立性检验的应用问题,一定要按照如下独立性检验的步骤得出结论.对点练3.某学校有两个学生食堂,学生在就餐时,一食堂有2种套餐选择,二食堂有4种套餐选择;一食堂距离教学楼相比于二食堂要近很多,经调查发现,100名不同性别的学生在选择食堂就餐时,有如下表格:男 女在一食堂就餐 40 20在二食堂就餐 15 25(1)若学生选择每种套餐的可能性相同,求某天甲、乙两名同学选择同一套餐的概率;(2)能否有99.5%的把握认为性别与选择食堂之间有关系?附:χ2=.P(χ2≥k0) 0.025 0.01 0.005 0.001k0 5.024 6.635 7.879 10.828解:(1)一共有6种套餐,甲和乙各选择一种,共有62=36种方法,甲和乙两名同学选择同一种套餐有6种方法,所以甲、乙两名同学选择同一套餐的概率P==.(2)χ2=≈8.249,因为8.249>7.879,所以有99.5%的把握认为性别与选择食堂之间有关系.任务再现 1.2×2列联表.2.统计量和独立性检验的基本思想.3.独立性检验的综合应用方法提炼 公式法易错警示 计算出错;计算后不能得出合理的结论1.如果有95%的把握判断事件A与B有关系,那么具体计算出的数据( )A.χ2>3.841 B.χ2<3.841C.χ2>6.635 D.χ2<6.635答案:A解析:χ2的值与临界值比较,从而确定A与B有关的可信程度.当χ2>6.635时,有99%的把握判断A与B有关联;当χ2>3.841时,有95%的把握判断A与B有关联;当χ2≤2.706时,没有充分的证据判断A与B有关联.故选A.2.若变量X和Y的列联表如下:X YY1 Y2 总计X1 a b a+bX2 c d c+d总计 a+c b+d a+b+c+d则下列说法正确的是( )A.ad-bc越小,说明X与Y的相关联程度越弱B.ad-bc越大,说明X与Y的相关联程度越强C.(ad-bc)2越大,说明X与Y的相关联程度越强D.(ad-bc)2越接近于0,说明X与Y的相关联程度越强答案:C解析: χ2=,当(ad-bc)2越大时,χ2越大,说明X与Y的相关联程度越强.故选C.3.下面是两个分类变量的列联表:X Yy1 y2 总计x1 a 21 73x2 2 25 27总计 b 46 100则表中a,b处的值分别为 .答案:52,54解析:根据列联表的特点可以发现:73=21+a,b=a+2,解之得a=52,b=54.4.为了解患某疾病是否与性别有关,随机地调查了50人,得到如下的2×2列联表:患该疾病 不患该疾病 总计男 15 10 25女 5 20 25总计 20 30 50则 (填“有”或“没有”)99.9%的把握认为患该疾病与性别有关.参考公式:χ2=,其中n=a+b+c+d.参考数据:P(χ2≥k0) 0.05 0.01 0.001k0 3.841 6.635 10.828答案:没有解析:由题意知,χ2=≈8.333<10.828,所以没有99.9%的把握认为患该疾病与性别有关.课时分层评价49 独立性检验问题(时间:60分钟 满分:100分)(1—9,每小题5分,共45分)1.如果有不少于99%的把握判断事件A与B有关系,那么具体计算出的数据( )A.χ2>3.841 B.χ2<3.841C.χ2>6.635 D.χ2<6.635答案:C解析:比较χ2的值和临界值的大小,95%的把握则χ2>3.841,χ2>6.635就有99%的把握.故选C.2.某市对机动车单双号限行进行了调查,在参加调查的2 600名有车人中有1 700名持反对意见,2 500名无车人中有1 400名持反对意见,在运用这些数据说明“拥有车辆”与“反对机动车单双号限行”是否相关时,用下列哪种方法最有说服力( )A.均值 B.独立性检验C.随机误差 D.频率分布直方图答案:B解析:独立性检验是检验两个不同分类的变量是否相关的方法,刚好符合题意,而均值、随机误差、频率分布直方图都不是分析两个不同分类的变量是否相关的方法,故采用独立性检验方法最有说服力.故选B.3.某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:每年体检(人) 每年未体检(人) 合计(人)老年人 a 7 c年轻人 6 b d合计 e f 50已知抽取的村民中老年人、年轻人各25人,则对列联表数据的分析错误的是( )A.a=18 B.b=19C.c+d=50 D.e-f=2答案:D解析: 因为抽取的村民中,老年人有25人,年轻人有25人,所以c=25,d=25,所以a=25-7=18,b=25-6=19,c+d=50,故A,B,C正确;所以e=a+6=18+6=24,f=7+b=7+19=26,则e-f=24-26=-2,故D错误.故选D.4.某医疗机构通过抽样调查(样本容量n=9 965),利用2×2列联表和χ2统计量研究患肺癌是否与吸烟有关.计算得χ2=56.632,经查对临界值表知P≈0.01,现给出四个结论,其中正确的是( )A.有99%的把握认为“患肺癌与吸烟无关”B.在100个吸烟的人中约有99个人患肺癌C.若老张吸烟,那么他有99%的可能性患肺癌D.有99%的把握认为“患肺癌与吸烟有关”答案:D解析:由已知数据χ2=56.632>6.635,得有99%的把握认为“患肺癌与吸烟有关”,则选项D正确,其余都是错误的.故选D.5.假设有两个分类变量X与Y,它们的可能取值分别为和,其2×2列联表为Y X y1 y2 总计x1 10 18 28x2 m 26 m+26总计 m+10 44 m+54则下列选项中使X与Y的关系最弱的m的取值为( )A.8 B.9C.14 D.19答案:C解析:在两个分类变量的列联表中,当的值越小时,认为两个分类变量有关的可能性越小.令=0,得10×26=18m,解得m≈14.4,又m为整数,所以当m=14时,X与Y的关系最弱.故选C.6.(多选题)根据分类变量x与y的成对样本数据,计算得到χ2=a.已知P=0.01,依据α=0.01的独立性检验,下列结论正确的是( )A.若a<6.635,则变量x与y独立B.若a>6.635,则变量x与y独立C.若a<6.635,则有99%的把握认为变量x与y有关联D.若a>6.635,则有99%的把握认为变量x与y有关联答案:AD解析:若a>6.635,则有99%的把握认为变量x与y有关联,变量x与y不独立,若a<6.635,则没有99%的把握认为变量x与y有关联,变量x与y独立.故选AD.7.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是 .答案:男正教授人数,女正教授人数,男副教授人数,女副教授人数8.(双空题)一部年代创业剧《乘风踏浪》,让辽宁葫芦岛成为许多人心驰神往的旅游度假目的地.为了更好地了解游客需求,优化自身服务,提高游客满意度,随机对1 200位游客进行了满意度调查,结果如下表:男性 女性 合计满意 560 540 1 100不满意 40 60 100合计 600 600 1 200根据列联表中的数据,经计算得到χ2= (精确到0.001);依据数据可作出的判断是 .附:χ2=,n=a+b+c+d.P(χ2≥k0) 0.1 0.05 0.01k0 2.706 3.841 6.635答案:4.364 有95%的把握认为满意度与性别有关联解析:χ2=≈4.364>3.841,所以有95%的把握认为满意度与性别有关联.9.2024年英超联赛期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢利物浦队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:是否高于40岁 是否喜欢利物浦队不喜欢利物浦队 喜欢利物浦队 总计高于40岁 p q 50不高于40岁 15 35 50总计 a b 100若工作人员从所有统计结果中任取一个,取到喜欢利物浦队的人的概率为,则有 的把握判断年龄与是否喜欢利物浦队有关.附:χ2=.答案:95%解析:设“从所有人中任意抽取一个,取到喜欢利物浦队的人”为事件A,由已知得P(A)==,所以q=25,p=25,a=40,b=60.χ2=≈4.167>3.841,故有95%的把握判断年龄与是否喜欢利物浦队有关.10.(15分)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品 二级品 合计甲机床 150 50 200乙机床 120 80 200合计 270 130 400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)是否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?参考公式:χ2=,n=a+b+c+d.附:P(χ2≥k0) 0.1 0.05 0.01 0.005 0.001k0 2.706 3.841 6.635 7.879 10.828解:(1)甲机床生产的产品中一级品的频率为=0.75;乙机床生产的产品中一级品的频率为=0.6.(2)由题可知a=150,b=50,c=120,d=80,n=400,所以χ2===≈10.256,根据参考值可知10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.(11—13,每小题5分,共15分)11.随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据(10≤m≤20,m∈N+):支持 不支持男生 70-m 10+m女生 50+m 30-m若通过计算得,有95%以上的把握认为支持增加中学生体育锻炼时间的政策与性别有关,则在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为( )附:χ2=,其中n=a+b+c+d.P(χ2≥k0) 0.1 0.05 0.01 0.005 0.001k0 2.706 3.841 6.635 7.879 10.828A.48 B.56C.66 D.76答案:C解析:因为有95%以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,所以≥3.841,即≥28.807 5,因为函数y=在10≤m≤20时单调递增,且m∈N+,<28.807 5,≥28.807 5,所以m的最小值为16,所以在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为50+16=66,故选C.12.(多选题)某医疗研究机构为了了解免疫与注射疫苗的关系,进行一次抽样调查,得到数据如表:免疫 不免疫 合计注射疫苗 10 10 20未注射疫苗 6 34 40合计 16 44 60参考公式:χ2=,其中n=a+b+c+d;P(χ2≥k0) 0.1 0.05 0.01 0.001k0 2.706 3.841 6.635 10.828则下列说法中正确的是( )A.χ2≈8.35B.P≈0.001C.我们有99%以上的把握认为免疫与注射疫苗有关系D.我们有99.9%以上的把握认为免疫与注射疫苗有关系答案:AC解析:由表中数据,得χ2=≈8.35,故A正确;因为P≈0.01,故B错误;10.828>8.35>6.635,所以有99%以上的把握认为免疫与注射疫苗有关系,故C正确,D错误.故选AC.13.某种疾病可分为A,B两种类型,为了解该疾病的类型与患者性别是否相关,在某地区随机抽取了若干名该疾病的患者进行调查,发现女性患者人数是男性患者人数的2倍,男性患A型疾病的人数占男性患者的,女性患A型疾病的人数占女性患者的.若本次调查得出“有99.5%的把握认为‘所患疾病的类型’与‘性别’有关”的结论,则被调查的男性患者至少有 人.附:P(χ2≥7.879)≈0.005.答案:12解析:设男性患者有x人,则女性患者有2x人,得2×2列联表如下:A型病 B型病 总计男 x女 2x总计 3x根据列联表中的数据,经计算得到χ2==,有99.5%的把握认为“所患疾病的类型”与“性别”有关,则>7.879,解得x>11.818 5,因为∈Z,所以x的最小整数值为12,因此,男性患者至少有12人.14.(15分)某机构为了解2024年当地居民网购消费情况,随机抽取了100人,对其2024年全年网购消费金额(单位:千元)进行了统计,所统计的金额均在区间内,并按,,…,分成6组,制成如图所示的频率分布直方图.(1)求图中a的值;(2)若将全年网购消费金额在20千元及以上者称为网购迷,结合图表数据,补全2×2列联表,并判断是否有99%的把握认为样本数据中网购迷与性别有关系?说明理由.男 女 合计网购迷 20非网购迷 47合计下面的临界值表仅供参考:P(χ2≥k0) 0.1 0.05 0.01 0.001k0 2.706 3.841 6.635 10.828(参考公式:χ2=,其中n=a+b+c+d)解:(1)根据频率分布直方图得:5×(0.01+0.02+0.03+2a+0.06)=1,解得a=0.04.(2)根据频率分布直方图得样本中网购迷的人数为100×(0.03×5+0.04×5)=35,列联表如下:男 女 合计网购迷 15 20 35非网购迷 47 18 65合计 62 38 100算得χ2=≈8.375>6.635.所以有99%的把握认为样本数据中网购迷与性别有关系.(15、16,每小题5分,共10分)15.(多选题)某研究机构为了探究过量饮酒与患疾病A是否有关,调查了400人,得到如表所示的2×2列联表,其中b=12a,则( )患疾病A 不患疾病A 合计过量饮酒 3a b不过量饮酒 a 2b合计 400参考公式与临界值表:χ2=.P(χ2≥k0) 0.1 0.05 0.01 0.001k0 2.706 3.841 6.635 10.828A.任意一人不患疾病A的概率为0.9B.任意一人不过量饮酒的概率为C.任意一人在不过量饮酒的条件下不患疾病A的概率为D.有99.9%以上的把握认为过量饮酒与患疾病A有关答案:ACD解析:由已知得4a+3b=400,又b=12a,所以a=10,b=120.任意一人不患疾病A的概率为=0.9,故A正确;任意一人不过量饮酒的概率为=,故B错误;任意一人在不过量饮酒的条件下不患疾病A的概率为=,故C正确;对于D,2×2列联表如下:患疾病A 不患疾病A 合计过量饮酒 30 120 150不过量饮酒 10 240 250合计 40 360 400则χ2==≈26.67,由于26.67>10.828,故有99.9%以上的把握认为过量饮酒与患疾病A有关,故D正确.故选ACD.16.为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为20k(k∈N+),则k= .答案:5或6解析:设男、女学生的总人数为2n,则2n=20k(k∈N+),并把2×2列联表的数据补充完整:是否喜欢网络课程 性别 喜欢 不喜欢 合计男生 0.8n 0.2n n女生 0.6n 0.4n n合计 1.4n 0.6n 2n所以χ2==.又因为有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关,所以3.841≤<6.635,即80.661≤2n<139.335.又2n=20k,所以4.033 05≤k<6.966 75,k=5或k=6.21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源列表 北师大版高中数学选择性必修第一册第七章统计案例§3独立性检验问题学案.docx 北师大版高中数学选择性必修第一册第七章统计案例§3独立性检验问题课件.ppt