资源简介 独立性检验问题 一、选择题 1.在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A.若随机变量χ2>6.635,我们有99%以上的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B.若从统计量中求出有99%以上的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C.若从统计量中求出有95%以上的把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D.以上说法均错误 2.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表: 优秀 非优秀 总计 甲班 10 b 乙班 c 30 总计 105 已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( ) A.列联表中c的值为30,b的值为35 B.列联表中c的值为15,b的值为50 C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系” D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 3.下列选项中,哪一个χ2的值可以有95%以上的把握认为“A与B有关系”( ) A.χ2=2.700 B.χ2=2.710 C.χ2=3.765 D.χ2=5.014 4.以下关于独立性检验的说法中,错误的是( ) A.独立性检验依据小概率原理 B.独立性检验得到的结论一定正确 C.样本不同,独立性检验的结论可能有差异 D.独立性检验不是判断两分类变量是否相关的唯一方法 5.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于95%,则c等于( ) A.3 B.7 C.5 D.6 二、填空题 6.为了了解长头发与女性头晕是否有关系,随机抽查301名女性,得到如下列联表,试根据表格中已有数据填空. 头晕情况 发型 经常头晕 很少头晕 总计 长发 35 ① 121 短发 37 143 ② 总计 72 ③ ④ 则空格中的数据应分别为:①________;②________;③________;④________. 7.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是________. 8.两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其列联表为: Y X y1 y3 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 若两个分类变量X,Y没有关系,则下列结论正确的是________(填序号). ①ad≈bc;②≈;③a+b≈c+d;④a+c≈b+d;⑤≈0. 三、解答题 9.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如下图所示的频率分布直方图. 25周岁以上组 25周岁以下组 规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”? 10.为了研究患慢性气管炎与吸烟量的关系,调查了228人,其中每天的吸烟支数在10支以上的20支以下的调查者中,患者人数有98人,非患者人数有89人,每天的吸烟支数在20支以上的调查者中,患者人数有25人,非患者人数有16人. (1)根据以上数据建立两个分类变量的列联表; (2)试问患慢性气管炎是否与吸烟量相互独立? 能力过关 11.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为: y1 y2 x1 10 18 x2 m 26 则当m取下面何值时,X与Y的关系最弱( ) A.8 B.9 C.14 D.19 12.假设有两个变量X与Y,它们的取值分别为x1,x2和y1,y2,其列联表为: y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为( ) A.a=50,b=40,c=30,d=20 B.a=50,b=30,c=40,d=20 C.a=20,b=30,c=40,d=50 D.a=20,b=30,c=50,d=40 13.(多选题)根据下面的2×2列联表得到如下判断,则正确的选项是( ) 嗜酒 不嗜酒 总计 患肝病 700 60 760 未患肝病 200 32 232 总计 900 92 992 A.至少有99.9%的把握认为“患肝病与嗜酒有关” B.至少有99%的把握认为“患肝病与嗜酒无关” C.在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关” D.在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关” 14.(一题两空)某高校《统计初步》课程的教师随机调查了选该课程的学生的一些情况,具体数据如下表: 专业 性别 非统计专业 统计专业 男 33 20 女 17 26 则χ2≈________,有________的把握判定主修统计专业与性别有关. 15.中国调查网有一项关于午休问题的调查,其结果如下:(单位:人) 性别 对午休的看法 男 女 总计 有用 50 214 264 无用 113 ① 182 合计 163 283 ② (1)将题表补充完整,应填入的数据是多少? (2)试分析性别与对午睡的看法是否有关? (3)请再列举一些可能与对午睡看法有关的分类变量.(至少两个) 一、选择题 1.在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A.若随机变量χ2>6.635,我们有99%以上的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B.若从统计量中求出有99%以上的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C.若从统计量中求出有95%以上的把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D.以上说法均错误 C [由随机变量χ2的意义可知答案C正确.] 2.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表: 优秀 非优秀 总计 甲班 10 b 乙班 c 30 总计 105 已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( ) A.列联表中c的值为30,b的值为35 B.列联表中c的值为15,b的值为50 C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系” D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” C [由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误.根据列联表中的数据,得到χ2=≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C正确.] 3.下列选项中,哪一个χ2的值可以有95%以上的把握认为“A与B有关系”( ) A.χ2=2.700 B.χ2=2.710 C.χ2=3.765 D.χ2=5.014 D [∵5.014>3.841,故D正确.] 4.以下关于独立性检验的说法中,错误的是( ) A.独立性检验依据小概率原理 B.独立性检验得到的结论一定正确 C.样本不同,独立性检验的结论可能有差异 D.独立性检验不是判断两分类变量是否相关的唯一方法 B [独立性检验得到的结论不一定正确,如我们得出有90%的把握认为A与B有关,只是说这种判断的正确性为90%,具体问题中A与B可能有关,也可能无关.] 5.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于95%,则c等于( ) A.3 B.7 C.5 D.6 A [列2×2列联表如下: x1 x2 总计 y1 10 21 31 y2 c d 35 总计 10+c 21+d 66 故χ2=≥3.841. 把选项A,B,C,D代入验证可知选A.] 二、填空题 6.为了了解长头发与女性头晕是否有关系,随机抽查301名女性,得到如下列联表,试根据表格中已有数据填空. 头晕情况 发型 经常头晕 很少头晕 总计 长发 35 ① 121 短发 37 143 ② 总计 72 ③ ④ 则空格中的数据应分别为:①________;②________;③________;④________. 86 180 229 301 [最右侧的总计是对应的行上的两个数据的和,由此可求出①和②;而最下面的总计是相应的列上两个数据的和,由刚才的结果可求得③④.] 7.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是________. 男正教授人数,女正教授人数,男副教授人数,女副教授人数 [由研究的问题可知,需收集的数据应为男正教授人数,女正教授人数,男副教授人数,女副教授人数.] 8.两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其列联表为: Y X y1 y3 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 若两个分类变量X,Y没有关系,则下列结论正确的是________(填序号). ①ad≈bc;②≈;③a+b≈c+d;④a+c≈b+d;⑤≈0. ①②⑤ [因为分类变量X,Y独立,所以≈,化简得ad≈bc,所以①②⑤正确,③④显然不正确.] 三、解答题 9.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如下图所示的频率分布直方图. 25周岁以上组 25周岁以下组 规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”? [解] 由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下: 生产能手 非生产能手 合计 25 周岁以上组 15 45 60 25周岁以下组 15 25 40 合计 30 70 100 所以得χ2= ==≈1.79. 因为1.79<2.706, 所以没有90%的把握认为“生产能手与工人所在的年龄组有关”. 10.为了研究患慢性气管炎与吸烟量的关系,调查了228人,其中每天的吸烟支数在10支以上的20支以下的调查者中,患者人数有98人,非患者人数有89人,每天的吸烟支数在20支以上的调查者中,患者人数有25人,非患者人数有16人. (1)根据以上数据建立两个分类变量的列联表; (2)试问患慢性气管炎是否与吸烟量相互独立? [解] (1)根据已知数据建立的列联表如下: 患病情况 吸烟情况 患病者 未患病者 总计 10支以上20支以下 98 89 187 20支以上 25 16 41 总计 123 105 228 (2)χ2= =≈0.994, 因为χ2≈0.994<2.706, 所以我们没有充分证据判定患慢性气管炎与吸烟量有关,即可以认为患慢性气管炎与吸烟量相互独立. 能力过关 11.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为: y1 y2 x1 10 18 x2 m 26 则当m取下面何值时,X与Y的关系最弱( ) A.8 B.9 C.14 D.19 C [由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.] 12.假设有两个变量X与Y,它们的取值分别为x1,x2和y1,y2,其列联表为: y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为( ) A.a=50,b=40,c=30,d=20 B.a=50,b=30,c=40,d=20 C.a=20,b=30,c=40,d=50 D.a=20,b=30,c=50,d=40 D [当(ad-bc)2的值越大,随机变量χ2=的值越大,可知X与Y有关系的可能性就越大.显然选项D中,(ad-bc)2的值最大.] 13.(多选题)根据下面的2×2列联表得到如下判断,则正确的选项是( ) 嗜酒 不嗜酒 总计 患肝病 700 60 760 未患肝病 200 32 232 总计 900 92 992 A.至少有99.9%的把握认为“患肝病与嗜酒有关” B.至少有99%的把握认为“患肝病与嗜酒无关” C.在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关” D.在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关” AC [由2×2列联表中数据可求得χ2的观测值 χ2=≈7.349>6.635, 所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关”,即至少有99%的把握认为“患肝病与嗜酒有关”.因此AC正确.] 14.(一题两空)某高校《统计初步》课程的教师随机调查了选该课程的学生的一些情况,具体数据如下表: 专业 性别 非统计专业 统计专业 男 33 20 女 17 26 则χ2≈________,有________的把握判定主修统计专业与性别有关. 4.914 95% [依题意知:χ2=≈4.914, ∵4.914>3.841,∴有95%的把握判定主修统计专业与性别有关.] 15.中国调查网有一项关于午休问题的调查,其结果如下:(单位:人) 性别 对午休的看法 男 女 总计 有用 50 214 264 无用 113 ① 182 合计 163 283 ② (1)将题表补充完整,应填入的数据是多少? (2)试分析性别与对午睡的看法是否有关? (3)请再列举一些可能与对午睡看法有关的分类变量.(至少两个) [解] (1)①=283-214=69,②=264+182=446,∴①填69,②填446. (2)∵χ2=≈86.490>6.635, ∴至少有99%的把握认为性别与对午睡的看法有关. (3)年龄、职业、季节等. 展开更多...... 收起↑ 资源预览