7.3 独立性检验问题(习题)-2021-2022学年高二上学期数学北师大版(2019)选择性必修第一册(Word含答案解析)

资源下载
  1. 二一教育资源

7.3 独立性检验问题(习题)-2021-2022学年高二上学期数学北师大版(2019)选择性必修第一册(Word含答案解析)

资源简介

独立性检验问题
一、选择题
1.在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是(  )
A.若随机变量χ2>6.635,我们有99%以上的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病
B.若从统计量中求出有99%以上的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病
C.若从统计量中求出有95%以上的把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误
D.以上说法均错误
2.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀 非优秀 总计
甲班 10 b
乙班 c 30
总计

105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是(  )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
3.下列选项中,哪一个χ2的值可以有95%以上的把握认为“A与B有关系”(  )
A.χ2=2.700 B.χ2=2.710
C.χ2=3.765 D.χ2=5.014
4.以下关于独立性检验的说法中,错误的是(  )
A.独立性检验依据小概率原理
B.独立性检验得到的结论一定正确
C.样本不同,独立性检验的结论可能有差异
D.独立性检验不是判断两分类变量是否相关的唯一方法
5.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于95%,则c等于(  )
A.3  B.7  C.5  D.6
二、填空题
6.为了了解长头发与女性头晕是否有关系,随机抽查301名女性,得到如下列联表,试根据表格中已有数据填空.
    头晕情况 发型     经常头晕 很少头晕 总计
长发 35 ① 121
短发 37 143 ②
总计 72 ③ ④
则空格中的数据应分别为:①________;②________;③________;④________.
7.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是________.
8.两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其列联表为:
   Y X    y1 y3 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
若两个分类变量X,Y没有关系,则下列结论正确的是________(填序号).
①ad≈bc;②≈;③a+b≈c+d;④a+c≈b+d;⑤≈0.
三、解答题
9.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如下图所示的频率分布直方图.
25周岁以上组
25周岁以下组
规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
10.为了研究患慢性气管炎与吸烟量的关系,调查了228人,其中每天的吸烟支数在10支以上的20支以下的调查者中,患者人数有98人,非患者人数有89人,每天的吸烟支数在20支以上的调查者中,患者人数有25人,非患者人数有16人.
(1)根据以上数据建立两个分类变量的列联表;
(2)试问患慢性气管炎是否与吸烟量相互独立?
能力过关
11.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1 y2
x1 10 18
x2 m 26
则当m取下面何值时,X与Y的关系最弱(  )
A.8  B.9  C.14  D.19
12.假设有两个变量X与Y,它们的取值分别为x1,x2和y1,y2,其列联表为:
y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为(  )
A.a=50,b=40,c=30,d=20
B.a=50,b=30,c=40,d=20
C.a=20,b=30,c=40,d=50
D.a=20,b=30,c=50,d=40
13.(多选题)根据下面的2×2列联表得到如下判断,则正确的选项是(  )
嗜酒 不嗜酒 总计
患肝病 700 60 760
未患肝病 200 32 232
总计 900 92 992
A.至少有99.9%的把握认为“患肝病与嗜酒有关”
B.至少有99%的把握认为“患肝病与嗜酒无关”
C.在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”
D.在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”
14.(一题两空)某高校《统计初步》课程的教师随机调查了选该课程的学生的一些情况,具体数据如下表:
    专业 性别    非统计专业 统计专业
男 33 20
女 17 26
则χ2≈________,有________的把握判定主修统计专业与性别有关.
15.中国调查网有一项关于午休问题的调查,其结果如下:(单位:人)
     性别 对午休的看法   男 女 总计
有用 50 214 264
无用 113 ① 182
合计 163 283 ②
(1)将题表补充完整,应填入的数据是多少?
(2)试分析性别与对午睡的看法是否有关?
(3)请再列举一些可能与对午睡看法有关的分类变量.(至少两个)
一、选择题
1.在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是(  )
A.若随机变量χ2>6.635,我们有99%以上的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病
B.若从统计量中求出有99%以上的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病
C.若从统计量中求出有95%以上的把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误
D.以上说法均错误
C [由随机变量χ2的意义可知答案C正确.]
2.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀 非优秀 总计
甲班 10 b
乙班 c 30
总计

105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是(  )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
C [由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误.根据列联表中的数据,得到χ2=≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C正确.]
3.下列选项中,哪一个χ2的值可以有95%以上的把握认为“A与B有关系”(  )
A.χ2=2.700 B.χ2=2.710
C.χ2=3.765 D.χ2=5.014
D [∵5.014>3.841,故D正确.]
4.以下关于独立性检验的说法中,错误的是(  )
A.独立性检验依据小概率原理
B.独立性检验得到的结论一定正确
C.样本不同,独立性检验的结论可能有差异
D.独立性检验不是判断两分类变量是否相关的唯一方法
B [独立性检验得到的结论不一定正确,如我们得出有90%的把握认为A与B有关,只是说这种判断的正确性为90%,具体问题中A与B可能有关,也可能无关.]
5.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于95%,则c等于(  )
A.3  B.7  C.5  D.6
A [列2×2列联表如下:
x1 x2 总计
y1 10 21 31
y2 c d 35
总计 10+c 21+d 66
故χ2=≥3.841.
把选项A,B,C,D代入验证可知选A.]
二、填空题
6.为了了解长头发与女性头晕是否有关系,随机抽查301名女性,得到如下列联表,试根据表格中已有数据填空.
    头晕情况 发型     经常头晕 很少头晕 总计
长发 35 ① 121
短发 37 143 ②
总计 72 ③ ④
则空格中的数据应分别为:①________;②________;③________;④________.
86 180 229 301 [最右侧的总计是对应的行上的两个数据的和,由此可求出①和②;而最下面的总计是相应的列上两个数据的和,由刚才的结果可求得③④.]
7.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是________.
男正教授人数,女正教授人数,男副教授人数,女副教授人数 [由研究的问题可知,需收集的数据应为男正教授人数,女正教授人数,男副教授人数,女副教授人数.]
8.两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其列联表为:
   Y X    y1 y3 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
若两个分类变量X,Y没有关系,则下列结论正确的是________(填序号).
①ad≈bc;②≈;③a+b≈c+d;④a+c≈b+d;⑤≈0.
①②⑤ [因为分类变量X,Y独立,所以≈,化简得ad≈bc,所以①②⑤正确,③④显然不正确.]
三、解答题
9.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如下图所示的频率分布直方图.
25周岁以上组
25周岁以下组
规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
[解] 由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:
生产能手 非生产能手 合计
25 周岁以上组 15 45 60
25周岁以下组 15 25 40
合计 30 70 100
所以得χ2=
==≈1.79.
因为1.79<2.706,
所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.
10.为了研究患慢性气管炎与吸烟量的关系,调查了228人,其中每天的吸烟支数在10支以上的20支以下的调查者中,患者人数有98人,非患者人数有89人,每天的吸烟支数在20支以上的调查者中,患者人数有25人,非患者人数有16人.
(1)根据以上数据建立两个分类变量的列联表;
(2)试问患慢性气管炎是否与吸烟量相互独立?
[解] (1)根据已知数据建立的列联表如下:
    患病情况 吸烟情况     患病者 未患病者 总计
10支以上20支以下 98 89 187
20支以上 25 16 41
总计 123 105 228
(2)χ2=
=≈0.994,
因为χ2≈0.994<2.706,
所以我们没有充分证据判定患慢性气管炎与吸烟量有关,即可以认为患慢性气管炎与吸烟量相互独立.
能力过关
11.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1 y2
x1 10 18
x2 m 26
则当m取下面何值时,X与Y的关系最弱(  )
A.8  B.9  C.14  D.19
C [由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.]
12.假设有两个变量X与Y,它们的取值分别为x1,x2和y1,y2,其列联表为:
y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为(  )
A.a=50,b=40,c=30,d=20
B.a=50,b=30,c=40,d=20
C.a=20,b=30,c=40,d=50
D.a=20,b=30,c=50,d=40
D [当(ad-bc)2的值越大,随机变量χ2=的值越大,可知X与Y有关系的可能性就越大.显然选项D中,(ad-bc)2的值最大.]
13.(多选题)根据下面的2×2列联表得到如下判断,则正确的选项是(  )
嗜酒 不嗜酒 总计
患肝病 700 60 760
未患肝病 200 32 232
总计 900 92 992
A.至少有99.9%的把握认为“患肝病与嗜酒有关”
B.至少有99%的把握认为“患肝病与嗜酒无关”
C.在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”
D.在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”
AC [由2×2列联表中数据可求得χ2的观测值
χ2=≈7.349>6.635,
所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关”,即至少有99%的把握认为“患肝病与嗜酒有关”.因此AC正确.]
14.(一题两空)某高校《统计初步》课程的教师随机调查了选该课程的学生的一些情况,具体数据如下表:
    专业 性别    非统计专业 统计专业
男 33 20
女 17 26
则χ2≈________,有________的把握判定主修统计专业与性别有关.
4.914 95% [依题意知:χ2=≈4.914,
∵4.914>3.841,∴有95%的把握判定主修统计专业与性别有关.]
15.中国调查网有一项关于午休问题的调查,其结果如下:(单位:人)
     性别 对午休的看法   男 女 总计
有用 50 214 264
无用 113 ① 182
合计 163 283 ②
(1)将题表补充完整,应填入的数据是多少?
(2)试分析性别与对午睡的看法是否有关?
(3)请再列举一些可能与对午睡看法有关的分类变量.(至少两个)
[解] (1)①=283-214=69,②=264+182=446,∴①填69,②填446.
(2)∵χ2=≈86.490>6.635,
∴至少有99%的把握认为性别与对午睡的看法有关.
(3)年龄、职业、季节等.

展开更多......

收起↑

资源预览