第4章第4节 数学探究活动:了解高考选考科目的确定是否与性别有关 高中数学选择性必修二同步复习讲义(人教B版2019)

资源下载
  1. 二一教育资源

第4章第4节 数学探究活动:了解高考选考科目的确定是否与性别有关 高中数学选择性必修二同步复习讲义(人教B版2019)

资源简介

第4章第4节 数学探究活动:了解高考选考科目的确定是否与性别有关
题型1 列联表与独立性检验 题型2 分类变量与2×2列联表
题型3 独立性检验
▉题型1 列联表与独立性检验
列联表与独立性检验
1.随着“特种兵旅行”在网络的爆火,某市文旅局准备在本市的景区推出旅游一卡通(也称旅游年卡).为了更科学的制定一卡通的有关条例,市文旅局随机调查了2023年到本市景区旅游的1000名游客的年旅游消费支出,其旅游消费支出(单位:百元)近似服从正态分布N(μ,σ2),其中μ=11.8,σ=3.2.
(1)若2023年到本市景区旅游游客为500万人,试估计2023年有多少游客(单位:万)在本市的年旅游消费支出不低于1500元;
(2)现将游客来源分为“当地游客”和“外地游客”.若从这1000名游客中随机抽取1人,抽到外地游客的概率为.规定游客的消费支出不低于1400元为三星客户,否则为一星客户.请根据已知条件完成下面的列联表,并依据小概率值α=0.01的独立性检验,能否认为“客户星级”与“游客来源”有关联?
游客来源 客户星级 合计
三星客户 一星客户
当地游客
外地游客 100
合计 300 1000
参考数据:若随机变量X N(μ,σ2),则P(μ﹣σ X μ+σ)≈0.6827,P(μ﹣2σ X μ+2σ)≈0.9545,P(μ﹣3σ X μ+3σ)≈0.9973;
参考公式:,其中n=a+b+c+d.
α 0.10 0.05 0.01 0.001
χα 2.706 3.841 6.635 10.828
【答案】(1)79.325万;(2)有关联.
【解答】解:(1)∵μ=11.8,σ=3.2,∴μ+σ=15,
∴旅游费用支出不低于1500元的概率为,
∴500×0.15865=79.325,估计2023年有79.325万的游客在本市的年旅游费用支出不低于1500元.
(2)填写表格如下:
游客来源 客户星级 合计
三星客户 一星客户
当地游客 200 400 600
外地游客 100 300 400
合计 300 700 1000
假设H0:“客户星级”与“客户来源”独立,没有关联,

根据小概率值α=0.01的独立性检验,假设H0不成立,
则“客户星级”与“客户来源”有关联,此推断犯错误的概率不大于0.01.
2.某学校高三年级有学生1000人,经调查,其中750人经常参加体育锻炼(称为A类同学),另外250人不经常参加体育锻炼(称为B类同学).现用按比例分配的分层抽样方法(按A类、B类分两层)从该年级的学生中共抽查100人,如果以身高达到165cm作为达标的标准,对抽取的100人,得到以下列联表(单位:人):
身高达标 身高不达标 总计
经常参加体育锻炼 40
不经常参加体育锻炼 15
总计 100
(1)完成上表;
(2)依据α=0.05的独立性检验,能否认为经常参加体育锻炼与身高达标有关系?
注:.
附表:
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)列联表见解析;
(2)经常参加体育锻炼与身高达标无关联.
【解答】解:(1)根据题意,某学校高三年级有学生1000人,经调查,其中750人经常参加体育锻炼(称为A类同学),另外250人不经常参加体育锻炼(称为B类同学),
则A类同学与B类同学比例为3:1,
则抽取的100人中,A类同学有75人,B类同学有25人,
则可填写列联表(单位:人)如下:
身高达标 身高不达标 总计
经常参加体育锻炼 40 35 75
不经常参加体育锻炼 10 15 25
总计 50 50 100
(2)零假设为H0:经常参加体育锻炼与身高达标无关联.
由列联表中的数据,.
根据α=0.05的独立性检验,没有充分证据证明H0不成立,即认为经常参加体育锻炼与身高达标无关联.
▉题型2 分类变量与2×2列联表
【知识点的认识】
﹣2×2列联表:用于显示两个分类变量的联合分布情况,展示每个类别组合的频数.
3.下面是一个2×2列联表:
y1 y2 总计
x1 35 a 70
x2 15 15 30
总计 50 b 100
其中a,b处填的值分别为 35,50  .
【答案】35,50
【解答】解:由题意可得a+35=70,得a=35,a+15=b,得b=50.
故答案为:35,50.
▉题型3 独立性检验
【知识点的认识】
1、分类变量:
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2、原理:假设性检验(类似反证法原理).
一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X和Y有关系”.(表中的k就是K2的观测值,即k=K2).
其中n=a+b+c+d(考试给出)
3、2×2列联表:
4、范围:K2∈(0,+∞);性质:K2越大,说明变量间越有关系.
5、解题步骤:
(1)认真读题,取出相关数据,作出2×2列联表;
(2)根据2×2列联表中的数据,计算K2的观测值k;
(3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.
4.下列关于独立性检验的说法正确的是(  )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以100%确定两个变量之间是否具有某种关系
C.利用χ2独立性检验推断吸烟与患肺病的关联中,若有99%的把握认为吸烟与患肺病有关系时,我们则可以说在100个吸烟的人中,有99人患肺病
D.在一个2×2列联表中,由计算得χ2的值,则χ2的值越大,判断两个变量间有关联的把握就越大
【答案】D
【解答】解:选项A,独立性检验是判断两个变量是否存在关联,并非检验二者是否是线性相关,故选项A错误;
选项B,独立性检验并不能100%确定两个变量相关,故选项B错误;
选项C,99%是指“抽烟”和“患肺病”存在关联的可能性大小,并非抽烟人中患肺病的发病率,故选项C错误;
选项D,根据卡方计算的定义可知,χ2的值越大,判断两个变量间有关联的把握就越大,故选项D正确.
故选:D.
5.为考察药物A对预防疾病B的效果,在两个不同规模的动物种群中分别进行了试验.根据种群一的试验结果得到如下列联表:
药物A 疾病B 合计
未患病 患病
未服用 28 22 50
服用 34 16 50
合计 62 38 100
计算得到χ2≈1.528,假设种群二试验结果对应的列联表中,每个单元格的数据都为表格对应单元格数据的5倍,则根据小概率值α的独立性检验,(  )
附:,
α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
A.当α=0.05时,种群一中药物A对预防疾病B有效,该推断犯错误的概率不超过5%
B.当α=0.05时,种群一中药物A对预防疾病B有效,该推断犯错误的概率不超过10%
C.当α=0.01时,种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过1%
D.当α=0.005时,种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过0.5%
【答案】C
【解答】解:种群一:已知χ2≈1.528,当α=0.05时,临界值xα=3.841,
由于1.528<3.841,不能拒绝原假设(药物A与预防疾病B无关联),故A、B错误;
种群二:列联表数据为种群一的5倍.根据χ2公式,新χ2=5×1.528=7.64,
当α=0.01时,临界值xα=6.6357.64>6.635,拒绝原假设,认为药物A有效,犯错概率≤1%,C正确;
当α=0.005时,临界值xα=7.879,7.64<7.879,不能拒绝原假设,D错误.
故选:C.
6.我国古代劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,例如“日落云里走,雨在半夜后”.某同学为了验证该谚语的准确性,随机观察了他所在地区的100天日落情况和后半夜天气,得到如下2×2列联表:
日落云里走 后半夜天气 总计
下雨 未下雨
出现 25 5 30
未出现 25 45 70
总计 50 50 100
经计算χ2≈19.05,则下列对该地区天气的判断不正确的是(  )
A.在样本数据中,后半夜下雨的概率约为
B.若出现“日落云里走”,则后半夜未下雨的概率约为
C.有99%的把握认为“日落云里走”是否出现与当晚后半夜是否下雨有关
D.根据独立性检验计算可知,若出现“日落云里走”,则有99%的把握认为后半夜会下雨
【答案】D
【解答】解:A选项,把频率看作概率,可得后半夜下雨的概率约为,故A选项正确;
B选项,出现“日落云里走”时,后半夜未下雨的概率约为,故B选项正确;
C选项,由χ2≈19.05>6.635,知有99%的把握认为“‘日落云里走’是否出现”与“后半夜是否下雨”有关,故C选项正确;
根据独立性检验的意义易知D选项错误.
故选:D.
7.某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为6m(m∈N*),男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.若有99%的把握认为喜欢短视频和性别相关联,则m的最小值为(  )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
,其中n=a+b+c+d)
A.18 B.20 C.22 D.24
【答案】B
【解答】解:因为被调查的男生、女生人数均为6m(m∈N*),男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的,
所以男生中喜欢短视频的人数为3m,女生中喜欢短视频的人数为6m4m,
所以列联表如下:
喜欢 不喜欢 合计
男 3m 3m 6m
女 4m 2m 6m
合计 7m 5m 12m
则χ2,
若有99%的把握认为喜欢短视频和性别相关联,
则χ2≥6.635,
即,
解得m≥19.352,
又m∈N*,
则m的最小值为20.
故选:B.
8.下列实际问题不适合用独立性检验解决的是(  )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
【答案】B
【解答】解:独立性检验是通过统计学方法来检验两个分类变量之间是否存在关联性,
ACD满足独立性检验的基本思想,B选项只是公司的营业额这一个变量在过去5年的变化情况,不满足独立性检验的基本思想.
故选:B.
9.地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占52%;35岁以上的市民中,男性约占56%;男性市民中,35岁及以下的约占43%;女性市民中,35岁及以下的约占40%.根据以上信息,下列结论不一定正确的是(  )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【答案】C
【解答】解:设样本中35岁以上的人数为x,35岁及以下的人数为y,男性人数为a,女性人数为b,
根据题意,得到如下两个2×2列联表:
35岁以上 35岁及以下 总计
男性 0.56x 0.52y 0.56x+0.52y
女性 0.44x 0.48y 0.44x+0.48y
总计 x y x+y
35岁以上 35岁及以下 总计
男性 0.57a 0.43a a
女性 0.6b 0.4b b
总计 0.57a+0.6b 0.43a+0.4b a+b
对于选项A,根据第1个列联表可知,样本中男性市民人数为0.56x+0.52y,女性市民人数为0.44x+0.48y,
因为0.56x+0.52y>0.44x+0.48y,即样本中男性比女性多,故选项A正确;
对于选项B,根据第2个列联表可知,样本中35岁以上女性市民人数为0.6b,35岁及以下女性市民人数为0.4b,
又因为0.6b>0.4b,即样本中多数女性是35岁以上,故选项B正确;
对于选项C,根据第2个列联表可知,样本中35岁及以下男性市民人数为0.43a,35岁以上女性市民人数为0.6b,
由A选项的分析知a>b,
但无法判断0.43a与0.6b的大小,故选项C不一定正确;
对于选项D,根据第2个列联表可知,样本中35岁以上市民人数为0.57a+0.6b,35岁及以下市民人数为0.43a+0.4b,
又因为0.57a+0.6b>0.43a+0.4b,
即样本中35岁以上的市民比35岁及以下的多,故选项D正确.
故选:C.
10.在一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下2×2列联表:
优秀 非优秀 合计
甲班 10 50 60
乙班 20 30 50
合计 30 80 110
附:X2,其中n=a+b+c+d.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
根据独立性检验,可以认为数学考试成绩与班级有关系的把握为(  )
A.95% B.99.5% C.99.9% D.99%
【答案】D
【解答】解:由题表中的数据可得:,
因为7.49>6.635=x0.01,
所以可以认为数学考试成绩与班级有关系的把握为99%.
故选:D.
11.下列说法中不正确的是(  )
A.独立性检验是检验两个分类变量是否有关的一种统计方法
B.独立性检验得到的结论一定是正确的
C.独立性检验的样本不同,其结论可能不同
D.独立性检验的基本思想是带有概率性质的反证法
【答案】B
【解答】解:独立性检验就是用来检验两个分类变量是否有关的,即A正确;
独立性检验与样本的选取有关,不一定正确,即B错误;
样本不同,观测值统计量不同,结论可能不同,即C正确;
独立性检验思想来自统计上的检验思想,与反证法类似,即D正确.
故选:B.
12.考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目 种子处理 种子未处理 总计
得病 32 101 133
不得病 192 213 405
总计 224 314 538
根据以上数据,则(  )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
【答案】C
【解答】解:由列联表中的数据可知,
种子经过处理,得病的比例明显降低,
种子未经过处理,得病的比例要高些,
所以可得结论:种子是否经过处理跟是否生病有关.
故选:C.
13.2011年3月,日本发生了9.0级地震,地震引发了海啸及核泄漏.核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检测,并将有关数据整理为2×2列联表.
高度辐射 轻微辐射 合计
身体健康 30 A 50
身体不健康 B 10 60
合计 C D E
则A,B,C,D的值依次为(  )
A.20,80,30,50 B.20,50,80,30
C.20,50,80,110 D.20,80,110,50
【答案】B
【解答】解:30+A=50,
∴A=20,
B+10=60,
∴B=50,
∴C=30+B=30+50=80,D=A+10=20+10=30.
故选:B.
14.在对人们休闲方式的一次调查中,根据数据建立如下的2×2列联表:
休闲 性别 看电视 运动
男 8 20
女 16 12
为了判断休闲方式是滞与性别有关,根据表中数据,得到,因为3.841≤x2≤6.635,所以判定休闲方式与性别有关系,那么这种判断出错的可能性至多为(  )
(参考数据:P(x2≥3.841)≈0.05,P(x2≥6.635)≈0.01)
A.1% B.99% C.5% D.95%
【答案】C
【解答】解:∵3.841≤x2≤6.635,P(x2≥3.841)≈0.05,P(x2≥6.635)≈0.01,
∴判断出错的可能性至多为5%,
故选:C.
(多选)15.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”进行调查,调查样本中女生人数是男生人数的,男生追星人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值α=0.05的独立性检验,可以推断追星和性别有关,则调查样本中男生人数可以是(  )
(参考公式及数据:χ2,临界值χ0.05=3.841)
A.10 B.11 C.12 D.18
【答案】CD
【解答】解:设男生人数为m,则女生人数是m,
所以男生追星人数为,女生追星的人数为,
列出2×2列联表如下:
追星 不追星 合计
男生 m
女生 m
合计 m
则χ2,
若根据小概率值α=0.05的独立性检验,可以推断追星和性别有关,则χ2≥3.841,
即3.841,解得m≥10.243,
又因为m∈N+且m为偶数,所以m的值可以是12或18.
故选:CD.
(多选)16.为了探究某次数学测试中成绩达到优秀等级是否与性别存在关联,小华进行了深入的调查,并绘制了下侧所示的2×2列联表(个别数据暂用字母表示):
数学成绩 性别 合计
男 女
优秀 m 27 77
非优秀 58 n 110
合计 a b 180
经计算得:χ2≈1.315,参照下表:
P(χ2≥x0) 0.10 0.05 0.025 0.010 0.005 0.001
x0 2.706 3.841 5.024 6.635 7.879 10.828
则下列选项正确的为(  )
A.m=43
B.b=79
C.可以在犯错误的概率不超过5%的前提下认为“数学达到优秀等级与性别有关”
D.没有充分的证据显示“数学达到优秀等级与性别有关”
【答案】ABD
【解答】解:对于A,由2×2列联表知,m=70﹣27=43,故A正确;
对于B,n=110﹣58=52,b=27+n=79,故B正确;
对于CD,由χ2≈1.315<2.706<3.841知,没有充分的证据显示“数学达到优秀等级与性别有关”,
故C错误,D正确.
故选:ABD.
17.某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如表所示,其中x∈N*,且x<16,若有90%的把握可以认为性别与对工作的满意程度具有相关性,则x的值是  14或15  .
对工作满意 对工作不满意
男 5x 5x
女 4x 6x
附:,其中n=a+b+c+d.
P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001
k0 2.706 3.841 5.024 6.635 7.879 10.828
【答案】14或15.
【解答】解:根据独立性检验思想可得,,
得x>13.3947,
因为x∈N*且x<16,所以x=14或x=15,
则x的的取值为14或15.
故答案为:14或15.
18.我校数学小组为了解喜欢看篮球赛是否与性别有关,随机调查了部分学生,在被调查的学生中,男生人数是女生人数的2倍,男生喜欢看篮球赛的人数占男生人数的,女生喜欢看篮球赛的人数占女生人数的,若被调查的男生人数为n,且有95%的把握认为喜欢看篮球赛与性别有关,则n的最小值为  12  .
【答案】12.
【解答】解:根据题意,得到2×2列联表如下:
男生 女生 合计
喜欢 n n n
不喜欢 n n n
合计 n n n
由表知,χ2,
因为有95%的把握认为喜欢看篮球赛与性别有关,
所以χ23.841,解得n>10.243,
又都是整数,所以n的最小值为12.
故答案为:12.
19.盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下2×2列联表:
女生 男生 总计
购买 40 20 60
未购买 70 70 140
总计 110 90 200
则认为是否购买该款盲盒与性别有关出错的可能性为  5%  .
附:
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
,其中n=a+b+c+d.
【答案】5%.
【解答】解:由题意可知,,
因为4.714>3.842,
所以认为是否购买该款盲盒与性别有关出错的可能性为5%.
故答案为:5%.
20.某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了5000人,计算发现K2=6.109,根据这一数据,市政府断言市民收入增减与旅游需求有关的可信度是  97.5  %.
附:常用小概率值和临界值表:
P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.001
k0 2.072 2.706 3.841 5.024 6.635 10.828
【答案】97.5.
【解答】解:因为K2=6.109>5.024,
所以市政府断言市民收入增减与旅游需求有关的可信度为97.5%.
故答案为:97.5.
21.第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的2×2列联表中,a+b+d= 88  .
会法语 不会法语 总计
男 a b 40
女 12 d
总计 36 100
【答案】88.
【解答】解:因为志愿者的总人数为100,
所以a+b+12+d=100,
解得a+b+d=88.
故答案为:88.
22.考取驾照是一个非常严格的过程,有的人并不能够一次性通过,需要补考.现在有一张某驾校学员第一次考试结果汇总表,由于保管不善,只残留了如下数据(见下表):
成绩 性别 合格 不合格 合计
男性 45 10
女性 30
合计 105
(1)完成此表;
(2)根据此表判断:是否可以认为性别与考试是否合格有关?如果可以,请问有多大把握;如果不可以,试说明理由.
参考公式:①相关性检验的临界值表:
P(k2≥x0) 0.40 0.25 0.15 0.10 0.05 0.025 0.10
x0 0.708 1.323 2.072 2.706 3.841 5.024 6.635
②卡方值计算公式:k2.其中n=a+b+c+d.
【答案】(1)2×2列联表见解析;(2)有97.5%的把握认为性别与考试是否合格有关.
【解答】解:(1)2×2列联表如下:
成绩 性别 合格 不合格 合计
男性 45 10 55
女性 30 20 50
合计 75 30 105
(2)∵k26.109>5.024,
∴有97.5%的把握认为性别与考试是否合格有关.
23.某科技公司2025年计划推出量子加密通信设备,该设备可实时保护数据传输,目标用户为学校、企业和自由开发者.该公司调查了不同用户对该设备的需求情况,得到数据如下(单位:个):
学校 企业 自由开发者
有需求 3m 170 2n
无需求 m 120 n
已知调查了400个学校和150个自由开发者.
(Ⅰ)求m和n的值;
(Ⅱ)估计目标用户对该设备有需求的概率;
(Ⅲ)是否有99%的把握认为学校用户与非学校用户对该设备的需求情况有差异?附:.
P(χ2≥k) 0.1 0.01 0.001
k 2.706 6.635 10.828
【答案】见试题解答内容
【解答】解:(Ⅰ)由题意可知,,
解得;
(Ⅱ)由题可得估计目标用户对该设备有需求的概率为;
(Ⅲ)列出2×2列联表:
学校用户 非学校用户 总计
有需求 300 270 570
无需求 100 170 270
总计 400 440 840
零假设H0:学校用户与非学校用户对该设备的需求情况无差异,
由表格得,
根据小概率值α=0.01的独立性检验,推断H0不成立,
所以有99%的把握认为学校用户与非学校用户对该设备的需求情况有差异.
24.新高考“3+3”模式中,考生除语文、数学、外语3门必考科目外,需从物理、化学、生物、政治、历史、地理这6门中自主选择3门作为选考科目,某研究机构为了解学生对全文(政治、历史、地理)的选择是否与性别有关,从某学校高一年级的1000名学生中随机抽取男、女生各25人进行模拟选科.经统计,选择全文的男生有5人,选择全文的女生有15人.
(1)估计高一年级的男生选择全文的概率;
(2)请完成下面的2×2列联表,并判断能否在犯错误的概率不超过0.005的前提下认为选择全文与性别有关.
选择全文 不选择全文 总计
男生
女生
总计
附表:
P(K2≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
(参考公式:,其中n=a+b+c+d)
【答案】(1);
(2)答案见解析.
【解答】解:(1)已知从某学校高一年级的1000名学生中随机抽取男、女生各25人进行模拟选科.经统计,选择全文的男生有5人,选择全文的女生有15人,
则抽取的25名男生中,选择全文的有5人,
故高一年级的男生选择全文的概率为:.
(2)列联表如下:
选择全文 不选择全文 总计
男生 5 20 25
女生 15 10 25
总计 20 30 50
由题可设H0=“选择全文与性别无关”,
根据列联表中的数据得,,
所以在犯错误的概率不超过0.005的前提下认为选择全文与性别有关.
25.某杂志社为了解杂志订阅者对某杂志冷色调与暖色调的封面设计偏好是否与他们的性别有关,随机调查并收集了100名该杂志订阅者对该杂志封面设计的色调偏好数据,同时记录了他们的性别,得到如表所示的列联表.
单位:人
性别 封面设计的色调 合计
冷色调 暖色调
男性 28
女性 32
合计 46
(1)请完成以上表格,并根据小概率值α=0.05的独立性检验,分析该杂志订阅者对该杂志封面设计的色调偏好是否与性别有关联;
(2)从这100名该杂志订阅者中随机抽取2名订阅者参加某读书会,用X表示这2名订阅者中女性的人数,求X的分布列和数学期望;
(3)用频率估计概率,从全国各地该杂志的所有订阅者中随机抽取部分订阅者参加书籍捐赠活动,从数学期望的角度考虑,若要使得被抽取的订阅者中偏好暖色调封面设计的人数至少为189,则至少应抽取多少名该杂志订阅者?
附:,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
【答案】(1)有关联;
(2)分布列见解析,E(X)=1;
(3)350名.
【解答】解:(1)根据题意可知,列联表如下:
单位:人
性别 封面设计的色调 合计
冷色调 暖色调
男 28 22 50
女 18 32 50
合计 46 54 100
零假设为H0:该杂志订阅者对该杂志封面设计的色调偏好与性别没有关联,
根据列联表中的数据,得,
根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为该杂志订阅者对该杂志封面设计的色调偏好与性别有关联;
(2)根据题意可知,X的所有可能取值为0,1,2,
则,


∴X的分布列为
X 0 1 2
P
∴;
(3)用频率估计概率,从该杂志订阅者中随机抽取1名订阅者,则该订阅者偏好暖色调封面设计的概率为,
设从该杂志订阅者中随机抽取n(n∈N*)名订阅者参加书籍捐赠活动,记被抽取的订阅者中偏好暖色调封面设计的人数为Y,则,
根据题意易得,
解得n≥350,故至少应抽取350名该杂志订阅者.
26.西宁市第十四中学为高一、高二的学生开展了丰富的社团活动,共青团委员会的工作人员为研究学生的性别与喜欢烘焙社是否有关联.她随机从两个年级的男生和女生中各抽取了100名学生进行统计分析.并绘制了下列列联表.
喜欢烘焙社 不喜欢烘焙社 合计
男生 45 m 100
女生 n 35 100
合计 x y 200
(1)求m,n,x,y的值;
(2)根据小概率值α=0.005的独立性检验,能否认为喜欢烘焙社与性别有关联?
附:
α 0.15 0.10 0.05 0.025 0.010 0.005
xα 2.072 2.706 3.841 5.024 6.635 7.879

【答案】(1)m=55,n=65,x=110,y=90;
(2)能.
【解答】解:(1)根据题意可知,m+45=100,n+35=100,∴m=55,n=65,
∴x=45+65=110,y=55+35=90,
∴m=55,n=65,x=110,y=90;
(2)零假设H0:假设性别与喜欢烘焙社无关,
根据题中所给数据可知,,
根据小概率值α=0.005的独立性检验,可认为零假设H0不成立,
故认为性别与喜欢烘焙社有关.
27.我校高二语文组对学生提出“读一本书”的要求,每个学生都选择且只能选择《红楼梦》和《三国演义》中的一本,现随机调查男、女生各100人,发现选择《三国演义》的有110人,其中女生占.
(1)补充完整下述2×2列联表,现按性别用分层抽样的方式从选择《红楼梦》的学生中抽取18人,求这18人中男生和女生的人数;
《红楼梦》 《三国演义》
男生
女生
合计
(2)根据小概率值P=0.001的独立性检验,能否认为学生选择《红楼梦》还是《三国演义》与性别有关?
参考公式:,其中n=a+b+c+d.参考数据:
P(k2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001
k0 2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)列联表见解析,男生人数为6,女生人数为12;
(2)有关.
【解答】解:(1)由题意,随机调查男、女生各100人,发现选择《三国演义》的有110人,其中女生占,
所以女生选择《三国演义》的人数为,男生选择《三国演义》的人数为110﹣40=70,
女生选择《红楼梦》的人数为100﹣40=60,男生选择《红楼梦》的人数为100﹣70=30.
列联表补充如下:
《红楼梦》 《三国演义》 合计
男生 30 70 100
女生 60 40 100
合计 90 110 200
按性别用分层抽样的方式从选择《红楼梦》的学生中抽取18人,
所以男生人数为,女生人数为.
(2)零假设为
H0:学生选择《红楼梦》还是《三国演义》与性别无关,
由列联表中数据得,

根据小概率值P=0.001的独立性检验,推断H0不成立,
即认为学生选择《红楼梦》还是《三国演义》与性别有关.
28.为了研究体育锻炼对某年龄段的人患某种慢性病的影响,某人随机走访了200个该年龄段的人,得到的数据如下:
慢性病 体育锻炼 合计
经常 不经常
未患病 100 70 170
患病 10 20 30
合计 110 90 200
(1)定义分类变量X,Y如下:X,Y,以频率估计概率,求条件概率P(X=1|Y=0)与P(X=1|Y=1)的值;
(2)根据小概率值α=0.010的独立性检验,分析经常进行体育锻炼是否对患该种慢性病有影响.
附:χ2
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
【答案】(1)P(X=1|Y=0),P(X=1|Y=1);
(2)我们推断经常锻炼对患有某种慢性病有影响,此推断犯错误的概率不大于0.01.
【解答】解:(1),;
(2)零假设为H0:经常进行体育锻炼对患该种慢性病无影响,
将列联表中的数据代入公式计算得,
根据小概率值α=0.010的独立性检验,我们推断H0不成立,即认为经常锻炼对患有某种慢性病有影响,此推断犯错误的概率不大于0.01.
29.某学生对其30位亲属的饮食习惯进行了一次调查,并用如图所示的茎叶图表示他们的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).
(1)根据茎叶图,帮助这位同学说明这30位亲属的饮食习惯.
(2)根据以上数据完成如下2×2列联表:
主食为蔬菜 主食为肉类 总计
50岁以下
50岁及以上
总计
(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关?
附表:
P(K2≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
(参考公式:,其中n=a+b+c+d.)
【答案】(1)30位亲属中50岁及以上的人饮食以蔬菜为主,50岁以下的人饮食以肉类为主;
(2)列联表见解析;
(3)有99%的把握认为其亲属的饮食习惯与年龄有关.
【解答】解:(1)由茎叶图可知:30位亲属中50岁及以上的人饮食以蔬菜为主,50岁以下的人饮食以肉类为主;
(2)2×2列联表如下所示:
主食为蔬菜 主食为肉类 总计
50岁以下 4 8 12
50岁及以上 16 2 18
总计 20 10 30
(3)由题意,知随机变量K2的观测值,
故有99%的把握认为其亲属的饮食习惯与年龄有关.
30.某县城为活跃经济,特举办传统文化民俗节,小张弄了一个套小白兔的摊位,设xi表示第i天的平均气温,yi表示第i天参与活动的人数,i=1,2, ,20,根据统计,计算得到如下一些统计量的值:.
(1)根据所给数据,用相关系数r(精确到0.01)判断是否可用线性同归模型拟合y与x的关系;
(2)现有两个家庭参与套圈,A家庭3位成员每轮每人套住小白兔的概率都为家庭3位成员每轮每人套住小白兔的概率分别为,每个家庭的3位成员均玩一次套圈为一轮,每轮每人收费30元,每个小白兔价值60元,且每人是否套住相互独立,以每个家庭的盈利的期望为决策依据,问:一轮结束后,哪个家庭损失较大?
附:相关系数.
【答案】(1)可用线性同归模型拟合y与x的关系;
(2)B家庭损失较大.
【解答】解:(1),
则根据相关系数r,可用线性同归模型拟合y与x的关系,
(2)设A家庭套住小白兔的人数为X1,则,
∴,
设A家庭的盈利为X2,X2=60X1﹣90,
则E(X2)=E(60X1﹣90)=60E(X1)﹣90=54﹣90=﹣36,
设B家庭套住小白兔的人数为Y1,
Y1的可能取值分别为0,1,2,3,
则,



∴,
设B家庭的盈利为Y2,Y2=60Y1﹣90,
∴E(Y2)=E(60Y1﹣90)=60E(Y1)﹣90=45﹣90=﹣45,
∵﹣36>﹣45,∴B家庭损失较大.第4章第4节 数学探究活动:了解高考选考科目的确定是否与性别有关
题型1 列联表与独立性检验 题型2 分类变量与2×2列联表
题型3 独立性检验
▉题型1 列联表与独立性检验
列联表与独立性检验
1.随着“特种兵旅行”在网络的爆火,某市文旅局准备在本市的景区推出旅游一卡通(也称旅游年卡).为了更科学的制定一卡通的有关条例,市文旅局随机调查了2023年到本市景区旅游的1000名游客的年旅游消费支出,其旅游消费支出(单位:百元)近似服从正态分布N(μ,σ2),其中μ=11.8,σ=3.2.
(1)若2023年到本市景区旅游游客为500万人,试估计2023年有多少游客(单位:万)在本市的年旅游消费支出不低于1500元;
(2)现将游客来源分为“当地游客”和“外地游客”.若从这1000名游客中随机抽取1人,抽到外地游客的概率为.规定游客的消费支出不低于1400元为三星客户,否则为一星客户.请根据已知条件完成下面的列联表,并依据小概率值α=0.01的独立性检验,能否认为“客户星级”与“游客来源”有关联?
游客来源 客户星级 合计
三星客户 一星客户
当地游客
外地游客 100
合计 300 1000
参考数据:若随机变量X N(μ,σ2),则P(μ﹣σ X μ+σ)≈0.6827,P(μ﹣2σ X μ+2σ)≈0.9545,P(μ﹣3σ X μ+3σ)≈0.9973;
参考公式:,其中n=a+b+c+d.
α 0.10 0.05 0.01 0.001
χα 2.706 3.841 6.635 10.828
2.某学校高三年级有学生1000人,经调查,其中750人经常参加体育锻炼(称为A类同学),另外250人不经常参加体育锻炼(称为B类同学).现用按比例分配的分层抽样方法(按A类、B类分两层)从该年级的学生中共抽查100人,如果以身高达到165cm作为达标的标准,对抽取的100人,得到以下列联表(单位:人):
身高达标 身高不达标 总计
经常参加体育锻炼 40
不经常参加体育锻炼 15
总计 100
(1)完成上表;
(2)依据α=0.05的独立性检验,能否认为经常参加体育锻炼与身高达标有关系?
注:.
附表:
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
▉题型2 分类变量与2×2列联表
【知识点的认识】
﹣2×2列联表:用于显示两个分类变量的联合分布情况,展示每个类别组合的频数.
3.下面是一个2×2列联表:
y1 y2 总计
x1 35 a 70
x2 15 15 30
总计 50 b 100
其中a,b处填的值分别为  .
▉题型3 独立性检验
【知识点的认识】
1、分类变量:
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2、原理:假设性检验(类似反证法原理).
一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X和Y有关系”.(表中的k就是K2的观测值,即k=K2).
其中n=a+b+c+d(考试给出)
3、2×2列联表:
4、范围:K2∈(0,+∞);性质:K2越大,说明变量间越有关系.
5、解题步骤:
(1)认真读题,取出相关数据,作出2×2列联表;
(2)根据2×2列联表中的数据,计算K2的观测值k;
(3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.
4.下列关于独立性检验的说法正确的是(  )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以100%确定两个变量之间是否具有某种关系
C.利用χ2独立性检验推断吸烟与患肺病的关联中,若有99%的把握认为吸烟与患肺病有关系时,我们则可以说在100个吸烟的人中,有99人患肺病
D.在一个2×2列联表中,由计算得χ2的值,则χ2的值越大,判断两个变量间有关联的把握就越大
5.为考察药物A对预防疾病B的效果,在两个不同规模的动物种群中分别进行了试验.根据种群一的试验结果得到如下列联表:
药物A 疾病B 合计
未患病 患病
未服用 28 22 50
服用 34 16 50
合计 62 38 100
计算得到χ2≈1.528,假设种群二试验结果对应的列联表中,每个单元格的数据都为表格对应单元格数据的5倍,则根据小概率值α的独立性检验,(  )
附:,
α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
A.当α=0.05时,种群一中药物A对预防疾病B有效,该推断犯错误的概率不超过5%
B.当α=0.05时,种群一中药物A对预防疾病B有效,该推断犯错误的概率不超过10%
C.当α=0.01时,种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过1%
D.当α=0.005时,种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过0.5%
6.我国古代劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,例如“日落云里走,雨在半夜后”.某同学为了验证该谚语的准确性,随机观察了他所在地区的100天日落情况和后半夜天气,得到如下2×2列联表:
日落云里走 后半夜天气 总计
下雨 未下雨
出现 25 5 30
未出现 25 45 70
总计 50 50 100
经计算χ2≈19.05,则下列对该地区天气的判断不正确的是(  )
A.在样本数据中,后半夜下雨的概率约为
B.若出现“日落云里走”,则后半夜未下雨的概率约为
C.有99%的把握认为“日落云里走”是否出现与当晚后半夜是否下雨有关
D.根据独立性检验计算可知,若出现“日落云里走”,则有99%的把握认为后半夜会下雨
7.某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为6m(m∈N*),男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.若有99%的把握认为喜欢短视频和性别相关联,则m的最小值为(  )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
,其中n=a+b+c+d)
A.18 B.20 C.22 D.24
8.下列实际问题不适合用独立性检验解决的是(  )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
9.地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占52%;35岁以上的市民中,男性约占56%;男性市民中,35岁及以下的约占43%;女性市民中,35岁及以下的约占40%.根据以上信息,下列结论不一定正确的是(  )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
10.在一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下2×2列联表:
优秀 非优秀 合计
甲班 10 50 60
乙班 20 30 50
合计 30 80 110
附:X2,其中n=a+b+c+d.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
根据独立性检验,可以认为数学考试成绩与班级有关系的把握为(  )
A.95% B.99.5% C.99.9% D.99%
11.下列说法中不正确的是(  )
A.独立性检验是检验两个分类变量是否有关的一种统计方法
B.独立性检验得到的结论一定是正确的
C.独立性检验的样本不同,其结论可能不同
D.独立性检验的基本思想是带有概率性质的反证法
12.考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目 种子处理 种子未处理 总计
得病 32 101 133
不得病 192 213 405
总计 224 314 538
根据以上数据,则(  )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
13.2011年3月,日本发生了9.0级地震,地震引发了海啸及核泄漏.核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检测,并将有关数据整理为2×2列联表.
高度辐射 轻微辐射 合计
身体健康 30 A 50
身体不健康 B 10 60
合计 C D E
则A,B,C,D的值依次为(  )
A.20,80,30,50 B.20,50,80,30
C.20,50,80,110 D.20,80,110,50
14.在对人们休闲方式的一次调查中,根据数据建立如下的2×2列联表:
休闲 性别 看电视 运动
男 8 20
女 16 12
为了判断休闲方式是滞与性别有关,根据表中数据,得到,因为3.841≤x2≤6.635,所以判定休闲方式与性别有关系,那么这种判断出错的可能性至多为(  )
(参考数据:P(x2≥3.841)≈0.05,P(x2≥6.635)≈0.01)
A.1% B.99% C.5% D.95%
(多选)15.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”进行调查,调查样本中女生人数是男生人数的,男生追星人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值α=0.05的独立性检验,可以推断追星和性别有关,则调查样本中男生人数可以是(  )
(参考公式及数据:χ2,临界值χ0.05=3.841)
A.10 B.11 C.12 D.18
(多选)16.为了探究某次数学测试中成绩达到优秀等级是否与性别存在关联,小华进行了深入的调查,并绘制了下侧所示的2×2列联表(个别数据暂用字母表示):
数学成绩 性别 合计
男 女
优秀 m 27 77
非优秀 58 n 110
合计 a b 180
经计算得:χ2≈1.315,参照下表:
P(χ2≥x0) 0.10 0.05 0.025 0.010 0.005 0.001
x0 2.706 3.841 5.024 6.635 7.879 10.828
则下列选项正确的为(  )
A.m=43
B.b=79
C.可以在犯错误的概率不超过5%的前提下认为“数学达到优秀等级与性别有关”
D.没有充分的证据显示“数学达到优秀等级与性别有关”
17.某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如表所示,其中x∈N*,且x<16,若有90%的把握可以认为性别与对工作的满意程度具有相关性,则x的值是 .
对工作满意 对工作不满意
男 5x 5x
女 4x 6x
附:,其中n=a+b+c+d.
P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001
k0 2.706 3.841 5.024 6.635 7.879 10.828
18.我校数学小组为了解喜欢看篮球赛是否与性别有关,随机调查了部分学生,在被调查的学生中,男生人数是女生人数的2倍,男生喜欢看篮球赛的人数占男生人数的,女生喜欢看篮球赛的人数占女生人数的,若被调查的男生人数为n,且有95%的把握认为喜欢看篮球赛与性别有关,则n的最小值为   .
19.盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下2×2列联表:
女生 男生 总计
购买 40 20 60
未购买 70 70 140
总计 110 90 200
则认为是否购买该款盲盒与性别有关出错的可能性为 .
附:
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
,其中n=a+b+c+d.
20.某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了5000人,计算发现K2=6.109,根据这一数据,市政府断言市民收入增减与旅游需求有关的可信度是     %.
附:常用小概率值和临界值表:
P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.001
k0 2.072 2.706 3.841 5.024 6.635 10.828
21.第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的2×2列联表中,a+b+d=    .
会法语 不会法语 总计
男 a b 40
女 12 d
总计 36 100
22.考取驾照是一个非常严格的过程,有的人并不能够一次性通过,需要补考.现在有一张某驾校学员第一次考试结果汇总表,由于保管不善,只残留了如下数据(见下表):
成绩 性别 合格 不合格 合计
男性 45 10
女性 30
合计 105
(1)完成此表;
(2)根据此表判断:是否可以认为性别与考试是否合格有关?如果可以,请问有多大把握;如果不可以,试说明理由.
参考公式:①相关性检验的临界值表:
P(k2≥x0) 0.40 0.25 0.15 0.10 0.05 0.025 0.10
x0 0.708 1.323 2.072 2.706 3.841 5.024 6.635
②卡方值计算公式:k2.其中n=a+b+c+d.
23.某科技公司2025年计划推出量子加密通信设备,该设备可实时保护数据传输,目标用户为学校、企业和自由开发者.该公司调查了不同用户对该设备的需求情况,得到数据如下(单位:个):
学校 企业 自由开发者
有需求 3m 170 2n
无需求 m 120 n
已知调查了400个学校和150个自由开发者.
(Ⅰ)求m和n的值;
(Ⅱ)估计目标用户对该设备有需求的概率;
(Ⅲ)是否有99%的把握认为学校用户与非学校用户对该设备的需求情况有差异?附:.
P(χ2≥k) 0.1 0.01 0.001
k 2.706 6.635 10.828
24.新高考“3+3”模式中,考生除语文、数学、外语3门必考科目外,需从物理、化学、生物、政治、历史、地理这6门中自主选择3门作为选考科目,某研究机构为了解学生对全文(政治、历史、地理)的选择是否与性别有关,从某学校高一年级的1000名学生中随机抽取男、女生各25人进行模拟选科.经统计,选择全文的男生有5人,选择全文的女生有15人.
(1)估计高一年级的男生选择全文的概率;
(2)请完成下面的2×2列联表,并判断能否在犯错误的概率不超过0.005的前提下认为选择全文与性别有关.
选择全文 不选择全文 总计
男生
女生
总计
附表:
P(K2≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
(参考公式:,其中n=a+b+c+d)
25.某杂志社为了解杂志订阅者对某杂志冷色调与暖色调的封面设计偏好是否与他们的性别有关,随机调查并收集了100名该杂志订阅者对该杂志封面设计的色调偏好数据,同时记录了他们的性别,得到如表所示的列联表.
单位:人
性别 封面设计的色调 合计
冷色调 暖色调
男性 28
女性 32
合计 46
(1)请完成以上表格,并根据小概率值α=0.05的独立性检验,分析该杂志订阅者对该杂志封面设计的色调偏好是否与性别有关联;
(2)从这100名该杂志订阅者中随机抽取2名订阅者参加某读书会,用X表示这2名订阅者中女性的人数,求X的分布列和数学期望;
(3)用频率估计概率,从全国各地该杂志的所有订阅者中随机抽取部分订阅者参加书籍捐赠活动,从数学期望的角度考虑,若要使得被抽取的订阅者中偏好暖色调封面设计的人数至少为189,则至少应抽取多少名该杂志订阅者?
附:,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
26.西宁市第十四中学为高一、高二的学生开展了丰富的社团活动,共青团委员会的工作人员为研究学生的性别与喜欢烘焙社是否有关联.她随机从两个年级的男生和女生中各抽取了100名学生进行统计分析.并绘制了下列列联表.
喜欢烘焙社 不喜欢烘焙社 合计
男生 45 m 100
女生 n 35 100
合计 x y 200
(1)求m,n,x,y的值;
(2)根据小概率值α=0.005的独立性检验,能否认为喜欢烘焙社与性别有关联?
附:
α 0.15 0.10 0.05 0.025 0.010 0.005
xα 2.072 2.706 3.841 5.024 6.635 7.879

27.我校高二语文组对学生提出“读一本书”的要求,每个学生都选择且只能选择《红楼梦》和《三国演义》中的一本,现随机调查男、女生各100人,发现选择《三国演义》的有110人,其中女生占.
(1)补充完整下述2×2列联表,现按性别用分层抽样的方式从选择《红楼梦》的学生中抽取18人,求这18人中男生和女生的人数;
《红楼梦》 《三国演义》
男生
女生
合计
(2)根据小概率值P=0.001的独立性检验,能否认为学生选择《红楼梦》还是《三国演义》与性别有关?
参考公式:,其中n=a+b+c+d.参考数据:
P(k2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001
k0 2.706 3.841 5.024 6.635 7.879 10.828
28.为了研究体育锻炼对某年龄段的人患某种慢性病的影响,某人随机走访了200个该年龄段的人,得到的数据如下:
慢性病 体育锻炼 合计
经常 不经常
未患病 100 70 170
患病 10 20 30
合计 110 90 200
(1)定义分类变量X,Y如下:X,Y,以频率估计概率,求条件概率P(X=1|Y=0)与P(X=1|Y=1)的值;
(2)根据小概率值α=0.010的独立性检验,分析经常进行体育锻炼是否对患该种慢性病有影响.
附:χ2
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
29.某学生对其30位亲属的饮食习惯进行了一次调查,并用如图所示的茎叶图表示他们的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).
(1)根据茎叶图,帮助这位同学说明这30位亲属的饮食习惯.
(2)根据以上数据完成如下2×2列联表:
主食为蔬菜 主食为肉类 总计
50岁以下
50岁及以上
总计
(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关?
附表:
P(K2≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
(参考公式:,其中n=a+b+c+d.)
30.某县城为活跃经济,特举办传统文化民俗节,小张弄了一个套小白兔的摊位,设xi表示第i天的平均气温,yi表示第i天参与活动的人数,i=1,2, ,20,根据统计,计算得到如下一些统计量的值:.
(1)根据所给数据,用相关系数r(精确到0.01)判断是否可用线性同归模型拟合y与x的关系;
(2)现有两个家庭参与套圈,A家庭3位成员每轮每人套住小白兔的概率都为家庭3位成员每轮每人套住小白兔的概率分别为,每个家庭的3位成员均玩一次套圈为一轮,每轮每人收费30元,每个小白兔价值60元,且每人是否套住相互独立,以每个家庭的盈利的期望为决策依据,问:一轮结束后,哪个家庭损失较大?
附:相关系数.

展开更多......

收起↑

资源列表