2025年高考数学一轮复习-10.4-列联表与独立性检验(课件+导学案)

资源下载
  1. 二一教育资源

2025年高考数学一轮复习-10.4-列联表与独立性检验(课件+导学案)

资源简介

(共40张PPT)
必备知识·逐点夯实
第四节 列联表与独立性检验
第十章 统计与成对数据的统计分析
核心考点·分类突破
【课标解读】
【课程标准】
1.通过实例,理解2×2列联表的统计意义.
2.通过实例,了解2×2列联表独立性检验及其应用.
【核心素养】
数学抽象、数据分析、数学运算.
【命题说明】
考向 考法 高考命题常以现实生活为载体,考查分类变量与列联表、独立性检验;
独立性检验是高考热点,常以解答题的形式出现.
预测 估计2025年高考仍会在独立检验上出题.
必备知识·逐点夯实
知识梳理·归纳
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,
这类随机变量称为分类变量.分类变量的取值可以用实数表示.
2.列联表与独立性检验
(1)2×2列联表
①2×2列联表给出了成对分类变量数据的__________________.
 交叉分类频数 
②定义一对分类变量X和Y,我们整理数据如表所示:
X Y 合计
Y=0 Y=1 X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
像这种形式的数据统计表称为2×2列联表.
(2)独立性检验
①定义:利用χ2的取值推断分类变量X和Y______________的方法称为χ2独立性检
验,读作“卡方独立性检验”.简称独立性检验.
②χ2=,其中n=a+b+c+d.
(3)独立性检验解决实际问题的主要环节
①提出零假设H0:X和Y相互独立,并给出在问题中的解释.
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
③根据检验规则得出推断结论.
④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响
规律.
 微思考 χ2值越大,说明分类变量x与y独立的可能性是大还是小
提示:χ2值越大,说明分类变量x与y独立的可能性越大.
 是否独立 

×
基础诊断·自测
类型 辨析 改编 易错
题号 1 2,3 4
1.(思考辨析)(正确的打“√”,错误的打“×”)
(1)2×2列联表中的数据是两个分类变量的频数.(   )
提示:(1)由2×2列联表可知,表中的数据是两个分类变量的频数,所以(1)正确.
(2)事件A和B的独立性检验无关,即两个事件互不影响.(   )
提示: (2)由独立性检验可知:事件A和B的独立性检验无关,说明事件A和B关联性
不大,不一定互不影响,所以(2)错误.

×
(3)χ2的大小是判断事件A和B是否相关的统计量.(   )
(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.(   )
提示: (4)在2×2列联表中,若|ad-bc|越小,说明卡方值越小,即两个分类变量之间
关系不强,所以(4)错误.
2.(选修第三册P134练习4改编)某课外兴趣小组通过随机调查,利用2×2列联表和χ2统计量研究数学成绩优秀是否与性别有关.计算得χ2=6.748,经查阅临界值表知P(χ2≥6.635)=0.010,则下列判断正确的是(  )
A.每100个数学成绩优秀的人中就会有1名是女生
B.若某人数学成绩优秀,那么他为男生的概率是0.010
C.有99%的把握认为“数学成绩优秀与性别无关”
D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”
【解析】选D.因为χ2=6.748≥6.635,所以有99%的把握认为“数学成绩优秀与性别有关”,即在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”.所以ABC错误.
3.(选修第三册P133例4改编)在研究吸烟是否对患肺癌有影响的案例中,通过对列联表的数据进行处理,计算得到随机变量χ2≈56.632.在犯错误的概率不超过0.001的前提下,下面说法正确的是(  )
A.因为随机变量χ2>10.828=x0.001,所以“吸烟与患肺癌有关系”,并且这个结论犯错误的概率不超过0.001
B.因为随机变量χ2>10.828,所以“吸烟与患肺癌有关系”,并且这个结论犯错误的概率不低于0.001
C.因为随机变量χ2>10.828,所以“吸烟与患肺癌没有关系”,并且这个结论犯错误的概率不超过0.001
D.因为随机变量χ2>10.828,所以“吸烟与患肺癌没有关系”,并且这个结论犯错误的概率不低于0.001
【解析】选A.由题意知,通过对列联表的数据进行处理,计算得到随机变量χ2≈56.632>10.828=x0.001,
所以在犯错误的概率不超过0.001的前提下,认为“吸烟与患肺癌有关系”.
4.(不理解独立性检验方法)已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在检验喜欢
某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到χ2=7.235,
则根据小概率值α=    的χ2独立性检验,分析喜欢该项体育运动与性别有
关.
【解析】因为6.635<7.235<10.828,所以根据小概率值α=0.01的χ2独立性检验,分
析喜欢该项体育运动与性别有关.
0.01
核心考点·分类突破
考点一分类变量与列联表
[例1](1)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高堆积条形图,最能体现该药物对预防禽流感有效果的图形是(  )
【解析】选D.在等高堆积条形图中,与相差很大时,我们认为两个分类变量有关系,在四个选项中(等高的条形图中),选项D中不服药样本中患病的频率与服药样本中患病的频率相差最大.
(2)如表是2×2列联表,则表中a,b的值分别为(  )
项目 y1 y2 合计
x1 a 8 35
x2 11 34 45
合计 b 42 80
A.27,38 B.28,38 C.27,37 D.28,37
【解析】选A.a=35-8=27,b=a+11=27+11=38.
解题技法
比较几个分类变量有关联的可能性大小的方法
(1)通过计算χ2的大小判断:χ2越大,两变量有关联的可能性越大.
(2)通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性越大.
(3)通过计算与的大小判断:相差越大,两变量有关联的可能性越大.
对点训练
1.(2023·莆田模拟)为考察A,B两种药物对预防某疾病的效果,进行动物试验,分别得到如下等高堆积条形图,根据图中信息,在下列各项中,说法最佳的一项是(  )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
【解析】选B.根据题干中两个等高堆积条形图知,药物A试验显示不服药与服药时患病差异较药物B试验显示明显大,所以药物A的预防效果优于药物B的预防效果.
2.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查,得到了如下的2×2列联表:
性别 打篮球 合计
喜爱 不喜爱 男生 6
女生 10
合计 48
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.请将上面的2×2列联表补充完整.
【解析】在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为,故喜爱打篮球的学生共有48×=32(人),因为喜爱打篮球的女生有10人,故喜爱打篮球的男生有22人,结合题意可知不喜爱打篮球的女生有48-32-6=10(人).列联表补充如下:
性别 打篮球 合计
喜爱 不喜爱 男生 22 6 28
女生 10 10 20
合计 32 16 48
考点二列联表与独立性检验
[例2](2022·全国甲卷改编)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
公司 准点情况 准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
【解析】(1)根据题中表格数据,A共有班次260次,准点班次有240次,
设A公司长途客车准点事件为M,
则P(M)==;
B共有班次240次,准点班次有210次,
设B公司长途客车准点事件为N,
则P(N)==.
所以A公司长途客车准点的概率为,
B公司长途客车准点的概率为.
考点二列联表与独立性检验
[例2](2022·全国甲卷改编)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
公司 准点情况 准点班次数 未准点班次数
A 240 20
B 210 30
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关
附:χ2=,
α 0.100 0.050 0.010
xα 2.706 3.841 6.635
【解析】(2)列联表
公司 准点情况 合计
准点班次数 未准点班次数 A 240 20 260
B 210 30 240
合计 450 50 500
χ2==≈3.205>2.706,
根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
解题技法
独立性检验的一般步骤
(1)根据样本数据制成2×2列联表.
(2)根据公式χ2=计算χ2的值.
(3)比较χ2与临界值xα的大小关系,作统计推断.
对点训练
为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表:(单位:人)
年龄段 认知情况 合计
知晓 不知晓 A组(90后与00后) 75 25 100
B组(70后与80后) 45 55 100
合计 120 80 200
(1)若从样本内知晓“绿色消费”意义的120人中用比例分配的分层随机抽样方法随机抽取16人,问:应在A组、B组中各抽取多少人
【解析】(1)由题意知,在A组中抽取的人数为16×=10.在B组中抽取的人数为16×=6.
对点训练
为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表:(单位:人)
年龄段 认知情况 合计
知晓 不知晓 A组(90后与00后) 75 25 100
B组(70后与80后) 45 55 100
合计 120 80 200
(2)能否依据小概率值α=0.001的独立性检验,分析对“绿色消费”意义的认知情况与年龄有关
【解析】(2)零假设为H0:对“绿色消费”意义的认知情况与年龄无关.
由题意,得χ2==18.75>10.828=x0.001,故依据小概率值α=0.001的独立性检验,推断H0不成立,即认为对“绿色消费”意义的认知情况与年龄有关.
考点三独立性检验的综合应用
[例3](2023·福州模拟)甲、乙两所学校高三年级分别有1 000人,1 100人,为了了解两所学校全体高三年级学生数学测试情况,采用分层随机抽样方法从两个学校一共抽取了105名学生的数学成绩,并作出了如下的频数分布统计表,规定考试成绩在[120,150]内为优秀.
分组 [70,80) [80,90) [90,100) [100,110)
甲校频数 1 2 9 8
乙校频数 2 3 10 15
1 分组 [110,120) [120,130) [130,140) [140,150]
甲校频数 10 10 x 3
乙校频数 15 y 3 1
(1)计算x,y的值;
【解析】(1)由题可知,采用分层随机抽样共抽取105人,1 000∶1 100=10∶11,所以甲校抽取105×=50(人),乙校抽取105×=55(人),
故1+2+9+8+10+10+x+3=50,解得x=7,
2+3+10+15+15+y+3+1=55,解得y=6;
考点三独立性检验的综合应用
[例3](2023·福州模拟)甲、乙两所学校高三年级分别有1 000人,1 100人,为了了解两所学校全体高三年级学生数学测试情况,采用分层随机抽样方法从两个学校一共抽取了105名学生的数学成绩,并作出了如下的频数分布统计表,规定考试成绩在[120,150]内为优秀.
(2)由以上统计数据填写下面2×2列联表,依据小概率值α=0.025的独立性检验,能否认为两个学校的数学成绩有差异 (注:x0.025=5.024)
数学成绩 学校 合计
甲校 乙校 优秀
非优秀
合计
分组 [70,80) [80,90) [90,100) [100,110)
甲校频数 1 2 9 8
乙校频数 2 3 10 15
1 分组 [110,120) [120,130) [130,140) [140,150]
甲校频数 10 10 x 3
乙校频数 15 y 3 1
【解析】(2)由频数分布表可得2×2列联表为
零假设H0:两个学校的数学成绩无差异,
所以χ2=≈6.109>5.024=α0.025,
依据小概率值α=0.025的独立性检验,我们推断H0不成立,即认为两个学校的数学成绩有差异.
数学成绩 学校 合计
甲校 乙校 优秀 20 10 30
非优秀 30 45 75
合计 50 55 105
解题技法
独立性检验解题策略
(1)分清分类变量是什么;
(2)计算χ2时注意运算顺序、运算技巧的应用;
(3)注意与其他统计知识的交汇运用.
对点训练
第五代移动通信技术简称5G或5G技术,是最新一代蜂窝移动通信技术,也是继4G系统之后的延伸.为了了解市民对A,B运营商的5G通信服务的评价,分别从A,B运营商的用户中随机抽取100名用户对其进行测评,已知测评得分在70分以上的为优秀,测评结果如下:
A运营商的100名用户的测评得分
得分 [40,50] (50,60] (60,70]
频率 0.18 0.23 0.3
得分 (70,80] (80,90] (90,100]
频率 0.24 0.03 0.02
B运营商的100名用户的测评得分
(1)根据频率分布直方图,分别求出B运营商的100名用户的测评得分的中位数和均值(同一组中的数据以该组区间的中点值为代表);
【解析】(1)由题中频率分布直方图可知B运营商测评得分在区间[40,70]的频率为(0.008+0.016+0.026)×10=0.5,
故B运营商测评得分的中位数为70;
由题中频率分布直方图可知B运营商测评得分的均值为45×0.08+55×0.16+65×
0.26+75×0.3+85×0.16+95×0.04=69.2.
(2)填写下面列联表,依据小概率值α=0.01的独立性检验,推断测评得分优秀是否与运营商有关.(x0.01=6.635)
运营商 测评得分 合计
优秀 非优秀 A
B
合计
【解析】(2)零假设H0:测评得分优秀与运营商无关.
由题中频率分布表可知A运营商测评得分优秀的有100×(0.24+0.03+0.02)=29(个),
非优秀的有100×(0.18+0.23+0.3)=71(个),
由题中频率分布直方图可知B运营商测评得分优秀的有(0.03+0.016+0.004)×
10×100=50(个),非优秀的有(0.008+0.016+0.026)×10×100=50(个),
则可得列联表如下:
运营商 测评得分 合计
优秀 非优秀 A 29 71 100
B 50 50 100
合计 79 121 200
则χ2=≈9.227,
因为9.227>6.635=x0.01,所以依据小概率值α=0.01的独立性检验,我们推断H0不成立,
即认为测评得分优秀与运营商有关.
谢谢观赏!!2025年高考数学一轮复习-10.4-列联表与独立性检验
【课标解读】
【课程标准】
1.通过实例,理解2×2列联表的统计意义.
2.通过实例,了解2×2列联表独立性检验及其应用.
【核心素养】
数学抽象、数据分析、数学运算.
【命题说明】
考向 考法 高考命题常以现实生活为载体,考查分类变量与列联表、独立性检验;独立性检验是高考热点,常以解答题的形式出现.
预测 估计2025年高考仍会在独立检验上出题.
【必备知识·逐点夯实】
知识梳理·归纳
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
2.列联表与独立性检验
(1)2×2列联表
①2×2列联表给出了成对分类变量数据的 交叉分类频数 .
②定义一对分类变量X和Y,我们整理数据如表所示:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
像这种形式的数据统计表称为2×2列联表.
(2)独立性检验
①定义:利用χ2的取值推断分类变量X和Y 是否独立 的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.
②χ2=,其中n=a+b+c+d.
(3)独立性检验解决实际问题的主要环节
①提出零假设H0:X和Y相互独立,并给出在问题中的解释.
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
③根据检验规则得出推断结论.
④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
 微思考χ2值越大,说明分类变量x与y独立的可能性是大还是小
提示:χ2值越大,说明分类变量x与y独立的可能性越大.
基础诊断·自测
类型 辨析 改编 易错
题号 1 2,3 4
1.(思考辨析)(正确的打“√”,错误的打“×”)
(1)2×2列联表中的数据是两个分类变量的频数.(  √ )
提示:(1)由2×2列联表可知,表中的数据是两个分类变量的频数,所以(1)正确.
(2)事件A和B的独立性检验无关,即两个事件互不影响.(  × )
提示: (2)由独立性检验可知:事件A和B的独立性检验无关,说明事件A和B关联性不大,不一定互不影响,所以(2)错误.
(3)χ2的大小是判断事件A和B是否相关的统计量.(  √ )
(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.(  × )
提示: (4)在2×2列联表中,若|ad-bc|越小,说明卡方值越小,即两个分类变量之间关系不强,所以(4)错误.
2.(选修第三册P134练习4改编)某课外兴趣小组通过随机调查,利用2×2列联表和χ2统计量研究数学成绩优秀是否与性别有关.计算得χ2=6.748,经查阅临界值表知P(χ2≥6.635)=0.010,则下列判断正确的是(  )
A.每100个数学成绩优秀的人中就会有1名是女生
B.若某人数学成绩优秀,那么他为男生的概率是0.010
C.有99%的把握认为“数学成绩优秀与性别无关”
D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”
【解析】选D.因为χ2=6.748≥6.635,所以有99%的把握认为“数学成绩优秀与性别有关”,即在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”.所以ABC错误.
3.(选修第三册P133例4改编)在研究吸烟是否对患肺癌有影响的案例中,通过对列联表的数据进行处理,计算得到随机变量χ2≈56.632.在犯错误的概率不超过0.001的前提下,下面说法正确的是(  )
A.因为随机变量χ2>10.828=x0.001,所以“吸烟与患肺癌有关系”,并且这个结论犯错误的概率不超过0.001
B.因为随机变量χ2>10.828,所以“吸烟与患肺癌有关系”,并且这个结论犯错误的概率不低于0.001
C.因为随机变量χ2>10.828,所以“吸烟与患肺癌没有关系”,并且这个结论犯错误的概率不超过0.001
D.因为随机变量χ2>10.828,所以“吸烟与患肺癌没有关系”,并且这个结论犯错误的概率不低于0.001
【解析】选A.由题意知,通过对列联表的数据进行处理,计算得到随机变量χ2≈56.632>10.828=x0.001,
所以在犯错误的概率不超过0.001的前提下,认为“吸烟与患肺癌有关系”.
4.(不理解独立性检验方法)已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到χ2=7.235,则根据小概率值α=    的χ2独立性检验,分析喜欢该项体育运动与性别有关.
【解析】因为6.635<7.235<10.828,所以根据小概率值α=0.01的χ2独立性检验,分析喜欢该项体育运动与性别有关.
答案:0.01
【核心考点·分类突破】
考点一分类变量与列联表
[例1](1)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高堆积条形图,最能体现该药物对预防禽流感有效果的图形是(  )
【解析】选D.在等高堆积条形图中,与相差很大时,我们认为两个分类变量有关系,在四个选项中(等高的条形图中),选项D中不服药样本中患病的频率与服药样本中患病的频率相差最大.
(2)如表是2×2列联表,则表中a,b的值分别为(  )
项目 y1 y2 合计
x1 a 8 35
x2 11 34 45
合计 b 42 80
A.27,38 B.28,38 C.27,37 D.28,37
【解析】选A.a=35-8=27,b=a+11=27+11=38.
解题技法
比较几个分类变量有关联的可能性大小的方法
(1)通过计算χ2的大小判断:χ2越大,两变量有关联的可能性越大.
(2)通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性越大.
(3)通过计算与的大小判断:相差越大,两变量有关联的可能性越大.
对点训练
1.(2023·莆田模拟)为考察A,B两种药物对预防某疾病的效果,进行动物试验,分别得到如下等高堆积条形图,根据图中信息,在下列各项中,说法最佳的一项是(  )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
【解析】选B.根据题干中两个等高堆积条形图知,药物A试验显示不服药与服药时患病差异较药物B试验显示明显大,所以药物A的预防效果优于药物B的预防效果.
2.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查,得到了如下的2×2列联表:
性别 打篮球 合计
喜爱 不喜爱
男生 6
女生 10
合计 48
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.请将上面的2×2列联表补充完整.
【解析】在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为,故喜爱打篮球的学生共有48×=32(人),因为喜爱打篮球的女生有10人,故喜爱打篮球的男生有22人,结合题意可知不喜爱打篮球的女生有48-32-6=10(人).列联表补充如下:
性别 打篮球 合计
喜爱 不喜爱
男生 22 6 28
女生 10 10 20
合计 32 16 48
考点二列联表与独立性检验
[例2](2022·全国甲卷改编)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
公司 准点情况
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
【解析】(1)根据题中表格数据,A共有班次260次,准点班次有240次,
设A公司长途客车准点事件为M,
则P(M)==;
B共有班次240次,准点班次有210次,
设B公司长途客车准点事件为N,
则P(N)==.
所以A公司长途客车准点的概率为,
B公司长途客车准点的概率为.
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关
附:χ2=,
α 0.100 0.050 0.010
xα 2.706 3.841 6.635
【解析】(2)列联表
公司 准点情况 合计
准点班次数 未准点班次数
A 240 20 260
B 210 30 240
合计 450 50 500
χ2==≈3.205>2.706,
根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
解题技法
独立性检验的一般步骤
(1)根据样本数据制成2×2列联表.
(2)根据公式χ2=计算χ2的值.
(3)比较χ2与临界值xα的大小关系,作统计推断.
对点训练
为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表:(单位:人)
年龄段 认知情况 合计
知晓 不知晓
A组(90后与00后) 75 25 100
B组(70后与80后) 45 55 100
合计 120 80 200
(1)若从样本内知晓“绿色消费”意义的120人中用比例分配的分层随机抽样方法随机抽取16人,问:应在A组、B组中各抽取多少人
【解析】(1)由题意知,在A组中抽取的人数为16×=10.在B组中抽取的人数为16×=6.
(2)能否依据小概率值α=0.001的独立性检验,分析对“绿色消费”意义的认知情况与年龄有关
【解析】(2)零假设为H0:对“绿色消费”意义的认知情况与年龄无关.
由题意,得χ2==18.75>10.828=x0.001,故依据小概率值α=0.001的独立性检验,推断H0不成立,即认为对“绿色消费”意义的认知情况与年龄有关.
考点三独立性检验的综合应用
[例3](2023·福州模拟)甲、乙两所学校高三年级分别有1 000人,1 100人,为了了解两所学校全体高三年级学生数学测试情况,采用分层随机抽样方法从两个学校一共抽取了105名学生的数学成绩,并作出了如下的频数分布统计表,规定考试成绩在[120,150]内为优秀.
分组 [70,80) [80,90) [90,100) [100,110)
甲校频数 1 2 9 8
乙校频数 2 3 10 15
分组 [110,120) [120,130) [130,140) [140,150]
甲校频数 10 10 x 3
乙校频数 15 y 3 1
(1)计算x,y的值;
【解析】(1)由题可知,采用分层随机抽样共抽取105人,1 000∶1 100=10∶11,所以甲校抽取105×=50(人),乙校抽取105×=55(人),
故1+2+9+8+10+10+x+3=50,解得x=7,
2+3+10+15+15+y+3+1=55,解得y=6;
(2)由以上统计数据填写下面2×2列联表,依据小概率值α=0.025的独立性检验,能否认为两个学校的数学成绩有差异 (注:x0.025=5.024)
数学成绩 学校 合计
甲校 乙校
优秀
非优秀
合计
【解析】(2)由频数分布表可得2×2列联表为
数学成绩 学校 合计
甲校 乙校
优秀 20 10 30
非优秀 30 45 75
合计 50 55 105
零假设H0:两个学校的数学成绩无差异,
所以χ2=≈6.109>5.024=α0.025,
依据小概率值α=0.025的独立性检验,我们推断H0不成立,即认为两个学校的数学成绩有差异.
解题技法
独立性检验解题策略
(1)分清分类变量是什么;
(2)计算χ2时注意运算顺序、运算技巧的应用;
(3)注意与其他统计知识的交汇运用.
对点训练
第五代移动通信技术简称5G或5G技术,是最新一代蜂窝移动通信技术,也是继4G系统之后的延伸.为了了解市民对A,B运营商的5G通信服务的评价,分别从A,B运营商的用户中随机抽取100名用户对其进行测评,已知测评得分在70分以上的为优秀,测评结果如下:
A运营商的100名用户的测评得分
得分 [40,50] (50,60] (60,70]
频率 0.18 0.23 0.3
得分 (70,80] (80,90] (90,100]
频率 0.24 0.03 0.02
B运营商的100名用户的测评得分
(1)根据频率分布直方图,分别求出B运营商的100名用户的测评得分的中位数和均值(同一组中的数据以该组区间的中点值为代表);
【解析】(1)由题中频率分布直方图可知B运营商测评得分在区间[40,70]的频率为(0.008+0.016+0.026)×10=0.5,
故B运营商测评得分的中位数为70;
由题中频率分布直方图可知B运营商测评得分的均值为45×0.08+55×0.16+65×0.26+75×0.3+85×0.16+95×0.04=69.2.
(2)填写下面列联表,依据小概率值α=0.01的独立性检验,推断测评得分优秀是否与运营商有关.(x0.01=6.635)
运营商 测评得分 合计
优秀 非优秀
A
B
合计
【解析】(2)零假设H0:测评得分优秀与运营商无关.
由题中频率分布表可知A运营商测评得分优秀的有100×(0.24+0.03+0.02)=29(个),
非优秀的有100×(0.18+0.23+0.3)=71(个),
由题中频率分布直方图可知B运营商测评得分优秀的有(0.03+0.016+0.004)×10×100=50(个),非优秀的有(0.008+0.016+0.026)×10×100=50(个),
则可得列联表如下:
运营商 测评得分 合计
优秀 非优秀
A 29 71 100
B 50 50 100
合计 79 121 200
则χ2=≈9.227,
因为9.227>6.635=x0.01,所以依据小概率值α=0.01的独立性检验,我们推断H0不成立,
即认为测评得分优秀与运营商有关.

展开更多......

收起↑

资源列表