4.3.2 独立性检验 课件(16页) 2025-2026学年人教B版2019高中数学选择性必修第二册

资源下载
  1. 二一教育资源

4.3.2 独立性检验 课件(16页) 2025-2026学年人教B版2019高中数学选择性必修第二册

资源简介

(共19张PPT)
4.3.2 独立性检验
第四章
1.了解2×2列联表、随机变量χ2的意义.
2.理解独立性检验中P(χ2≥k)的具体含义.
3.掌握独立性检验的方法和步骤,并能解决实际问题.
有关医学研究表明,心脏病、癌症、脑血管病、慢性阻塞性肺病等多种疾病都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.为此,世界卫生组织规定每年5月31日为世界无烟日.那么这些疾病与吸烟有怎样的关系呢?
为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了100人,得到如下结果(单位:人)
患肺癌 未患肺癌 总计
吸烟 39 15 54
不吸烟 21 25 46
总计 60 40 100
那么吸烟是否对患肺癌有影响?
这样列出的两个分类变量的频数表,称为列联表
72.22%
①初步估计:
在不吸烟者中患肺癌的比重是
在吸烟者中患肺癌的比重是
45.65%
结论:吸烟群体和不吸烟群体患肺癌的可能性存在差异.
问题:有多大把握认为吸烟和患肺癌有关?
患肺癌 未患肺癌 总计
吸烟 39 15 54
不吸烟 21 25 46
总计 60 40 100
现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”为此先假设:
H0:吸烟与患肺癌没有关系.
患肺癌 未患肺癌 总计
吸烟 a b a+b
不吸烟 c d c+d
总计 a+c b+d n=a+b+c+d
把表中的数字用字母代替,得到如下用字母表示的列联表
用A表示不吸烟,B表示不患肺癌,则“吸烟与患肺癌没有关系”等价于“吸烟与患肺癌相互独立”,即假设H0等价于 P(AB)=P(A)P(B).
A
B
在表中,a恰好为事件AB发生的频数;a+b和a+c恰好分别为事件A和B发生
的频数.由于频率接近于概率,所以在H0成立的条件下应该有:
P(AB)=pAB==0.39,P(B)=pB==0.21,P(A)=pA==0.15,P()=p==0.25,
P(A)=pA==0.54,P()=p==0.46,P(B)=pB==0.6,P()=p==0.4,
患肺癌 未患肺癌 总计
吸烟 a b a+b
不吸烟 c d c+d
总计 a+c b+d n=a+b+c+d
A
B
因为假设X,Y独立,所以μAB=|pAB-pApB|,μB=|pB-ppB|,μA=|pA-pAp|,μ=|p-pp|都相应比较小,用表示μAB,μB,μA,μ的总体大小,记
当的取值较小 时,表示假设H0成立,当的取值较大时,表示假设H0不成立.
经计算
这个取值是较大还是较小?
患肺癌 未患肺癌 总计
吸烟 39 15 54
不吸烟 21 25 46
总计 60 40 100
统计学家已经有明确的结论:如果2×2列联表中的两个分类变量X,Y是独立的,即在H0成立的情况下,且当随机调查的数据a,b,c,d都不小于5时,随机事件“χ2≥6.635”发生的概率约为0.01,即P(χ2≥6.635)≈0.01,
也就是说,在H0成立的情况下, χ2的观测值大于或等于6.635的概率非常小,近似于0.01. 即在H0成立的情况下,观测值超过6.635的概率不大于0.01.
7.307>6.635,所以我们有[1-P(χ2≥6.635)]×100%=99%的把握认为H0不,即认为吸烟与患肺癌之间有关系.
上面这种利用统计量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验.
独立性检验解决实际问题大致应包括以下几个主要环节:
(1)零假设 提出零假设X和Y相互独立,并给出在实际问题中的解释.
(2)计算χ 2 根据抽样数据整理出2×2列联表,计算的值χ2 .
(3)作比较 查临界值表确定临界值x0,然后作出判断.
常用显著性水平α以及对应的分位数k如下表.
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
常用显著性水平α以及对应的分位数k如下表.
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
①当≥时,我们就推断 H0 不成立,即认为X和Y不独立.
②当<时,我们没有充分证据推断 H0 不成立,可以认为X和Y独立.
该推断犯错误的概率不超过
例1 近年电子商务蓬勃发展,某年某网购平台“双11”一天的销售业绩高达1 682亿元人民币,平台对每次成功交易都有针对商品和快递是否满意的评价系统.从该评价系统中选出200次成功交易,并对其评价进行统计,网购者对商品的满意率为0.70,对快递的满意率为0.60,其中对商品和快递都满意的交易为80次.根据已知条件完成下面的2×2列联表,并回答能否在犯错误的概率不超过0.01的前提下认为“网购者对商品满意与对快递满意之间有关系”.
对快递满意 对快递不满意 总计
对商品满意 80
对商品不满意
总计 200
解:2×2列联表:
由于1.59<6.635,所以不能在犯错误的概率不超过0.01的前提下认为“网购者对商品满意与对快递满意之间有关系”.
对快递满意 对快递不满意 总计
对商品满意 80 60 140
对商品不满意 40 20 60
总计 120 80 200
例2 为了考察某种新疫苗预防疾病的作用,科学家对动物进行试验,所得数据(单位:只)如下表所示.
发 病 没发病 合 计
接种疫苗 8 15 23
没接种疫苗 18 9 27
合 计 26 24 50
能否作出接种疫苗与预防疾病有关的结论?
解: 提出统计假设H0:接种疫苗与预防疾病无关.
由于5.024<5.059<6.635,查临界值表可知,我们至少有97.5%的把握认为接种疫苗与预防疾病有关,即疫苗有效.
发 病 没发病 合 计
接种疫苗 8 15 23
没接种疫苗 18 9 27
合 计 26 24 50
1.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时,用什么方法最有说服力( )
A.平均数 B.方差
C.回归分析 D.独立性检验
2.若由一个2×2列联表中的数据计算得χ2=4.013,则有 的把握认为两个变量有关系.
D
α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
95%
3.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
无效 有效 总计
男性患者 15 35 50
女性患者 6 44 50
总计 21 79 100
则统计量χ2≈    (小数点后保留3位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为   .
4.882
5%

展开更多......

收起↑

资源预览