人教A版高中数学选择性必修第三册第八章成对数据的统计分析8.3.1分类变量与列联表课件(共33张PPT)

资源下载
  1. 二一教育资源

人教A版高中数学选择性必修第三册第八章成对数据的统计分析8.3.1分类变量与列联表课件(共33张PPT)

资源简介

(共33张PPT)
第八章 成对数据的统计分析
8.3 列联表与独立性检验
8.3.1 分类变量与列联表
课程内容标准 学科素养凝练
  1.通过实例,理解2×2列联表的统计意义.
2.通过实例,了解2×2列联表独立性检验及其应用.   在学习分类变量和2×2列联表的过程中,提升数学抽象、数据分析、数学建模、数学运算的核心素养.
一、分类变量
1.分类变量:为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
2.取值:分类变量的取值可以用_____表示.
3.范围:本节主要讨论取值于_______的分类变量的关联性问题.
实数
{0,1}
二、2×2列联表
将如下表所示形式的数据统计表称为2×2列联表,它给出了成对分类变量数据的交叉分类频数.
性别 锻炼 合计
不经常(Y=0) 经常(Y=1)
女生(X=0) 192 331 523
男生(X=1) 128 473 601
合计 320 804 1 124
它包含了X和Y如下信息:最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;中间的四个格中的数是表格的核心部分,给出了事件{X=x,Y=y}(x,y=0,1)中样本点的个数;表中右下角的数是样本空间中样本点的______.
由古典概型和条件概率可知分类变量之间是否有影响,例P(Y=1|X=1)大于P(Y=1|X=0)可得性别对体育锻炼的经常性有影响.
总数
1.判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.
(1)分类变量中的变量与函数中的变量是同一概念.( )
(2)2×2列联表借助两个分类变量之间频率大小差异说明两个变量之间是否有关联关系. ( )
×

B
2.下列变量中不属于分类变量的是 (  )
A.性别      B.吸烟
C.宗教信仰 D.国籍
解析
“吸烟”不是分类变量,“是否吸烟”才是分类变量.
C
3.下表是关于分类变量X和Y的2×2列联表,表中a,b的值分别为 (  )
X Y 合计
y1 y2
x1 a 21 73
x2 22 25 47
合计 b 46 120
A.94,72  B.52,50  C.52,74  D.74,52
解析
a=73-21=52,b=120-46=74.
4.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是_______________________________________________.
答案 男正教授人数,男副教授人数,女正教授人数,女副教授人数
探究一 用2×2列联表分析两个分类变量的关系
在对人们饮食习惯的一次调查中,共调查了124人,其中60岁以上(含60岁)的有70人,60岁以下的有54人.60岁以上的人中有43人饮食以蔬菜为主,另外27人以肉类为主;60岁以下的人中有21人饮食以蔬菜为主,另外33人以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并判断二者是否有关系.

用Ω表示124个样本点构成的集合. 考虑以Ω为样本空间的古典概型.对于Ω中每一个人,定义分类变量X和Y如下:
将数据整理成如下2×2列联表.

饮食习惯 年龄 合计
60岁以上
(含60岁)
(Y=0) 60岁以下
(Y=1)
以蔬菜为主
(X=0) 43 21 64
以肉类为主
(X=1) 27 33 60
合计 70 54 124

[训练1] 假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:
X Y 合计
y1 y2
x1 10 18 28
x2 m 26 26+m
合计 10+m 44 54+m
当m取下列何值时,X与Y的关系最弱 (  )
A.8    B.9    C.14    D.19
C
解析
探究二 用等高堆积条形图分析两个分类变量的关系
[知能解读]
1.等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征.
2.观察等高堆积条形图发现两个变量的频率相差很大,就能判断两个分类变量之间有关系.
为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下表:
组别 尿棕色素 合计
阳性数
(Y=0) 阴性数
(Y=1)
铅中毒病人组
(X=0) 29 7 36
对照组(X=1) 9 28 37
合计 38 35 73
试画出列联表的等高堆积条形图,分析铅中毒病人组和对照组的尿棕色素阳性数有无差别,并判断铅中毒病人与尿棕色素为阳性是否有关系.

等高堆积条形图如下图:
由等高堆积条形图可以直观地看出,铅中毒病人组与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
[方法总结] 利用等高堆积条形图判断两个分类变量是否相关的步骤
C
[训练2] 下图是调查某地区男、女中学生是否喜欢理科的等高堆积条形图,阴影部分表示喜欢理科人数的百分比.从图中可以看出(  )
A.性别与喜欢理科无关
B.女生中喜欢理科的比例约为80%
C.男生比女生喜欢理科的可能性大些
D.男生中不喜欢理科的比例约为60%
解析
由题图可知,女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.
ACD
1.(多选题)给出下列实际问题,其中用等高堆积条形图可以解决的问题有 (   )
A.判断两种药物治疗同一种病是否有区别
B.计算吸烟者得肺病的概率
C.判断吸烟是否与性别有关系
D.判断网吧与青少年的犯罪是否有关系
解析
利用等高堆积条形图可以判断两个分类变量是否有关系,而选项B是概率问题,故选ACD.
2.下表是关于男婴与女婴出生时间调查的列联表:
性别 出生时间 合计
晚上 白天
男婴 45 A B
女婴 E 35 C
合计 98 D 180
那么,A=_________________________,        
B=_________________________,        
C=_________________________,        
D=_________________________,        
E=_________________________.        
答案 47 92 88 82 53 
解析
3.观察各图,其中两个分类变量X,Y之间关系最强的是________.(填图序号)
答案 ④
解析
题图④中两个深色条的高相差最明显,说明两个分类变量之间关系最强.
4.在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,请作出性别与色盲的列联表.

根据题目所给的数据作出的列联表如下:
性别 是否患色盲 合计
是 否
男 38 442 480
女 6 514 520
合计 44 956 1 000

展开更多......

收起↑

资源预览