第九章 9.3 成对数据的统计分析 课时练作业 ppt

资源下载
  1. 二一教育资源

第九章 9.3 成对数据的统计分析 课时练作业 ppt

资源简介

(共104张PPT)
简洁
实用
高效
第九章 统计与成对数据的统计分析
9.3 成对数据的统计分析
数学
内容索引
必备知识回顾
关键能力提升
第一部分
第二部分
考点1 成对数据的相关性
考点2 回归模型
01
02
考点3 独立性检验
03
课时作业
第三部分
1.了解样本相关系数的统计含义.
2.了解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.
自主学习·基础回扣
必备知识回顾




1.变量的相关关系
(1)相关关系:两个变量______,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)正相关、负相关:从整体上看,当一个变量增加时,另一个变量的相应值也呈现增加的趋势,我们称这两个变量______;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量______.
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在________附近,我们称这两个变量线性相关.
教材回扣
有关系
正相关
负相关
一条直线
2.样本相关系数
(2)当r>0时,称成对样本数据______;当r<0时,称成对样本数据______.
(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越__;当|r|越接近0时,成对样本数据的线性相关程度越__.
正相关
负相关


3.一元线性回归模型
(2)残差:观测值减去______所得的差称为残差.
预测值
4.列联表与独立性检验
(1)关于分类变量X和Y的抽样数据的2×2列联表:
X Y 合计
Y=0 Y=1 X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
是否独立
3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.
教材拓展
1.判断(正确的画“√”,错误的画“×”)
(1)散点图是判断两个变量相关关系的一种重要方法和手段.(   )
(3)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.(   )
(4)若事件X,Y关系越密切,则由观测数据计算得到的χ2的观测值越小.(   )
基础检测

×

×
2.某公司为了解用电量y(单位:kW·h)与气温x(单位:℃)之间的关系,随机统计了4天的用电量与当天气温,并制作了如下对照表:
气温x/℃ 18 13 10 -1
用电量y/(kW·h) 24 34 38 64
68
3.为了比较甲、乙、丙三组数据的线性相关性强弱,某同学分别计算了甲、乙、丙三组数据的样本相关系数,求得数值依次为0.57,-0.93,0.89,则这三组数据中,线性相关性最强的是__组数据.
解析:根据题意,因为样本相关系数的绝对值越大,线性相关性越强,由甲、乙、丙三组数据的样本相关系数分别为0.57,-0.93,0.89,得
|0.57|<|0.89|<|-0.93|,故乙组数据的线性相关性最强.

4.(人教A版选择性必修第三册P135T8改编)下面是一个2×2列联表:
则b-d=__,χ2=____________(保留小数点后三位).
X Y 合计
Y1 Y2 X1 a 21 70
X2 5 c 30
合计 b d 100
8
24.047
解析:补全2×2列联表:
X Y 合计
Y1 Y2 X1 49 21 70
X2 5 25 30
合计 54 46 100
互动探究·考点精讲
关键能力提升




考点1 成对数据的相关性
【例1】 (1)(2024·天津卷)下列图中,线性相关系数最大的是(   )
A
【解析】 观察题中4幅图可知,A图散点分布比较集中,且大体接近某一条直线,线性回归模型拟合效果比较好,呈现明显的正相关,|r|值相比于其他3幅图的更接近1.故选A.
(2)(多选)某服装生产商为了解青少年的身高和体重的关系,在15岁的男生中随机抽测了10人的身高和体重,数据如表所示:
编号 1 2 3 4 5 6 7 8 9 10
身高/cm 165 168 170 172 173 174 175 177 179 182
体重/kg 55 89 61 65 67 70 75 75 78 80
由表中数据制作成如图所示的散点图:
AC
规律总结
判定两个变量相关性的方法
(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.
(2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近1,相关性越强.
【对点训练1】 (1)(2024·四川凉山州三模)调查某校高三学生的身高x和体重y得到如图所示的散点图,其中身高x和体重y的样本相关系数r=0.825 5,则下列说法正确的是(   )
A.学生的身高和体重没有相关性
B.学生的身高和体重呈正相关
C.学生的身高和体重呈负相关
D.若从样本中抽取一部分数据,则这部分数据的样本相关系数一定是0.825 5
B
解析:由散点图可知,散点的分布集中在一条直线附近,所以学生的身高和体重具有相关性,A不正确;又身高x和体重y的样本相关系数为r=0.825 5,样本相关系数r>0,所以学生的身高和体重呈正相关,B正确,C不正确;从样本中抽取一部分数据,相关性可能变强,也可能变弱,所以这部分数据的样本相关系数不一定是0.825 5,D不正确.故选B.
(2)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:
身高x/cm 167 173 175 177 178 180 181
体重y/kg 90 54 59 64 67 72 76
由表格制作成如图所示的散点图:
A
考点2 回归模型
命题角度1 一元线性回归模型
【例2】 (2024·江西九江三模)车胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎胎面磨损.某实验室通过实验测得轿车行驶里程与某品牌轮胎凹槽深度的数据,如下表所示:
行驶里程 x/万千米 0.0 0.4 1.0 1.6 2.4 2.8 3.4 4.4
轮胎凹槽深度 h/毫米 8.0 7.8 7.2 6.2 5.6 4.8 4.4 4.0
(1)求该品牌轮胎凹槽深度h与行驶里程x的样本相关系数r,并判断二者之间是否具有很强的线性相关性.(结果保留两位有效数字)
(2)根据我国国家标准规定:轿车轮胎凹槽安全深度为1.6毫米(当凹槽深度低于1.6毫米时刹车距离增大,驾驶风险增加,必须更换新轮胎).某人在保养汽车时将小轿车的轮胎全部更换成了该品牌的新轮胎,请问:在正常行驶情况下,更换新轮胎后继续行驶约多少万千米需对轮胎再次更换?
命题角度2 非线性回归模型
【例3】 (2024·山东济南三模)近年来,我国众多新能源汽车制造企业迅速崛起.某企业着力推进技术革新,利润稳步提高.统计该企业2019年至2023年的利润(单位:亿元),得到如图所示的散点图.其中2019年至2023年对应的年份代码依次为1,2,3,4,5.
(1)根据散点图判断,y=a+bx和y=c+dx2哪一个适宜作为企业利润y(单位:亿元)关于年份代码x的回归方程类型;(给出判断即可,不必说明理由)
【解】 由散点图的变化趋势知,y=c+dx2适宜作为企业利润y(单位:亿元)关于年份代码x的回归方程类型.
(2)根据(1)中的判断结果,建立y关于x的经验回归方程;
(3)根据(2)的结果,估计2024年的企业利润.
规律总结
求经验回归方程的步骤
(2)已知①中的残差平方和S1≈3 610,②中的残差平方和S2≈658,请根据决定系数选择拟合效果更好的经验回归方程,并利用该经验回归方程预测年研发资金为20亿元时的年产值.
考点3 独立性检验
【例4】 (2025·八省联考)为考察某种药物A对预防疾病B的效果,进行了动物试验,得到如下列联表(单位:只):
服药情况 患病情况 合计
未患病 患病 未服用 100 80 s
服用 150 70 220
合计 250 t 400
(1)求s,t;
【解】由列联表知s=100+80=180,t=80+70=150.
(2)记未服用药物A的动物患疾病B的概率为P,给出P的估计值;
(3)根据小概率值α=0.01的独立性检验,能否认为药物A对预防疾病B有效?
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
【解】零假设为H0:药物A对预防疾病B无效.
由列联表得到
≈6.734>6.635,
根据小概率值α=0.01的独立性检验,推断H0不成立,即认为药物A对预防疾病B有效,该推断犯错误的概率不超过0.01,所以根据小概率值α=0.01的独立性检验,能认为药物A对预防疾病B有效.
规律总结
独立性检验的一般步骤
(1)根据样本数据制成2×2列联表.
(3)比较χ2与临界值的大小关系,作统计推断.
【对点训练3】 在中国的传统医学中,食物和药物一直被认为是相辅相成的.中医食疗是一门利用食物来调理身体和治疗疾病的科学,它将中草药的药效引入食物中,达到治病的目的.为了研究姜汤对治疗感冒是否更有效,进行了临床试验,得到如下数据:抽到服用姜汤的患者40名,其中30名痊愈,10名未痊愈;抽到服用白开水的患者60名,其中35名痊愈,25名未痊愈.
(1)根据上述信息完成下列2×2列联表:
疗法 疗效 合计
痊愈 未痊愈 服用姜汤
服用白开水
合计
解:根据题中信息完成2×2列联表如下:
疗法 疗效 合计
痊愈 未痊愈 服用姜汤 30 10 40
服用白开水 35 25 60
合计 65 35 100
(2)依据小概率值α=0.1的独立性检验,能否认为姜汤对治疗感冒更有效果?并解释得到的结论.
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
课时作业67




1.(5分)在以下4幅散点图中,y和x成正线性相关关系的是(   )
B
解析:对于A,由于散点图分散,估计y和x没有线性相关关系,故A错误;对于B,根据散点图集中在一条递增的直线附近,说明y和x线性相关且是正相关,故B正确;对于C,根据散点图集中在一条递减的直线附近,说明y和x线性相关且是负相关,故C错误;对于D,根据散点图集中在一条曲线附近,说明y和x非线性相关,故D错误.故选B.
2.(5分)(2024·广东茂名二模)已知变量x和y的统计数据如表:
D
x 1 2 3 4 5
y 6 6 7 8 8
3.(5分)(2024·广东广州二模)根据分类变量X与Y的成对样本数据,计算得到χ2=7.174.依据α=0.005的独立性检验,结论为(   )


A.变量X与Y独立
B.变量X与Y独立,这个结论犯错误的概率不超过0.005
C.变量X与Y不独立
D.变量X与Y不独立,这个结论犯错误的概率不超过0.005
解析:因为χ2=7.174<7.879=x0.005,所以依据α=0.005的独立性检验,我们认为变量X与Y独立.故选A.
A
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
D
A.b1>0 B.b2<0
C.|r1|<|r2| D.r1+r2<0
解析:由散点图可知,x与y负相关,v与u正相关,则b1<0,b2>0,故A,B错误;图中点(x,y)比(v,u)更加集中在一条直线附近,则|r1|>|r2|,又r1<0,r2>0,得r1+r2<0,故C错误,D正确.故选D.
5.(5分)(2024·四川广安二模)某公司收集了某商品销售收入y(单位:万元)与相应的广告支出x(单位:万元)共10组数据(xi,yi)(i=1,2,3,…,10),绘制出如下散点图,并利用线性回归模型进行拟合.
若将图中10个点中去掉A点后再重新进行线性回归分析,则下列说法正确的是(   )
A.决定系数R2变小
B.残差平方和变小
C.相关系数r的值变小
D.解释变量x与响应变量y相关性变弱
B
解析:从题图中可以看出A点较其他点偏离直线远,故去掉A点后回归效果更好,故决定系数R2会变大,更接近1,残差平方和变小,相关系数r的绝对值更接近1,由题图可得x与y正相关,故r会更接近1,即相关系数r的值变大,解释变量x与响应变量y相关性变强,故A,C,D错误,B正确.故选B.
6.(5分)(2024·山东枣庄一模)某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回地简单随机抽样的方法对治疗情况进行检查,得到两种疗法治疗数据的列联表:
疗法 疗效 合计
未治愈 治愈 甲 15 52 67
乙 6 63 69
合计 21 115 136
经计算得到χ2≈4.881,根据小概率值α=0.005的独立性检验(已知χ2独立性检验中x0.005=7.879),则可以认为(   )
A.两种疗法的效果存在差异
B.两种疗法的效果存在差异,这种判断犯错误的概率不超过0.005
C.两种疗法的效果没有差异
D.两种疗法的效果没有差异,这种判断犯错误的概率不超过0.005
解析:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.根据列联表中的数据,χ2≈4.881<7.879=x0.005,根据小概率值α=0.005的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两种疗法效果没有差异.故选C.
C
BCD
8.(6分)(多选)(2024·江西南昌二模)为了解中学生喜爱足球运动与性别是否有关,甲、乙两校的课题组分别随机抽取了本校部分学生进行调查,得到如下两个表格:
甲校样本
性别 足球运动 合计
喜爱 不喜爱 男性 15 5 20
女性 8 12 20
合计 23 17 40
乙校样本
性别 足球运动 合计
喜爱 不喜爱 男性 70 30 100
女性 45 55 100
合计 115 85 200
则下列判断中正确的是(   )
A.样本中,甲校男学生喜爱足球运动的比例高于乙校男学生喜爱足球运动的比例
B.样本中,甲校女学生喜爱足球运动的比例高于乙校女学生喜爱足球运动的比例
C.根据甲校样本有99%的把握认为中学生喜爱足球运动与性别有关
D.根据乙校样本有99%的把握认为中学生喜爱足球运动与性别有关
α 0.1 0.01 0.001
xα 2.706 6.635 10.828
AD
0.5
-0.3
0.98
11.(13分)某学校一个生物兴趣小组对学校的人工湖中养殖的某种鱼类进行观测研究,在饲料充足的前提下,兴趣小组对饲养时间x(单位:个月)与这种鱼类的平均体重y(单位:千克)得到一组观测值,如下表:
x 1 2 3 4 5
y 0.5 0.9 1.7 2.1 2.8
(2)利用(1)中的经验回归方程,分析饲养1~5个月这种鱼平均体重的变化情况,并预测饲养满12个月时,这种鱼的平均体重(单位:千克).
12.(16分)(2024·湖南邵阳三模)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数y与天数x的情况,对统计得到的样本数据(xi,yi)(i=1,2,…,10)作了初步处理,得到下面的散点图及一些统计量的值.
(1)依据散点图推断,y=bx+a与y=ebx+a哪一个更适合作为未佩戴头盔人数y与天数x的回归方程类型.(给出判断即可,不必说明理由)
解:依据散点图可以判断,y=ebx+a更适合作为未佩戴头盔人数y与天数x的回归方程类型.
(2)依据(1)的结果和上表中的数据求出y关于x的经验回归方程.
(3)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车的市民进行调查,得到如下列联表:
佩戴头盔 合计
性别 不佩戴 佩戴 女性 8 12 20
男性 14 6 20
合计 22 18 40
α 0.1 0.05 0.025 0.01 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
解:零假设H0:市民佩戴头盔与性别无关联.
根据列联表中的数据计算得
依据小概率值α=0.1的独立性检验,我们推断H0不成立,即认为市民佩戴头盔与性别有关联,此推断犯错误的概率不超过0.1.
A
A.48 B.54
C.60 D.66
解析:设男生人数为6n(n∈N*),因为被调查的男、女生人数相同,所以女生人数也为6n(n∈N*),根据题意列出列联表:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
是否喜欢冰雪运动 性别 合计
男生 女生 喜欢 5n 4n 9n
不喜欢 n 2n 3n
合计 6n 6n 12n
C
AD
x 1 2 3 4 5
y 10 m 6 n 2

展开更多......

收起↑

资源预览