湘教版选择性必修第二册2023版高中数学第4章 统计 学案(含解析)(6份打包)

资源下载
  1. 二一教育资源

湘教版选择性必修第二册2023版高中数学第4章 统计 学案(含解析)(6份打包)

资源简介

4.1 成对数据的统计相关性
新知初探·课前预习——突出基础性
教 材 要 点
要点一 相关关系
1.散点图:由坐标系及散点形成的数据图.
2.相关关系:如果两个变量之间的关系近似地表现为一条________,则称它们有线性相关关系,简称为相关关系.
3.函数关系:如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称它们线性相关,这实际上就是函数关系.
4.相关系数:一般地,对于n个成对观测数据(x1,y1),(x2,y2),…,(xn,yn),当数据{xi},{yi}(i=1,2,…,n)的标准差都不为0 时,我们称r==为{xi},{yi}的相关系数.
批注  当标准差为0时,数据{xi},{yi}(i=1,2,…,n)全部相同,表明数据离散程度为0.
5.相关系数的性质:
(1)rxy值范围是[-1,1].当0(2) |rxy|越接近于1时,变量x,y的线性相关程度越高 ,这时数据(x1,y1),(x2,y2),…,(xn,yn)分散在一条直线附近.
(3)|rxy|越接近于0时,变量x,y的线性相关程度________.
(4)rxy具有对称性,即rxy=ryx.
(5)rxy仅仅是变量x与y之间线性相关程度的一个度量.rxy=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.
批注  统计经验告诉我们,当rxy>0.8时,y有随着x的增加而增加的趋势,这时我们认为{xi}和{yi}是高度正相关的;当rxy<0.8时,y有随着x的增加而减少的趋势,这时我们认为{xi}和{yi}是高度负相关的.
要点二 相关系数与向量夹角
把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),向量夹角的大小可以用余弦来刻画,我们就用余弦来刻画两个向量的相关关系.
设a=(x1-x,x2-x,…,xn-x),b=(y1-y,y2-y,…,yn-y),从
而有cos 〈a,b〉== .
当夹角在[0,)内时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度越高;余弦值越小表示两个向量的夹角越大,两组数据的正相关程度越低.
当夹角在(,π]内时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度越低;余弦值越小表示两个向量的夹角越大,两组数据的负相关程度越高.
当夹角为时,余弦值为0,说明两组数据不相关.
批注  用两组成对数据表示的向量在原点处夹角的余弦值与相关系数公式本质上是一致的.
 基 础 自 测
1.判断正误(正确的画“√”,错误的画“×”)
(1)若两个变量正相关,则样本相关系数大于0小于1.(  )
(2)相关系数越大,两个变量的相关性就越强.(  )
(3)若相关系数r=0,则两变量x,y之间没有关系.(  )
2.下列两个量之间的关系是相关关系的是(  )
A.匀速直线运动中时间与位移的关系
B.学生的成绩和身高
C.儿童的年龄与体重
D.物体的体积和质量
3.若变量y与x之间的样本相关系数r=-0.983 2,则变量y与x之间(  )
A.具有很弱的线性相关关系
B.具有较强的线性相关关系
C.它们的线性相关关系还需要进一步确定
D.不确定
4.如图所示的两个变量具有相关关系的是________(填序号).
题型探究·课堂解透——强化创新性 
题型 1 线性相关关系
例1 某零售店近5个月的销售额和利润额资料如下表所示:
商店名称 A B C D E
销售额x/千万元 3 5 6 7 9
利润额y/百万元 2 3 3 4 5
(1)根据上表数据作出散点图;
(2)观察散点判断利润额y关于销售额x是否具有线性相关关系.如果具有线性相关关系,那么是正相关还是负相关?
方法归纳
两个变量是否线性相关的判断方法
巩固训练1 某个男孩的年龄与身高的统计数据如下表所示.
年龄x(岁) 1 2 3 4 5 6
身高y(cm) 78 87 98 108 115 120
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
题型 2 相关系数
例2 互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:
日期 1日 2日 3日 4日 5日
外卖甲日接单:x(百单) 5 2 9 8 11
外卖乙日接单:y(百单) 2 3 10 5 15
据统计表明,y与x之间具有线性相关关系,请用样本相关系数r对y与x之间的相关性强弱进行判断.(若|r|>0.8,则可认为y与x有较强的线性相关关系)
方法归纳
相关系数可以反映两个变量之间的线性相关程度,即散点集中于一条直线的程度,其符号反映了相关关系的正负性.用相关系数能够较准确的判断相关的程度.
巩固训练2 科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的简单随机样本数据,如下表:
x(年龄/岁) 26 56 39 49 61 53 27 58 41 60
y(脂肪含量/%) 14.5 31.4 21.2 26.3 34.6 29.6 17.8 33.5 25.9 35.2
根据上表中的样本数据,计算样本相关系数(精确到0.01),并推断它们的相关关系及相关程度.
参考数据及公式:xiyi=13 527.8,x=23 638,y=7 759.6,≈6.56,≈54.18,相关系数r=.
题型 3 多组成对数据的相关性
例3 某电器销售公司的管理人员认为,月销售收入是广告费用的函数.下面是该公司近8个月的月销售收入与广告费用数据,试分析其月销售收入与电视广告费用、月销售收入与报纸广告费用之间的相关关系.
月销售收入x/万元 电视广告费用y/万元 报纸广告费用z/万元
96 5 1.5
90 2 2
95 4 1.5
92 2.5 2.5
95 3 3.3
94 3.5 2.3
94 2.5 4.2
94 3 2.5
题型 4 相关系数与向量夹角
例4 用向量夹角分析例3中月销售收入与电视广告费用、月销售收入与报纸广告费用之间的相关关系.
4.1 成对数据的统计相关性
新知初探·课前预习
[教材要点]
要点一
2.直线
5. (1)正相关 负相关 (3)越低
[基础自测]
1.(1)√ (2)× (3)×
2.解析:A、D是函数关系;B是不相关关系;C是相关关系,故选C.
答案:C
3.解析:变量y与x之间的样本相关系数r=-0.983 2,|r|=0.983 2,接近1,样本相关系数的绝对值越大,相关性越强,
∴变量y与x之间有较强的线性相关关系,故选B.
答案:B
4.解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.
答案:②③
题型探究·课堂解透
例1 解析:(1)散点图如图所示:
(2)由散点图可知,所有散点接近一条直线排列,
所以利润额与销售额是线性相关关系,
由图可知当销售额增加时,利润额呈现增加的趋势,所以是正相关.
巩固训练1 解析:(1)散点图如图所示.
(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.
例2 解析:由题意知,x==7,
y==7,
样本相关系数r==≈0.857>0.8.
故可认为y与x有较强的线性相关关系.
巩固训练2 解析:x=(26+56+39+49+61+53+27+58+41+60)=47,
y=(14.5+31.4+21.2+26.3+34.6+29.6+17.8+33.5+25.9+35.2)=27,
r=

=,
因为≈6.56,≈54.18,
所以r=≈0.98,
由样本相关系数r≈0.98,可以推断人体脂肪含量和年龄的相关程度很强.
例3 解析:由题意可得x≈93.75,y≈3.187 5,z≈2.475,s=(xi-x)2=[(96-93.75)2+(90-93.75)2+…+(94-93.75)2]≈3.188,
s=(yi-y)2=[(5-3.187 5)2+(2-3.187 5)2+…+(3-3.187 5)2]≈0.809,
s=(zi-z)2=[(1.5-2.475)2+(2-2.475)2+…+(2.5-2.475)2]≈0.727,
sxy=- y=(96×5+90×2+…+94×3)-93.75×3.187 5≈1.297,
sxz=- z=(96×1.5+90×2+…+94×2.5)-93.75×2.475≈-0.031,
所以rxy==≈0.808,
rxz==≈-0.020.
上述结果表明月销售收入与电视广告费用之间正相关程度高,月销售收入与报纸广告费用之间呈负相关关系.
例4 解析:由于x≈93.75,y≈3.187 5,z≈2.475,将例3表中的三组数据分别减去x,y,z.
记x=(x1-x,x2-x,…,x8-x),y=(y1-y,y2-y,…,y8-y),z=(z1-z,z2-z,…,z8-z).
则可得
x=(2.25,-3.75,1.25,-1.75,1.25,0.25,0.25,0.25),
y=(1.812 5,-1.187 5,0.812 5,-0.687 5,-0.187 5,0.312 5,-0.687 5,-0.187 5),
z=(-0.975,-0.475,-0.975,0.025,0.825,-0.175,1.725,0.025),
于是有cos 〈x,y〉

≈0.808,
cos 〈x,z〉

≈-0.021.
由此可以看出,月销售收入与电视广告费用的余弦值较大,说明这两组数据正相关程度高;月销售收入与报纸广告费用的余弦值为负数,说明这两组数据呈负相关关系,且负相关程度较低.4.2.1 回归直线方程
新知初探·课前预习——突出基础性
教 材 要 点
要点一 回归分析
找出与散点图中各点散布趋势相似的直线,使各点经过或充分靠近该直线,这条直线叫作________,这条直线的方程叫作____________.由散点图求出回归直线并进行统计推断的过程叫作回归分析.
如果具有相关关系的两个变量x,y可用方程y=a+bx来近似刻画,则称它为y关于x的一元线性回归方程,其中a,b称为回归系数.
要点二 一元线性回归模型
当自变量x取值xi(i=1,2,…,n)时,将根据回归直线方程估计出的与实际观测值yi的误差,即yi-=yi-(xi)(i=1,2,…,n),称为随机误差,记作ei.把yi=xi+ei(i=1,2,…,n),这一描述因变量y如何依赖于自变量x和随机误差ei的方程称为一元线性回归模型.
批注  由于所有的样本点不共线,而只是散布在某条直线的附近,因此一元线性回归模型反映了表示成对样本数据的点散布于直线y=a+bx附近的线性相关关系.
要点三 最小二乘法
用随机误差的平方和即作为总随机误差来刻画各估计值与实际值之间的误差.若总随机误差最小,则这条直线就是所要求的回归直线.由于平方又叫二乘方,所以这种使“随机误差平方和最小”的方法叫作最小二乘法.
用最小二乘法求出的的计算公式为:
此时,用最小二乘法得到的回归直线方程为=x ,其中是回归直线在y轴上的截距,是回归直线的斜率
批注  回归直线一定过样本中心().
批注  当>0时,一元线性回归模型刻画了正线性相关关系;当<0,一元线性回归模型刻画了负线性相关关系.
基 础 自 测 
1.判断正误(正确的画“√”,错误的画“×”)
(1)线性回归方程适用于一切样本和总体.(  )
(2)样本取值的范围会影响线性回归方程的适用范围.(  )
(3)回归直线方程得到的预测值是预测变量的精确值.(  )
2.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归直线方程可能是(  )
A.=-10x+200 B.=10x+200
C.=-10x-200 D.=10x-200
3.根据如下样本数据,得到回归直线方程为=x,则(  )
x 4 5 6 7 8 9
y 5.0 3.5 0.5 1.5 -1.0 -2.0
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
4.已知x与y之间的一组数据,则y与x的回归直线方程=x+必过点________.
x 2 5 7 10
y 1 3 5 7
 题型探究·课堂解透——强化创新性
题型 1 求回归直线方程
例1 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x 6 8 10 12
y 2 3 5 6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程:=x+.
方法归纳
求回归直线方程的基本步骤
巩固训练1 对于数据组:
x 2 3 4 5
y 1.9 4.1 6.1 7.9
(1)作散点图,你能直观上得到什么结论?
(2)求回归直线方程.
题型 2 回归分析
例2 甲、乙、丙、丁四位同学各自对A,B两变量做回归分析,分别得到散点图与误差平方和如下表:
项目 甲 乙 丙 丁
散点图
随机误 差平方和 115 106 124 103
哪位同学的试验结果拟合A,B两变量关系的精度高?(  )
A.甲   B.乙   C.丙   D.丁
方法归纳
根据线性相关的知识可知,散点图中各样本点条状分布越均匀,同时保持随机误差的平方和越小,由回归分析建立的线性回归模型的拟合效果越好.
巩固训练2 根据一组样本数据(x1,y1),(x2,y2),…,(xn,yn)的散点图分析x与y之间具有线性相关关系,其回归直线方程为y=-0.42x+12,则在样本点(10,8.2)处的随机误差为(  )
A.8.2 B.0.4 C.7.8 D.0.42
4.2.1 回归直线方程
新知初探·课前预习
[教材要点]
要点一
回归直线 回归直线方程
[基础自测]
1.(1)× (2)√ (3)×
2.解析:∵y与x负相关,∴排除B,D,又∵C项中x>0时,<0不合题意,∴C错.故选A.
答案:A
3.解析:根据表中数据可知,随着x的增加y减小,故y与x是负相关,故回归直线斜率为负,故<0;再结合散点图以及直线的性质,根据x=4,5,6,7时y均为正可知回归直线当x=0时与y轴截距为正,故>0.故选B.
答案:B
4.解析:由数据可知:==6;==4,故线性回归方程必过点(6,4).
答案:(6,4)
题型探究·课堂解透
例1 解析:(1)依题意可得散点图如图所示:
(2)=6×2+8×3+10×5+12×6=158,
==9,==4,
=62+82+102+122=344,
===0.7,==4-0.7×9=-2.3,
故回归直线方程为=0.7x-2.3.
巩固训练1 解析:(1)
由图知:两个变量呈线性关系且正相关.
(2)由数据知:==3.5,
==5,
=2×1.9+3×4.1+4×6.1+5×7.9=80,=54,
所以===2,令y=x+,则=5-2×3.5=-2,
综上,回归直线方程为y=2x-2.
例2 解析:根据线性相关的知识可知,散点图中各样本点条状分布越均匀,同时保持误差平方和越小,由回归分析建立的线性回归模型的拟合效果越好.因此,由试验结果知,丁精确度高一些.故选D.
答案:D
巩固训练2 解析:在回归直线方程y=-0.42x+12中,当x=10时,y=7.8,所以在样本点(10,8.2)处的随机误差为8.2-7.8=0.4.故选B.
答案:B4.2.2 一元线性回归模型的应用
新知初探·课前预习——突出基础性
教 材 要 点
要点一 运用一元线性回归模型思想解决实际问题的基本步骤
1.确定研究对象,明确哪个变量是因变量,哪个变量是自变量;
2.运用相关系数的计算公式,分析自变量与因变量之间的关系;
3.运用最小二乘法原理估计一元线性回归方程的系数,建立一元线性回归方程;
4.根据一元线性回归方程进行预测.
要点二 非线性回归
当样本点并没有分布在某条直线附近时,不能直接利用线性回归模型来刻画两个变量之间的关系,这就需要选择一个比较合适的代换变量,将原始数据进行代换,目的是把变量间的非线性关系转化为近似的线性关系,然后用建立线性回归方程的方法确定直线方程.
基 础 自 测 
1.判断正误(正确的画“√”,错误的画“×”)
(1)任何两个变量都可以用一元线性回归关系进行合理的描述.(  )
(2)对于一个样本,用最小二乘法估计得到的一元线性回归方程参数估计值是唯一的.(  )
(3)任何两个相关关系的变量经过变换后都可以化为一元线性回归关系.(  )
2.在某线性回归分析中,已知数据满足线性回归方程=x+,并且由观测数据算得=5,=56,=10.5,则当x=10时,预测数值为(  )
A.108.5 B.210
C.140 D.210.5
3.若某销售人员的提成y(元)关于销售业绩x(千元)的线性回归方程为=50+80x,则下列判断正确的是(  )
A.销售业绩为1 000元时,提成一定是130元
B.销售业绩每提高1 000元,则提成约提高80元
C.销售业绩每提高1 000元,则提成约提高130元
D.当提成为120元时,销售业绩约为2 000元
4.为了解某社区居民的家庭年收入x与年支出y的关系,随机调查了该社区5户家庭,依据统计数据得到回归直线方程=0.76x+0.4,据此估计,该社区一户收入为15万元家庭年支出为________万元.
题型探究·课堂解透——强化创新性 
题型 1 线性回归方程的应用
例1 某书店刚刚上市了《中国古代数学史》,销售前该书店拟定了5种单价进行试销,每种单价x(元)试销1天,得到如表单价x(元)与销量y(册)数据:
单价x(元) 18 19 20 21 22
销量y(册) 61 56 50 48 45
(1)根据表中数据,请建立y关于x的回归直线方程;
(2)预计今后的销售中,销量y(册)与单价x(元)服从(1)中的回归方程,已知每册书的成本是12元,书店为了获得最大利润,该册书的单价应定为多少元?
方法归纳
若已知y与x是线性相关关系,则可求出回归方程进行估计和预测.否则,若两个变量不具备相关关系或它们之间的相关关系不显著,即使求出回归方程也毫无意义.
巩固训练1 某公司为提高市场销售业绩,促进某产品的销售,随机调查了该产品的月销售单价x(单位:元/件)及相应月销售量y(单位:万件),对近5个月的月销售单价xi和月销售量yi(i=1,2,3,4,5)的数据进行了统计,得到如下表数据:
月销售单价xi(元/件) 10 15 20 25 30
月销售量为yi(万件) 11 10 8 6 5
(1)求y关于x的回归直线方程;
(2)利用(1)的回归方程,当该产品月销售单价为x=35元/件,月销售量y的预测值为多少?
题型 2 非线性回归方程的应用
例2 科研人员在研制新冠肺炎疫苗过程中,利用小白鼠进行接种实验,现收集了小白鼠接种时的用药量x(单位:毫克)和有效度y的7组数据,得到如下散点图及其统计量的值:
(1)根据散点图判断,y=a+bx与y=c+dx2哪一个更适合作为有效度y与用药量x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)若要使有效度达到75,则用药量至少为多少毫克?
方法归纳
求非线性回归方程的步骤
巩固训练2 在一次抽样调查中测得样本的5个样本点,数值如下表:
x 0.25 0.5 1 2 4
y 16 12 5 2 1
试建立y与x之间的线性回归方程.
4.2.2 一元线性回归模型的应用
新知初探·课前预习
[基础自测]
1.(1)× (2)√ (3)×
2.解析:线性回归方程=x+中,x=5,y=56,=10.5,
∴=y-x=56-10.5×5=3.5,
∴线性回归方程为=10.5x+3.5,
当x=10时,预测数值=10.5×10+3.5=108.5.故选A.
答案:A
3.解析:由线性回归方程=50+80x,可知销售业绩每提高1 000元,则提成约提高80元.故选B.
答案:B
4.解析:令x=15,所以=0.76×15+0.4=11.8.
答案:11.8
题型探究·课堂解透
例1 解析:(1)由表格数据知:x==20,y==52,
∴===-4,=52+4×20=132,
∴y关于x的回归直线方程为=-4x+132.
(2)设获得的利润为W,则W=(x-12)y=(x-12)(-4x+132)=-4x2+180x-1 584,
∴当x=-=22.5(元)时,W取得最大值,
即为了获得最大利润,该册书的单价应定为22.5元.
巩固训练1 解析:(1)x==20,y==8,
===-,
=8+×20=,
所以y关于x的回归直线方程为y=-x+.
(2)当x=35时,y=-×35+=,
所以当该产品月销售单价为x=35元/件,月销售量y的预测值为万件.
例2 解析:(1)由散点图知,y与x是非线性相关关系,所以y=c+dx2更适合作为有效度y与用药量x的回归方程类型.
(2)令ωi=x,则y=c+dω,
∴===1.6,
=y-ω=13.4-1.6×10.5=-3.4,
∴=-3.4+1.6ω,
故y关于x的回归方程为=-3.4+1.6x2.
(3)当=75时,有75=-3.4+1.6x2,解得x=7,
故要使有效度达到75,则用药量至少为7毫克.
巩固训练2 解析:作出变量y与x之间的散点图,如图所示.
由图可知变量y与x近似地呈反比例函数关系.
设y=,令t=,则y=kt.
由y与x的数据表可得y与t的数据表:
t 4 2 1 0.5 0.25
y 16 12 5 2 1
作出y与t的散点图,如图所示:
由图可知y与t近似地呈线性相关关系.
又t=1.55,y=7.2,=94.25,=21.312 5,
==≈4.134 4,
=y-t=7.2-4.134 4×1.55≈0.8,∴=4.134 4t+0.8.
所以y与x的线性回归方程是=+0.8.第1课时 独立性检验(1)
新知初探·课前预习——突出基础性
教 材 要 点
要点一 列联表
1.定义:将两个(或两个以上)分类变量 进行交叉分类得到的频数分布表称为列联表.
2.2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1 y2 合计
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
批注  分类变量是说明事物类别的一个名称,其取值是分类依据.如“性别”是一个分类变量,其变量值为“男”或“女”.
要点二 独立性检验
利用统计量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为独立性检验.
χ2=,其中n=a+b+c+d.
当χ2的取值较大时,表示假设H0不成立 .一般地,若χ2的观测值x0≥6.635,说明H0不成立,从而认为两个分类变量有关系,这种推断犯错误的概率不超过0.01.
批注  χ2取值越大,则变量X与Y不独立,χ2取值越小,则变量X与Y独立,X与Y不具有关联性.
基 础 自 测 
1.判断正误(正确的画“√”,错误的画“×”)
(1)列联表中的数据是两个事件的频数.(  )
(2)事件A与B的独立性检验无关,即两个事件互不影响.(  )
(3)χ2的大小是判断事件A与B是否相关的统计量.(  )
2.为调查中学生近视情况,测得某校150名男生中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力(  )
A.回归分析 B.均值与方差
C.独立性检验 D.概率
3.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是(  )
A.吸烟,不吸烟
B.患病,不患病
C.是否吸烟,是否患病
D.以上都不对
4.下面是一个2×2列联表,则表中a处的值为________.
y1 y2 合计
x1 a b 73
x2 2 25 c
合计 d 46
 题型探究·课堂解透——强化创新性
题型 1 随机变量χ2的意义
例1 关于随机变量χ2的叙述,下列说法错误的是(  )
A.χ2是一个不连续的随机变量
B.χ2的观测值越大,说明两分类变量X与Y的关系越强
C.χ2的观测值越大,说明“两分类变量X与Y有关系”这一结论的可信度越大
D.当χ2的观测值接近0时,应该接受“两个分类变量X与Y无关”这一假设
巩固训练1 对于分类变量X与Y的随机变量χ2的值,下列说法正确的是(  )
A.χ2越大,“X与Y有关系”的可信程度越小
B.χ2越小,“X与Y有关系”的可信程度越小
C.χ2越接近于0,“X与Y没有关系”的可信程度越小
D.χ2越大,“X与Y没有关系”的可信程度越大
题型 2 随机变量χ2的应用
例2 某中学为了解2022届高二学生的性别和喜爱游泳是否有关,对100名高二学生进行了问卷调查,得到如下列联表:
喜欢游泳 不喜欢游泳 总计
男生 10
女生 20
总计
已知从这100人中随机抽取1人,抽到喜欢游泳的学生的概率为.
(1)请将上述列联表补充完整;
(2)试根据上述数据判断“喜欢游泳”与“性别”是否有关系.
方法归纳
利用χ2判断两个分类变量是否有关系的步骤
巩固训练2 为了解高中生作文水平与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到如下调查结果:
作文水平较高 作文水平一般 合计
课外阅读量较大 22 10 32
课外阅读量一般 8 20 28
合计 30 30 60
试根据上述数据判断“作文水平”与“课外阅读量”是否有关系.
第1课时
新知初探·课前预习
[基础自测]
1.(1)√ (2)× (3)√
2.解析:“近视”与“性别”是两个分类变量,检验其是否有关,应用独立性检验判断.故选C.
答案:C
3.解析:“是否吸烟”是分类变量,它的两个不同取值:吸烟和不吸烟.“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A,B都是一个分类变量所取的两个不同值.故选C.
答案:C
4.解析:依题意得b=46-25=21,a=73-b=52.
答案:52
题型探究·课堂解透
例1 解析:两个分类变量取值是离散的,所以χ2的观测值越大,“X与Y有关系”这一结论的可信度越大,而不是“两分类变量X与Y有关系”的程度越大,故选C.
答案:C
巩固训练1 解析:根据独立性检验的基本思想可知,分类变量X与Y的随机变量χ2的观测值越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大;χ2越小,“X与Y有关系”的可信程度越小,“X与Y没有关系”的可信程度越大,故ACD错误,B正确.故选B.
答案:B
例2 解析:(1)因为在100人中随机抽取1人抽到喜欢游泳的学生的概率为,
所以喜欢游泳的学生人数为100×=60.
其中女生有20人,男生有40人,列联表补充如下:
喜欢游泳 不喜欢游泳 合计
男生 40 10 50
女生 20 30 50
总计 60 40 100
(2)假设H0:喜欢游泳与性别没有关系,
根据列联表中的数据得:χ2==≈16.67.
由于16.67>6.635,故否定假设H0,所以认为喜欢游泳与性别有关系.
巩固训练2 解析:假设H0:作文水平与课外阅读量没有关系
χ2=≈9.643,
由于9.643>6.635,故否定假设H0,所以认为作文水平与课外阅读量有关系.第2课时 独立性检验(2)
新知初探·课前预习——突出基础性
教 材 要 点
要点 独立性检验的过程
独立性检验的步骤如下:
(1)提出统计假设H0:X与Y之间没有关系;
(2)利用公式χ2=计算χ2的观测值;
(3)查临界值表 确定临界值,然后作出判断.
批注  (1)如果χ2>10.828,就有不少于99.9%的把握认为“X与Y之间有关系”;(2)如果χ2>6.635,就有不少于99%的把握认为“X与Y之间有关系”;(3)如果χ2>3.841,就有不少于95%的把握认为“X与Y之间有关系”,如果χ2≤3.841,就认为还没有充分的证据显示“X与Y之间有关系”.
基 础 自 测 
1.下列选项中,可以有95%以上的把握认为“A与B有关系”的是(  )
A.χ2=2.700 B.χ2=2.710
C.χ2=3.765 D.χ2=5.014
2.在研究肥胖与高血压的关系时,通过收集数据、整理分析数据得到“高血压与肥胖有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是(  )
A.在100个高血压患者中一定有肥胖的人
B.在100个肥胖的人中至少有99人患有高血压
C.在100个高血压患者中可能没有肥胖的人
D.肥胖的人至少有99%的概率患有高血压
3.为了考察某种药物预防疾病的效果,进行动物试验后得到如下数据.经过计算得χ2≈6.979,根据χ2临界值表,可以认为该种药物对预防疾病有效果的把握为________.
患病 未患病 合计
服用药 10 46 56
未服用药 22 32 54
合计 32 78 110
题型探究·课堂解透——强化创新性 
题型 1 两个变量的独立性检验
例1 随着互联网的发展,网络已成为人们日常学习、工作和生活不可或缺的部分,互联网在带给人们生活便捷与高效工作的同时,网络犯罪也日益增多,为了防范网络犯罪与网络诈骗,学校举办“网络安全宣传倡议”活动.学校从全体学生中随机抽取了200人对“网络安全宣传倡议”的了解情况进行问卷调查,统计结果如下表所示:
男 女 合计
了解 70 125
不了解 45
合计
(1)根据所提供数据,完成2×2列联表;
(2)判断是否有95%的把握认为对“网络安全宣传倡议”的了解情况与性别有关.
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
P(χ2≥x0) 0.10 0.05 0.010 0.005
x0 2.706 3.841 6.635 7.879
方法归纳
(1)先利用χ2=求出χ2的值.再利用临界值表来判断有多大的把握判断两个事件有关.
(2)解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.
巩固训练1 瓜子是一种深受大家喜爱的零食.某炒货店一个月(30天)内不同口味的瓜子的销售情况如下表:
成本(元/ 公斤) 售价(元/ 公斤) 日销量超过50 公斤的天数 日销量不超过 50公斤的天数
原味瓜子 6 8 13 17
焦糖味瓜子 7 10 21 9
根据上表,有多大的把握认为瓜子的日销售量与口味有关系?
题型 2 独立性检验的综合应用
例2 为响应国家在《“十四五”工业绿色发展规划》中提出的“推动绿色发展,促进人与自然和谐共生”理念,某企业计划生产一批太阳能电池板,现有甲、乙两种生产工艺可供选择.为了解两种生产工艺所生产的电池板的质量情况,从中各随机抽取100件进行质量检测,得到如下所示的频率分布直方图.
并规定:
综合得分 [70,85) [85,100]
质量等级 二等品 一等品
(1)从这100个甲工艺所生产的电池板中按质量等级分层抽样抽取4个,再从这4个中随机抽取2个做进一步研究,求恰有1个质量等级为一等品电池板的概率;
(2)根据频率分布直方图完成下面的2×2列联表,并判断是否有99%的把握认为电池板的质量等级与生产工艺有关?
一等品 二等品
甲生产工艺
乙生产工艺
方法归纳
(1)独立性检验问题常与统计、概率相结合,解题时一定要认真审题,找出各数据的联系.
(2)解决独立性检验的应用问题时,一定要按照独立性检验的步骤得出结论.
巩固训练2 相对于二维码支付,刷脸支付更加便利,以往出门一部手机解决所有,现在连手机都不需要了,毕竟手机支付还需要携带手机,打开“扫一扫”也需要手机信号和时间,从而刷脸支付可能将会替代手机支付,成为新的支付方式,现从某大型超市门口随机抽取100名顾客进行调查,得到了如下列联表:
男性 女性 总计
刷脸支付 25 70
非刷脸支付 10
总计 100
(1)请将上面的列联表补充完整,并分别估计男性、女性在该超市消费后使用刷脸支付的概率;
(2)请根据以上数据判断是否有99%的把握认为顾客是否使用刷脸支付与性别有关.
第2课时
新知初探·课前预习
[基础自测]
1.解析:5.014>3.841,故正确.故选D.
答案:D
2.解析:因为在犯错误的概率不超过0.01的前提下认为这个结论是成立的,得有99%的把握认为“高血压与肥胖有关”,只是结论成立的可能性,与有多少个人患高血压无关,更谈不上概率,A,B,D不正确,C正确.故选C.
答案:C
3.解析:∵χ2≈6.979>6.635,
∴有99%的把握认为该种药物对预防疾病有效果.
答案:99%
题型探究·课堂解透
例1 解析:(1)根据题意,得到2×2列联表为
男 女 合计
了解 70 55 125
不了解 30 45 75
合计 100 100 200
(2)提出假设H0:对“网络安全宣传倡议”的了解情况与性别无关,
根据列联表中数据,
可以求得χ2===4.8,
因为当H0成立时,P(χ2≥3.841)≈0.05,这里的χ2=4.8>3.841,
所以我们有95%的把握认为对“网络安全宣传倡议”的了解情况与性别有关.
巩固训练1 解析:提出统计假设H0:瓜子的日销售量与口味无关联.
由表格中的数据,可得χ2=≈4.344>3.841,
查临界值表可知,有95%的把握认为瓜子的日销售量与口味有关系.
例2 解析:(1)从这100个甲工艺所生产的电池板中,二等品的个数为100×0.05×5=25(个),
一等品的个数为100×0.15×5=75(个),
从这100个甲工艺所生产的电池板中按质量等级分层抽样抽取4个,
这4个中质量等级为一等品的个数为4×=3,分别记为A、B、C,
质量等级为二等品的个数为1,记为a,
从这4个中随机抽取2个,所有的基本事件为:AB、AC、Aa、BC、Ba、Ca,共6种,
其中,事件“所抽取的2个中恰有1个质量等级为一等品电池板”所包含的基本事件为:Aa、Ba、Ca,共3种,
故所求概率为P==.
(2)2×2列联表如下表所示:
一等品 二等品
甲生产工艺 75 25
乙生产工艺 45 55
所以χ2==18.75>6.635,
所以由临界值表可知有99%的把握认为电池板的质量等级与生产工艺有关.
巩固训练2 解析:(1)列联表补充为
男性 女性 总计
刷脸支付 45 25 70
非刷脸支付 10 20 30
总计 55 45 100
男性在该超市消费后使用刷脸支付的概率约为=,
女性在该超市消费后使用刷脸支付的概率约为=.
(2)由列联表可得χ2=≈8.129>6.635,
所以由临界值表可知有99%的把握认为顾客是否使用刷脸支付与性别有关.章末复习课
知识网络·形成体系
考点聚焦·分类突破 
考点一 回归分析思想的应用
1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为:通过散点图和经验选择回归方程的类型,然后通过一定的规则确定出相应的回归方程,通过一定的方法进行检验,最后应用于实际或对预报变量进行预测.
2.通过对回归分析思想的应用的考查,提升学生的数学建模、数据分析核心素养.
例1 人类社会正进入数字时代,网络成为了生活中必不可少的工具,智能手机也给我们的生活带来了许多方便.但是这些方便又时尚的手机,却也让我们的眼睛离健康越来越远.为了解手机对视力的影响程度,某研究小组在经常使用手机的大学生中进行了随机调查,并对结果进行了换算,统计了大学生一个月中平均每天使用手机的时间x(单位:h)和视力损伤指数y的数据如下表:
平均每天使用手机的时间x(h) 1 2 3 4 5 6 7
视力损伤指数y 2 5 8 12 15 19 23
(1)根据表中数据,求y关于x的线性回归方程=x+;
(2)该小组研究得知:视力的下降值t与视力损伤指数y满足函数关系式t=+0.05,如果小明在一个月中平均每天使用9个小时手机,根据(1)中所建立的回归方程估计小明视力的下降值(结果保留一位小数).
考点二 独立性检验的应用
1.独立性检验研究的问题是有多大把握认为两个分类变量之间有关系.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变量是否有关系.独立性检验的思想是:可以先假设二者无关系,求统计量χ2的值,若χ2大于临界值,则拒绝假设,否则,接受假设.
2.通过对独立性检验的应用的考查,提升学生的数学运算、数据分析核心素养.
例2 我国政府加大了对全民阅读的重视程度,推行全民阅读工作,全民阅读活动在全国各地蓬勃发展,活动规模不断扩大,内容不断充实,方式不断创新,影响日益扩大,使我国国民素质得到了大幅度提高.某高中为响应政府号召,在寒假中对某校高二800名学生(其中男生480名)按性别采用分层随机抽样的方法抽取200名学生进行调查,了解他们每天的阅读情况如下表:
每天阅读时间低于1 h 每天阅读时间不低于1 h 总计
男生 60
女生 20
总计 200
(1)根据统计数据完成以上2×2列联表;
(2)依据(1)中的列联表,能否推断该校女生和男生在每天阅读时间方面存在差异?
(3)若从抽出的200名学生中按“每天阅读时间是否低于1 h”采用分层随机抽样抽取10名学生准备进行读写测试,在这10名学生中随机抽取3名学生,记这3名学生每天阅读时间不低于1 h的人数为X,求X的分布列和数学期望E(X).
附参考数据及公式:χ2=,
其中n=a+b+c+d.
P(χ2≥x0) 0.100 0.050 0.010 0.001
x0 2.706 3.841 6.635 10.828
章末复习课
考点聚焦·分类突破
例1 解析:(1)由表格中的数据可得
==4,
==12,
====3.5,
=12-3.5×4=-2,所以,回归直线方程为y=3.5x-2.
(2)小明的视力损伤指数为=3.5×9-2=29.5,
所以t=+0.05=+0.05≈0.3,估计小明视力的下降值为0.3.
例2 解析:(1)高二有800名学生(其中男生480名),则抽取200名学生中,男生有200×=120(名),女生有80名,
2×2列联表如下:
每天阅读时间低于1 h 每天阅读时间不低于1 h 总计
男生 60 60 120
女生 20 60 80
总计 80 120 200
(2)由(1)知:χ2==12.5>10.828,
所以由临界值表可知能推断该校女生和男生在每天阅读时间方面存在差异.
(3)200名学生中“每天阅读时间不低于1 h”的人数为120人,因此抽取10名学生“每天阅读时间不低于1 h”的人数为6人,而X的所有可能取值为0,1,2,3,
P(X=0)==,P(X=1)==, P(X=2)==,P(X=3)==,
所以X的分布列为
X 0 1 2 3
P
数学期望E(X)=0×+1×+2×+3×=1.8.

展开更多......

收起↑

资源列表