第七章 统计案例 章末检测(课件 练习)高中数学 北师大版(2019)选择性必修 第一册

资源下载
  1. 二一教育资源

第七章 统计案例 章末检测(课件 练习)高中数学 北师大版(2019)选择性必修 第一册

资源简介

章末检测(六) 统计案例
(时间:120分钟 满分:150分)
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列说法中正确的是(  )
A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义
B.独立性检验对两个变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义
C.相关关系可以对变量的发展趋势进行预测,这种预测可能会是错误的
D.独立性检验如果得出的结论有99%的可信度,就意味着这个结论一定是正确的
2.设线性回归方程为=-2+10x,则当变量x增加一个单位时(  )
A.y平均减少2个单位 B.y平均增加10个单位
C.y平均增加8个单位 D.y平均减少10个单位
3.设(x1,y1),(x2,y2),…,(xn,yn)是变量X和Y的n对样本数据,直线l是由这些数据通过最小二乘法得到的回归直线(如图),以下结论中正确的是(  )
A.直线l过点(,)
B.X和Y的相关系数为直线l的斜率
C.X和Y的相关系数在0到1之间
D.当n为偶数时,分布在l两侧的样本点的个数一定相同
4.对变量y和x进行线性相关检验,已知n 是观测值组数,r是相关系数,且已知:
①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.995 0.
则变量y和x线性相关程度最高的两组是(  )
A.①和② B.①和④
C.②和④ D.③和④
5.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是(  )
A.男人、女人中患色盲的频率分别为0.038,0.006
B.男、女患色盲的概率分别为,
C.男人中患色盲的比例比女人中患色盲的比例大,且有99%的把握认为患色盲与性别是有关的
D.不能说明患色盲与性别是否有关
6.已知相关变量x和y的散点图如图所示,若用y=b1·ln (k1x)与y=kx2+b2拟合时的相关系数分别为r1,r2,则比较r1,r2的大小结果为(  )
A.r1>r2 B.r1=r2
C.r1<r2 D.不确定
7.某考察团对全国十大城市的职工人均工资水平x(千元)与居民人均消费水平y(千元)进行统计调查,发现y与x具有线性相关关系,线性回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为(  )
A.86% B.72%
C.67% D.83%
8.在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢数学文化的人数占男生人数的,女生喜欢数学文化的人数占女生人数的,若有99%的把握认为是否喜欢数学文化和性别有关,则男生至少有(  )
A.24人 B.22人
C.20人 D.18人
二、多项选择题(本大题共3小题,每小题6分,共18分.在每小题给出的四个选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.某商品的销售量Y(件)与销售价格X(元/件)存在线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的线性回归方程为Y=-5X+150,则下列结论正确的是(  )
A.Y与X具有负的线性相关关系
B.若r表示Y与X之间的线性相关系数,则r=-5
C.当销售价格为10元/件时,销售量为100件
D.当销售价格为10元/件时,销售量为100件左右
10.下面关于χ2的说法错误的是(  )
A.χ2在任何相互独立的问题中都可以用于检验有关还是无关
B.χ2的值越大,两个事件的相关性就越大
C.χ2是用来判断两个分类变量是否相关的随机变量,当χ2的值很小时可以推定两类变量不相关
D.χ2的计算公式是χ2=
11.在对具有相关关系的两个变量进行回归分析时,若两个变量不呈线性相关关系,可以建立含两个待定参数的非线性模型,并引入中间变量将其转化为线性关系,再利用最小二乘法进行线性回归分析.下列选项为四个同学根据自己所得数据的散点图建立的非线性模型,且散点图的样本点均位于第一象限,则其中可以根据上述方法进行回归分析的模型有(  )
A.y=c1x2+c2x B.y=
C.y=c1+ln(x+c2) D.y=c1
三、填空题(本大题共3小题,每小题5分,共15分.把答案填在题中横线上)
12.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如表),由最小二乘法求得线性回归方程为=0.67x+54.9.
零件数x/个 10 20 30 40 50
加工时间y/min 62 75 81 89
现发现表中有一个数据看不清,请你推断出该数据的值为    .
13.已知由一组样本数据确定的线性回归方程为=1.5x+1,且=2,发现有两组数据(2.4,2.8)与(1.6,5.2)误差较大.去掉这两组数据后,重新求得回归直线的斜率为1,那么当x=4时,的估计值为    .
14.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:
性别 喜爱打篮球情况
喜爱打篮球 不喜爱打篮球 总计
男生 20 a 25
女生 b 15 c
总计 30 d 50
则a+b+c+d=    ;有    的把握认为喜爱打篮球与性别有关.
四、解答题(本大题共5小题,共77分.解答时应写出必要的文字说明、证明过程或演算步骤)
15.(本小题满分13分)冶炼某种金属可以用旧设备或新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示.
设备 所含杂质
杂质高 杂质低
旧设备 37 121
新设备 22 202
根据表中数据试判断所含杂质的高低与设备新旧有无关系?
16.(本小题满分15分)大学生是国家的未来,代表着国家可持续发展的实力,能够促进国家综合实力的提高.据统计,2016年至2020年我国高校毕业生人数Y(单位:万人)的数据如下表:
年份 2016 2017 2018 2019 2020
年份代号X 16 17 18 19 20
高校毕业生人数Y/万人 765 795 820 834 874
(1)根据上表数据,计算Y与X的相关系数r,并说明Y与X的线性相关性的强弱;(已知:0.75≤|r|≤1,则认为Y与X线性相关性很强;0.3≤|r|<0.75,则认为Y与X线性相关性一般;|r|<0.3,则认为Y与X线性相关性较弱)
(2)求Y关于X的线性回归方程,并预测2023年我国高校毕业生的人数(结果取整数).
参考公式和数据:r=,(xi-)2=10,(yi-)2=6 733.2,≈259.5,=,=-.
17.(本小题满分15分)研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:是否有95%的把握认为性别与态度之间存在某种关系?
18.(本小题满分17分)C反应蛋白(CRP)是机体受到微生物入侵或组织损伤等炎症性刺激时细胞合成的急性反应蛋白,医学认为CRP值介于0~10 mg/L为正常值.下面是某患者在治疗期间连续5天的检验报告单中CRP值(单位:mg/L)与治疗天数的统计数据:
治疗天数X 1 2 3 4 5
CRP值Y 51 40 35 28 21
(1)若CRP值Y与治疗天数X有线性相关关系,试用最小二乘法求出Y关于X的线性回归方程,并估计该患者至少需要治疗多少天CRP值可以回到正常水平;
(2)为均衡城乡保障待遇,统一保障范围和支付标准,为参保人员提供公平的基本医疗保障.某市城乡医疗保险实施办法指出:门诊报销比例为50%;住院报销比例:A类医疗机构80%,B类医疗机构60%.若张华参加了城乡基本医疗保险,他因CRP值偏高选择在医疗机构治疗,医生为张华提供了三种治疗方案:
方案一:门诊治疗,预计每天诊疗费80元;
方案二:住院治疗,A类医疗机构,入院检查需花费600元,预计每天诊疗费100元;
方案三:住院治疗,B类医疗机构,入院检查需花费400元,预计每天诊疗费40元;
若张华需要经过连续治疗n天(n∈[7,12],n∈N),请你为张华选择最经济实惠的治疗方案.
附:==,=-.
19.(本小题满分17分)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几年我国某地区新能源汽车的年销售量与年份的统计表:
年份 2018 2019 2020 2021 2022
销量/万台 8 10 13 25 24
某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
车主性别 购车种类
购置传统燃油车 购置新能源车 总计
男性车主 6 24
女性车主 2
总计 30
(1)求新能源汽车的销量Y关于年份X的线性相关系数r,并判断Y与X是否线性相关;
(2)请将上述2×2列联表补充完整,并判断是否有90%的把握认为购车车主是否购置新能源汽车与性别有关;
(3)若以这30名购车车主中购置新能源汽车的车主性别比例作为该地区购置新能源汽车的车主性别比例,从该地区购置新能源汽车的车主中随机选取50人,记选到女性车主的人数为ξ,求ξ的数学期望与方差.
参考公式:r=,其中n=a+b+c+d.≈25,若r>0.9,则可判断y与x线性相关.
章末检测(六) 统计案例
1.C 相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预测,这种预测在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义.故选C.
2.B 10是斜率的估计值,说明x每增加一个单位时,y平均增加10个单位.
3.A 回归直线必过点(,),A正确;X和Y的相关系数r与直线l的斜率符号一致,但不相等,B错误;X和Y的相关系数|r|≤1,r可能为负,C不正确;回归直线两侧的样本点个数没有规律可言,D不正确.
4.B 相关系数r的绝对值越大,变量x,y的线性相关程度越高,故选B.
5.C 男人中患色盲的比例为≈0.079,女人中患色盲的比例为≈0.012,故>.经计算得χ2=≈27.139>6.635,故有99%的把握认为患色盲与性别有关,故选C.
6.C 由散点图可知,y=b1ln(k1x)比y=k2x+b2拟合的程度高,故|r1|>|r2|;又因为此关系为负相关,所以-r1>-r2,r1<r2,故选C.
7.D 将=7.675代入线性回归方程可计算,得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26×100%≈83%,故选D.
8.D 设男生至少有x人,根据题意,可列出如下2×2联表:
性别 是否喜欢数学文化
喜欢数学文化 不喜欢数学文化 总计
男生 x x x
女生 x x x
总计 x x x
则χ2==x,若有99%的把握认为是否喜欢数学文化和性别有关,
则χ2>6.635,即x>6.635,解得x>17.694,
由于表中人数都为整数,可知男生至少有18人.故选D.
9.AD 由线性回归方程Y=-5X+150可知Y与X具有负的线性相关关系,故A正确;Y与X之间的线性相关系数|r|≤1,故B错误;当销售价格为10元时,销售量为-5×10+150=100(件)左右,故C错误,D正确.
10.ACD χ2只适用于2×2型列联表问题,A选项错;χ2的值越大,两个事件的相关性就越大,B选项对;χ2只能推定两个分类变量相关,但不能推定两个变量不相关,C选项错;χ2的计算公式是χ2=,D选项错.故选A、C、D.
11.ABC 对于A,y=c1x2+c2x,可变形为=c1x+c2,令u=,则有u=c1x+c2,故A正确;对于B,y==1+,故y-1=,所以==x+,令u=,则有u=x+,故选项B正确;对于C,y=c1+ln(x+c2),则y-c1=ln(x+c2),所以=x+c2,故ey=·(x+c2),令u=ey,则有u=·(x+c2)=·x+c2·,故选项C正确;对于D,y=c1,则ln y=ln c1+x+c2,令u=ln y,则有u=x+ln c1+c2,此时的斜率为1,与最小二乘法不符合,故选项D错误.故选A、B、C.
12.68 解析:由表格知=30,得=0.67×30+54.9=75.设表中的“模糊数字”为a.则a+62+75+81+89=75×5,所以a=68.
13.6 解析:∵由一组样本数据确定的线性回归方程为=1.5x+1,且=2,∴=1.5×2+1=4,∴样本点的中心为(2,4).去掉(2.4,2.8)与(1.6,5.2),剩余数据的样本点的中心也是(2,4).∵重新求得的回归直线的斜率为1,∴线性回归方程可设为=x+,将(2,4)的坐标代入,得=2,∴线性回归方程为=x+2.将x=4代入线性回归方程,得的估计值为6.
14.60 99% 解析:由列联表数据可求得a=5,b=10,c=25,d=20,所以a+b+c+d=60;χ2=≈8.33>6.635,所以有99%的把握认为喜爱打篮球与性别有关.
15.解:由已知数据得到如下2×2列联表:
设备 所含杂质
杂质高 杂质低 总计
旧设备 37 121 158
新设备 22 202 224
总计 59 323 382
χ2=≈13.11,
由于13.11>6.635,故有99%的把握认为所含杂质的高低与设备新旧有关.
16.解:(1)由题意得=18,=817.6.所以(xi-)(yi-)=(-2)×(-52.6)+(-1)×(-22.6)+1×16.4+2×56.4=257.
所以r==≈≈0.99.
因为0.99>0.75,所以Y与X线性相关性很强.
(2)===25.7.
=-=817.6-25.7×18=355,
所以Y关于X的线性回归方程是Y=25.7X+355.
当x0=23时,y0=25.7×23+355=946.1≈946,
即预测2023年我国高校毕业生的人数约为946万.
17.解:建立性别与态度的2×2列联表如下:
性别 态度
肯定 否定 总计
男生 22 88 110
女生 22 38 60
总计 44 126 170
根据列联表中的数据得到χ2=≈5.622>3.841.
所以有95%的把握认为性别与态度之间有关系.
18.解:(1)由题意得治疗天数的平均数=×(1+2+3+4+5)=3,
CRP值的平均数=×(51+40+35+28+21)=35.
==-7.2,
=-=35-(-7.2)×3=56.6.
∴Y=-7.2X+56.6.
令y0≤10,则x0≥6.
∴该患者至少需治疗7天CRP值可以恢复到正常水平.
(2)治疗天数为n∈[7,12],n∈N.
方案一:门诊治疗需花费治疗费
y1=(1-50%)×80n=40n(元);
方案二:采用A类医疗机构需花费治疗费
y2=(1-80%)×(600+100n)=120+20n(元);
方案三:采用B类医疗机构需花费治疗费
y3=(1-60%)×(400+40n)=160+16n(元).
由y1-y2=20n-120=0,得n=6,
由y2-y3=4n-40=0,得n=10.
∴当7≤n<10(n∈N)时,选择方案二更经济实惠;
当n=10时,任意选择方案二和方案三;
当10<n≤12(n∈N)时,选择方案三更经济实惠.
19.解:(1)依题意,
==2 020,
==16,
故(xi-)(yi-)=(-2)×(-8)+(-1)×(-6)+1×9+2×8=47,
(xi-)2=4+1+1+4=10,(yi-)2=64+36+9+81+64=254,
则r===≈0.94>0.9,故Y与X线性相关.
(2)依题意,完善2×2列联表如下:
车主性别 购车种类
购置传统燃油车 购置新能源车 总计
男性车主 18 6 24
女性车主 2 4 6
总计 20 10 30
χ2===3.75>2.706,
故有90%的把握认为购车车主是否购置新能源汽车与性别有关.
(3)依题意,该地区购置新能源车的车主中女性车主的概率为=,则ξ~B,
所以Eξ=50×=20,
Dξ=50××=12.
5 / 5(共53张PPT)
章末检测(六) 统计案例
(时间:120分钟 满分:150分)
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出
的四个选项中,只有一项是符合题目要求的)
1. 下列说法中正确的是(  )
A. 相关关系是一种不确定的关系,回归分析是对相关关系的分析,因
此没有实际意义
B. 独立性检验对两个变量关系的研究没有100%的把握,所以独立性
检验研究的结果在实际中也没有多大的实际意义
C. 相关关系可以对变量的发展趋势进行预测,这种预测可能会是错误的
D. 独立性检验如果得出的结论有99%的可信度,就意味着这个结论一
定是正确的
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 相关关系虽然是一种不确定关系,但是回归分析可以
在某种程度上对变量的发展趋势进行预测,这种预测在尽量减小
误差的条件下可以对生产与生活起到一定的指导作用,独立性检
验对分类变量的检验也是不确定的,但是其结果也有一定的实际
意义.故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
2. 设线性回归方程为 =-2+10 x ,则当变量 x 增加一个单位时
(  )
A. y 平均减少2个单位 B. y 平均增加10个单位
C. y 平均增加8个单位 D. y 平均减少10个单位
解析: 10是斜率的估计值,说明 x 每增加一个单位时, y 平均增
加10个单位.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
3. 设( x1, y1),( x2, y2),…,( xn , yn )是变量 X 和 Y 的 n 对样
本数据,直线 l 是由这些数据通过最小二乘法得到的回归直线(如
图),以下结论中正确的是(  )
B. X 和 Y 的相关系数为直线 l 的斜率
C. X 和 Y 的相关系数在0到1之间
D. 当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 回归直线必过点( , ),A正确; X 和 Y 的相关系数 r
与直线 l 的斜率 符号一致,但不相等,B错误; X 和 Y 的相关系
数| r |≤1, r 可能为负,C不正确;回归直线两侧的样本点个数没
有规律可言,D不正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
4. 对变量 y 和 x 进行线性相关检验,已知 n 是观测值组数, r 是相关系
数,且已知:
① n =7, r =0.953 3;② n =15, r =0.301 2;③ n =17, r =0.499
1;④ n =3, r =0.995 0.
则变量 y 和 x 线性相关程度最高的两组是(  )
A. ①和② B. ①和④
C. ②和④ D. ③和④
解析: 相关系数 r 的绝对值越大,变量 x , y 的线性相关程度越
高,故选B.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
5. 在调查中发现480名男人中有38名患有色盲,520名女人中有6名患
有色盲.下列说法正确的是(  )
A. 男人、女人中患色盲的频率分别为0.038,0.006
C. 男人中患色盲的比例比女人中患色盲的比例大,且有99%的把握认
为患色盲与性别是有关的
D. 不能说明患色盲与性别是否有关
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 男人中患色盲的比例为 ≈0.079,女人中患色盲的比例
为 ≈0.012,故 > .经计算得χ2=
≈27.139>6.635,故有99%的把握认为患色盲与性别有关,故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
6. 已知相关变量 x 和 y 的散点图如图所示,若用 y = b1·ln ( k1 x )与 y
= kx2+ b2拟合时的相关系数分别为 r1, r2,则比较 r1, r2的大小结
果为(  )
A. r1> r2 B. r1= r2
C. r1< r2 D. 不确定
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 由散点图可知, y = b1ln( k1 x )比 y = k2 x + b2拟合的程
度高,故| r1|>| r2|;又因为此关系为负相关,所以- r1>-
r2, r1< r2,故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
7. 某考察团对全国十大城市的职工人均工资水平 x (千元)与居民人
均消费水平 y (千元)进行统计调查,发现 y 与 x 具有线性相关关
系,线性回归方程为 =0.66 x +1.562,若某城市居民人均消费水
平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约
为(  )
A. 86% B. 72%
C. 67% D. 83%
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 将 =7.675代入线性回归方程可计算,得 x ≈9.26,所以
该城市人均消费额占人均工资收入的百分比约为
7.675÷9.26×100%≈83%,故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
8. 在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是
否有关”作了一次调查,其中被调查的女生人数是男生人数的 ,男
生喜欢数学文化的人数占男生人数的 ,女生喜欢数学文化的人数
占女生人数的 ,若有99%的把握认为是否喜欢数学文化和性别有
关,则男生至少有(  )
A. 24人 B. 22人
C. 20人 D. 18人
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 设男生至少有 x 人,根据题意,可列出如下2×2联表:
性别 是否喜欢数学文化 喜欢数学文化 不喜欢数学文化 总计
男生 x
女生
总计 x
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
则χ2= = x ,若有99%的把握认为是否喜欢数学文
化和性别有关,则χ2>6.635,即 x >6.635,解得 x >17.694,由于
表中人数都为整数,可知男生至少有18人.故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
二、多项选择题(本大题共3小题,每小题6分,共18分.在每小题给出
的四个选项中,有多项符合题目要求,全部选对的得6分,部分选对
的得部分分,有选错的得0分)
9. 某商品的销售量 Y (件)与销售价格 X (元/件)存在线性相关关
系,根据一组样本数据( xi , yi )( i =1,2,…, n ),用最小二
乘法建立的线性回归方程为 Y =-5 X +150,则下列结论正确的是
(  )
A. Y 与 X 具有负的线性相关关系
B. 若 r 表示 Y 与 X 之间的线性相关系数,则 r =-5
C. 当销售价格为10元/件时,销售量为100件
D. 当销售价格为10元/件时,销售量为100件左右
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 由线性回归方程 Y =-5 X +150可知 Y 与 X 具有负的线
性相关关系,故A正确; Y 与 X 之间的线性相关系数| r |≤1,故B
错误;当销售价格为10元时,销售量为-5×10+150=100(件)
左右,故C错误,D正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
10. 下面关于χ2的说法错误的是(  )
A. χ2在任何相互独立的问题中都可以用于检验有关还是无关
B. χ2的值越大,两个事件的相关性就越大
C. χ2是用来判断两个分类变量是否相关的随机变量,当χ2的值很小时
可以推定两类变量不相关
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: χ2只适用于2×2型列联表问题,A选项错;χ2的值越
大,两个事件的相关性就越大,B选项对;χ2只能推定两个分类变
量相关,但不能推定两个变量不相关,C选项错;χ2的计算公式是
χ2= ,D选项错.故选A、C、D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
11. 在对具有相关关系的两个变量进行回归分析时,若两个变量不呈
线性相关关系,可以建立含两个待定参数的非线性模型,并引入
中间变量将其转化为线性关系,再利用最小二乘法进行线性回归
分析.下列选项为四个同学根据自己所得数据的散点图建立的非线
性模型,且散点图的样本点均位于第一象限,则其中可以根据上
述方法进行回归分析的模型有(  )
A. y = c1 x2+ c2 x
C. y = c1+ln( x + c2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 对于A, y = c1 x2+ c2 x ,可变形为 = c1 x + c2,令 u
= ,则有 u = c1 x + c2,故A正确;对于B, y = =1+
,故 y -1= ,所以 = = x + ,令 u =
,则有 u = x + ,故选项B正确;对于C, y = c1+ln
( x + c2),则 y - c1=ln( x + c2),所以 = x + c2,故e y =
·( x + c2),令 u =e y ,则有 u = ·( x + c2)= · x +
c2· ,故选项C正确;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
对于D, y = c1 ,则ln y =ln c1+ x + c2,令 u =ln y ,则有 u = x
+ln c1+ c2,此时的斜率为1,与最小二乘法不符合,故选项D错误.故
选A、B、C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
三、填空题(本大题共3小题,每小题5分,共15分.把答案填在题中横
线上)
12. 某车间为了规定工时定额,需要确定加工零件所花费的时间,为
此进行了5次试验.根据收集到的数据(如表),由最小二乘法求得
线性回归方程为 =0.67 x +54.9.
零件数x/个 10 20 30 40 50
加工时间y/min 62 75 81 89
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
现发现表中有一个数据看不清,请你推断出该数据的值为 .
解析:由表格知 =30,得 =0.67×30+54.9=75.设表中的“模糊
数字”为 a .则 a +62+75+81+89=75×5,所以 a =68.
68 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
13. 已知由一组样本数据确定的线性回归方程为 =1.5 x +1,且 =
2,发现有两组数据(2.4,2.8)与(1.6,5.2)误差较大.去掉这两
组数据后,重新求得回归直线的斜率为1,那么当 x =4时, 的估
计值为 .
6 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析:∵由一组样本数据确定的线性回归方程为 =1.5 x +1,且
=2,∴ =1.5×2+1=4,∴样本点的中心为(2,4).去掉
(2.4,2.8)与(1.6,5.2),剩余数据的样本点的中心也是(2,
4).∵重新求得的回归直线的斜率为1,∴线性回归方程可设为
= x + ,将(2,4)的坐标代入,得 =2,∴线性回归方程为
= x +2.将 x =4代入线性回归方程,得 的估计值为6.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
14. 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进
行了问卷调查,得到了如下的2×2列联表:
性别 喜爱打篮球情况 喜爱打篮球 不喜爱打篮球 总计
男生 20 a 25
女生 b 15 c
总计 30 d 50
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
则 a + b + c + d = ;有 的把握认为喜爱打篮球与性
别有关.
解析:由列联表数据可求得 a =5, b =10, c =25, d =20,所以
a + b + c + d =60;χ2= ≈8.33>6.635,所以有
99%的把握认为喜爱打篮球与性别有关.
60 
99% 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
四、解答题(本大题共5小题,共77分.解答时应写出必要的文字说
明、证明过程或演算步骤)
15. (本小题满分13分)冶炼某种金属可以用旧设备或新设备,为了
检验用这两种设备生产的产品中所含杂质的关系,调查结果如表
所示.
设备 所含杂质 杂质高 杂质低
旧设备 37 121
新设备 22 202
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
根据表中数据试判断所含杂质的高低与设备新旧有无关系?
解:由已知数据得到如下2×2列联表:
设备 所含杂质
杂质高 杂质低 总计 旧设备 37 121 158 新设备 22 202 224 总计 59 323 382 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
χ2= ≈13.11,
由于13.11>6.635,故有99%的把握认为所含杂质的高低与设备新
旧有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
16. (本小题满分15分)大学生是国家的未来,代表着国家可持续发
展的实力,能够促进国家综合实力的提高.据统计,2016年至2020
年我国高校毕业生人数 Y (单位:万人)的数据如下表:
年份 2016 2017 2018 2019 2020
年份代号 X 16 17 18 19 20
高校毕业生 人数Y/万人 765 795 820 834 874
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(1)根据上表数据,计算 Y 与 X 的相关系数 r ,并说明 Y 与 X 的线
性相关性的强弱;(已知:0.75≤| r |≤1,则认为 Y 与 X 线
性相关性很强;0.3≤| r |<0.75,则认为 Y 与 X 线性相关性
一般;| r |<0.3,则认为 Y 与 X 线性相关性较弱)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:由题意得 =18, =817.6.所以 ( xi - )
( yi - )=(-2)×(-52.6)+(-1)×(-22.6)+
1×16.4+2×56.4=257.
所以 r = = ≈
≈0.99.
因为0.99>0.75,所以 Y 与 X 线性相关性很强.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)求 Y 关于 X 的线性回归方程,并预测2023年我国高校毕业生
的人数(结果取整数).
参考公式和数据:
r = , ( xi - )2=10,
( yi - )2=6 733.2, ≈259.5, =
, = - .
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解: = = =25.7.
= - =817.6-25.7×18=355,
所以 Y 关于 X 的线性回归方程是 Y =25.7 X +355.
当 x0=23时, y0=25.7×23+355=946.1≈946,
即预测2023年我国高校毕业生的人数约为946万.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
17. (本小题满分15分)研究人员选取170名青年男女大学生的样本,
对他们进行一种心理测验,发现有60名女生对该心理测验中的最
后一个题目的反应是:作肯定的有22名,否定的有38名;男生110
名在相同的项目上作肯定的有22名,否定的有88名.问:是否有
95%的把握认为性别与态度之间存在某种关系?
解:建立性别与态度的2×2列联表如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
性别 态度
肯定 否定 总计 男生 22 88 110 女生 22 38 60 总计 44 126 170 根据列联表中的数据得到χ2= ≈5.622>3.841.
所以有95%的把握认为性别与态度之间有关系.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
18. (本小题满分17分)C反应蛋白(CRP)是机体受到微生物入侵或
组织损伤等炎症性刺激时细胞合成的急性反应蛋白,医学认为CRP
值介于0~10 mg/L为正常值.下面是某患者在治疗期间连续5天的检
验报告单中CRP值(单位:mg/L)与治疗天数的统计数据:
治疗天数 X 1 2 3 4 5
CRP值 Y 51 40 35 28 21
(1)若CRP值 Y 与治疗天数 X 有线性相关关系,试用最小二乘法
求出 Y 关于 X 的线性回归方程,并估计该患者至少需要治疗
多少天CRP值可以回到正常水平;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:由题意得治疗天数的平均数 = ×(1+2+3+4+5)=3,CRP值的平均数 = ×(51+40+35+28+21)=35.
= =-7.2,
= - =35-(-7.2)×3=56.6.
∴ Y =-7.2 X +56.6.
令 y0≤10,则 x0≥6 .∴该患者至少需治疗7天CRP值可以恢复到正常水平.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)为均衡城乡保障待遇,统一保障范围和支付标准,为参保人
员提供公平的基本医疗保障.某市城乡医疗保险实施办法指
出:门诊报销比例为50%;住院报销比例: A 类医疗机构
80%, B 类医疗机构60%.若张华参加了城乡基本医疗保险,
他因CRP值偏高选择在医疗机构治疗,医生为张华提供了三
种治疗方案:
方案一:门诊治疗,预计每天诊疗费80元;
方案二:住院治疗, A 类医疗机构,入院检查需花费600元,
预计每天诊疗费100元;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
方案三:住院治疗, B 类医疗机构,入院检查需花费400元,
预计每天诊疗费40元;
若张华需要经过连续治疗 n 天( n ∈[7,12], n ∈N),请你
为张华选择最经济实惠的治疗方案.
附: = = , = - .
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:治疗天数为 n ∈[7,12], n ∈N.
方案一:门诊治疗需花费治疗费
y1=(1-50%)×80 n =40 n (元);
方案二:采用 A 类医疗机构需花费治疗费
y2=(1-80%)×(600+100 n )=120+20 n (元);
方案三:采用 B 类医疗机构需花费治疗费
y3=(1-60%)×(400+40 n )=160+16 n (元).
由 y1- y2=20 n -120=0,得 n =6,
由 y2- y3=4 n -40=0,得 n =10.
∴当7≤ n <10( n ∈N)时,选择方案二更经济实惠;
当 n =10时,任意选择方案二和方案三;
当10< n ≤12( n ∈N)时,选择方案三更经济实惠.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
19. (本小题满分17分)“绿水青山就是金山银山”的生态文明发展理念
已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几
年我国某地区新能源汽车的年销售量与年份的统计表:
年份 2018 2019 2020 2021 2022
销量/万台 8 10 13 25 24
某机构调查了该地区30位购车车主的性别与购车种类情况,得到
的部分数据如下表所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
车主性别 购车种类 购置传统燃油车 购置新能源车 总计
男性车主 6 24
女性车主 2
总计 30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(1)求新能源汽车的销量 Y 关于年份 X 的线性相关系数 r ,并判断
Y 与 X 是否线性相关;
解:依题意,
= =2 020,
= =16,
故 ( xi - )( yi - )=(-2)×(-8)+(-1)×
(-6)+1×9+2×8=47,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
( xi - )2=4+1+1+4=10, ( yi - )2=64+36
+9+81+64=254,
则 r = = = ≈0.94>
0.9,故 Y 与 X 线性相关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)请将上述2×2列联表补充完整,并判断是否有90%的把握认
为购车车主是否购置新能源汽车与性别有关;
解:依题意,完善2×2列联表如下:
车主
性别 购车种类 购置传统燃油车 购置新能源车 总计
男性车主 18 6 24
女性车主 2 4 6
总计 20 10 30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
χ2= = =3.75>2.706,
故有90%的把握认为购车车主是否购置新能源汽车与性别
有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(3)若以这30名购车车主中购置新能源汽车的车主性别比例作为
该地区购置新能源汽车的车主性别比例,从该地区购置新能
源汽车的车主中随机选取50人,记选到女性车主的人数为
ξ,求ξ的数学期望与方差.
参考公式:
r = ,其中 n = a + b + c + d .
≈25,若 r >0.9,则可判断 y 与 x 线性相关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:依题意,该地区购置新能源车的车主中女性车主
的概率为 = ,则ξ~ B ,
所以 E ξ=50× =20,
D ξ=50× × =12.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
谢 谢 观 看!

展开更多......

收起↑

资源列表