第八章 成对数据的统计分析 章末检测试卷(含解析) 高中数学 人教A版(2019) 选择性必修 第三册

资源下载
  1. 二一教育资源

第八章 成对数据的统计分析 章末检测试卷(含解析) 高中数学 人教A版(2019) 选择性必修 第三册

资源简介

章末检测试卷三
[时间:120分钟 分值:150分]
一、单项选择题(本题共8小题,每小题5分,共40分)
1.在一项中学生近视情况的调查中,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时最有说服力的方法是(  )
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
2.为研究某奶茶店每日的热奶茶销售量y(杯)和气温x(℃)之间是否具有线性相关关系,统计该店(2025年2月6日至3月24日)每天的热奶茶销售量及当天气温得到如图所示的散点图(x轴表示气温,y轴表示热奶茶销售量),由散点图可知y与x的相关关系为(  )
A.正相关,样本相关系数r的值大于0
B.负相关,样本相关系数r的值大于0
C.正相关,样本相关系数r的值小于0
D.负相关,样本相关系数r的值小于0
3.船员人数y关于船的吨位x的经验回归方程是=95+0.06x.若两艘轮船吨位相差1 000吨,则船员平均人数相差(  )
A.40 B.57
C.60 D.95
4.为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,统计这100位居民对改革前后该电视栏目是否优秀的态度,并通过独立性检验,计算可知χ2≈0.99,根据这一数据分析,下列说法正确的是(  )
A.有99%的人认为该电视栏目优秀
B.有99%的人认为该电视栏目是否优秀与改革有关
C.依据小概率值α=0.01的独立性检验,认为该电视栏目是否优秀与改革有关
D.依据小概率值α=0.01的独立性检验,认为该电视栏目是否优秀与改革无关
5.一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:xi=28,=303.4,yi=75,=598.5,xiyi=237,则x与y的样本相关系数r的绝对值为(  )
A.0.6 B.0.5
C.0.4 D.0.3
6.用模型y=aekx拟合一组数据(xi,yi)(i=1,2,…,7),其中x1+x2+…+x7=7.设z=ln y,得变换后的经验回归方程为=x+4,则y1y2…y7等于(  )
A.e70 B.70
C.e35 D.35
7.某同学将收集到的六组数据制作成散点图如图所示,并得到其经验回归方程为=0.68x+,计算其样本相关系数为r1,决定系数为.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5组数据计算得到经验回归方程为=x+0.68,样本相关系数为r2,决定系数为.下列结论中不正确的是(  )
A.r1>0,r2>0 B.>
C.=0.12 D.0<<0.68
8.某城市选用一种植物进行绿化,设其中一株幼苗从观察之日起,第x天的高度为y cm,测得一些数据如表所示.
第x天 1 4 9 16 25 36 49
高度y/cm 0 4 7 9 11 12 13
由表格可得y关于x的经验回归方程为=+,则此回归模型第16天的残差(观测值与预测值之差)为(  )
A.- B.
C.0 D.1
二、多项选择题(本题共3小题,每小题6分,共18分.全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.已知变量x,y之间的经验回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如表所示,则下列说法正确的是(  )
x 6 8 10 12
y 6 m 3 2
A.变量x,y之间呈负相关
B.m=4
C.可以预测,当x=11时,y约为2.6
D.由表格数据知,该经验回归直线必过点(9,4)
10.某校有在校学生900人,其中男生400人,女生500人,为了解该校学生对学校课后延时服务的满意度,随机调查了40名男生和50名女生.每位被调查的学生都对学校的课后延时服务给出了满意或不满意的评价,统计过程中发现随机从这90人中抽取一人,此人评价为满意的概率为.在制定2×2列联表时,由于某些因素缺失了部分数据,而获得如下2×2列联表,下列结论正确的是(  )
性别 满意度评价 合计
满意 不满意
男 10

合计 90
参考公式与临界值表:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
A.调查过程采用了比例分配的分层随机抽样的抽样方法
B.50名女生中对课后延时服务满意的人数为20
C.χ2的观测值为9
D.根据小概率值α=0.1的独立性检验,不可以认为“对课后延时服务的满意度与性别有关”
11.某农科所针对耕种深度x(单位:cm)与水稻每公顷产量(单位:t)的关系进行研究,所得部分数据如表.
耕种深度x/cm 8 10 12 14 16 18
每公顷产量y/t 6 8 m n 11 12
已知m参考数据:=510,(yi-)2=24,两个变量x,y之间的样本相关系数r为.
参考公式:=,=-,r=.
A.m+n=17 B.=
C.= D.e1+e2=-1
三、填空题(本题共3小题,每小题5分,共15分)
12.为了提高学生参加体育锻炼的积极性,某校本学期依据学生特点针对性地组建了五个特色运动社团,学校为了了解学生参与运动的情况,对每个特色运动社团的参与人数进行了统计,其中一个特色运动社团开学第1周至第5周参与运动的人数统计数据如表所示.
周次x 1 2 3 4 5
参与运动的人数y 35 36 40 39 45
若由表中数据可得y关于x的经验回归方程为=2.3x+(1≤x≤18,x∈N*),则由此预测本学期第11周参与该特色运动社团的人数约为     .(精确到整数)
13.为了调查A,B两个地区的观众是否喜欢娱乐节目M,某电视台随机调查了A,B两个地区的2x名观众,已知A,B两个地区随机调查的人数相同,A地区喜欢娱乐节目M的人数占A地区参与调查的总人数的,B地区喜欢娱乐节目M的人数占B地区参与调查的总人数的,若根据独立性检验,认为喜欢娱乐节目M和地区有关,且此推断犯错误的概率超过0.01但不超过0.05,则所有x构成的集合为    .
附:χ2=,其中n=a+b+c+d.
α 0.05 0.01
xα 3.841 6.635
14.某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区进行试点,得到试点地区加盟店个数x及单店日平均营业额y(万元)的数据如表:
x 1 2 3 4 5
y 10.9 10.2 9.0 7.8 7.1
根据上表可得y与x线性相关,为保证规模和效益,该公司要求在其他5个地区需满足同一地区所有加盟店的日平均营业额预计值总和不低于35万元,则一个地区开设的加盟店个数m的所有可能取值为  .(参考数据:xiyi=125,=55)
四、解答题(本题共5小题,共77分)
15.(13分)为解决农产品难卖、知名度不高等问题,某县凝聚电商直播群体及电商直播销售行业“新”力量助力乡村振兴.如表所示为某农户在前7个月的直播中产生的农产品销售额.
月份代码x 1 2 3 4 5 6 7
销售额y(单位:千元) 0.84 1.37 2.76 4.43 5.49 7.66 8.94
参考数据:=4.5,xiyi=165.57,=140.
参考公式:=,=-.
(1)根据表格中的数据,求出y关于x的经验回归方程;(系数精确到0.1)(8分)
(2)规定当月销售额超过15万元时,能被评选为“优秀带货主播”,预测该农户在第几个月能被评选为“优秀带货主播”.(5分)
16.(15分)截至2024年底,我国新能源汽车保有量达到3 140万辆,占汽车总量的8.9%.某市调查了1 000名汽车驾驶员对燃油汽车和新能源汽车的偏好情况,调查结果如表.
性别 偏好 合计
燃油汽车 新能源汽车
男性
女性 100 400
合计 400 1 000
(1)请根据所给数据,完成上面的2×2列联表,并判断依据小概率值α=0.001的独立性检验,能否认为偏好燃油汽车或新能源汽车与驾驶员的性别有关;(8分)
(2)用频率估计概率,在所有参加调查的驾驶员中按性别进行比例分配的分层随机抽样,随机抽取10名驾驶员,再从这10名驾驶员中随机抽取2人进行问卷调查.抽取的2人中,求在有女性驾驶员参加问卷调查的条件下,恰有1名男性驾驶员也参加问卷调查的概率.(7分)
附:χ2=,n=a+b+c+d.
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
17.(15分)某公司为了解年研发资金x(单位:亿元)对年产值y(单位:亿元)的影响,对公司近8年的年研发资金xi和年产值yi(i∈N*,1≤i≤8)的数据对比分析,选用了两个回归模型,并利用最小二乘法求得相应的y关于x的经验回归方程:
①=13.05x-48.4;②=0.76x2+.
(1)求的值;(6分)
(2)已知①中的残差平方和S1≈3 610,②中的残差平方和S2≈658,请根据决定系数R2选择拟合效果更好的经验回归方程,并利用该经验回归方程预测年研发资金为20亿元时的年产值.(9分)
参考数据:xi=64,yi=448,=684,=32 900.
参考公式:刻画回归模型拟合效果的决定系数R2=1-.
18.(17分)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量x(单位:辆)和空气中的PM2.5的平均浓度y(单位: μg/m3).调研人员采集了50天的数据,制作了关于(xi,yi)(i=1,2,3,…,50)的散点图,并用直线x=1 500与y=100将散点图分成如图所示的四个区域Ⅰ,Ⅱ,Ⅲ,Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的2×2列联表,并判断依据小概率值α=0.01的独立性检验,能否认为PM2.5的平均浓度y与汽车日流量x有关;(9分)
PM2.5的平均浓度 汽车日流量 合计
x<1 500 x≥1 500
y<100
y≥100
合计
(2)经计算得到经验回归方程为=0.12x-73.36,且这50天的汽车日流量x的标准差sx=252,PM2.5的平均浓度y的标准差sy=36,求样本相关系数r,并判断该经验回归方程是否有价值.(8分)
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
经验回归方程=x+,
其中=,=-.
样本相关系数r=.若|r|≥0.75,则认为y与x有较强的线性相关性.
19.(17分)(2024·全国甲卷改编)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 合计
甲车间 26 24 0 50
乙车间 70 28 2 100
合计 96 52 2 150
(1)填写如下列联表:
优级品 非优级品
甲车间
乙车间
依据小概率值α=0.05的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?依据小概率值α=0.01的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?(9分)
(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率.如果>p+1.65,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)(8分)
附:χ2=.
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
章末检测试卷三
[时间:120分钟 分值:150分]
一、单项选择题(本题共8小题,每小题5分,共40分)
1.在一项中学生近视情况的调查中,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时最有说服力的方法是(  )
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
答案 C
解析 判断两个分类变量是否有关的最有效方法是进行独立性检验.
2.为研究某奶茶店每日的热奶茶销售量y(杯)和气温x(℃)之间是否具有线性相关关系,统计该店(2025年2月6日至3月24日)每天的热奶茶销售量及当天气温得到如图所示的散点图(x轴表示气温,y轴表示热奶茶销售量),由散点图可知y与x的相关关系为(  )
A.正相关,样本相关系数r的值大于0
B.负相关,样本相关系数r的值大于0
C.正相关,样本相关系数r的值小于0
D.负相关,样本相关系数r的值小于0
答案 D
解析 由散点图知y随着x的增大有减小的趋势,因此是负相关,样本相关系数小于0.
3.船员人数y关于船的吨位x的经验回归方程是=95+0.06x.若两艘轮船吨位相差1 000吨,则船员平均人数相差(  )
A.40 B.57
C.60 D.95
答案 C
解析 由题意知,经验回归方程是=95+0.06x,两艘轮船吨位相差1 000吨,所以船员平均人数的差值是0.06×1 000=60.
4.为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,统计这100位居民对改革前后该电视栏目是否优秀的态度,并通过独立性检验,计算可知χ2≈0.99,根据这一数据分析,下列说法正确的是(  )
A.有99%的人认为该电视栏目优秀
B.有99%的人认为该电视栏目是否优秀与改革有关
C.依据小概率值α=0.01的独立性检验,认为该电视栏目是否优秀与改革有关
D.依据小概率值α=0.01的独立性检验,认为该电视栏目是否优秀与改革无关
答案 D
解析 只有χ2≥6.635时才能依据小概率值α=0.01的独立性检验,认为该电视栏目是否优秀与改革有关,
且χ2只能判断“该电视栏目是否优秀与改革有关”这个推断成立的可能性大小与是否有99%的人等无关.
5.一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:xi=28,=303.4,yi=75,=598.5,xiyi=237,则x与y的样本相关系数r的绝对值为(  )
A.0.6 B.0.5
C.0.4 D.0.3
答案 D
解析 因为xi=28,yi=75,所以=2.8,=7.5,
|r|===0.3.
6.用模型y=aekx拟合一组数据(xi,yi)(i=1,2,…,7),其中x1+x2+…+x7=7.设z=ln y,得变换后的经验回归方程为=x+4,则y1y2…y7等于(  )
A.e70 B.70
C.e35 D.35
答案 C
解析 因为x1+x2+…+x7=7,所以=1,=+4=5,
即==5,
所以y1y2…y7=e35.
7.某同学将收集到的六组数据制作成散点图如图所示,并得到其经验回归方程为=0.68x+,计算其样本相关系数为r1,决定系数为.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5组数据计算得到经验回归方程为=x+0.68,样本相关系数为r2,决定系数为.下列结论中不正确的是(  )
A.r1>0,r2>0 B.>
C.=0.12 D.0<<0.68
答案 B
解析 由图可知两变量呈正相关,故r1>0,r2>0,且r1又经验回归直线=0.68x+必经过样本点中心(3.5,2.5),所以=2.5-0.68×3.5=0.12,故C正确;
经验回归直线=x+0.68必经过样本点中心(3,2),所以2=×3+0.68,
所以=0.44,也可直接根据图象判断0<<0.68(比较两直线的倾斜程度),故D正确.
8.某城市选用一种植物进行绿化,设其中一株幼苗从观察之日起,第x天的高度为y cm,测得一些数据如表所示.
第x天 1 4 9 16 25 36 49
高度y/cm 0 4 7 9 11 12 13
由表格可得y关于x的经验回归方程为=+,则此回归模型第16天的残差(观测值与预测值之差)为(  )
A.- B.
C.0 D.1
答案 D
解析 设=t,则==4,==8,
代入得=8-×4=-,则=-,
当x=16时,=×4-=8,
则第16天的残差为9-8=1.
二、多项选择题(本题共3小题,每小题6分,共18分.全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.已知变量x,y之间的经验回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如表所示,则下列说法正确的是(  )
x 6 8 10 12
y 6 m 3 2
A.变量x,y之间呈负相关
B.m=4
C.可以预测,当x=11时,y约为2.6
D.由表格数据知,该经验回归直线必过点(9,4)
答案 ACD
解析 由=-0.7x+10.3得=-0.7<0,所以x,y呈负相关,故A正确;
当x=11时,y的预测值为2.6,故C正确;
由==9,
得=-0.7×9+10.3=4.
故经验回归直线过点(9,4),故D正确;
因为=4,所以=4,解得m=5,故B错误.
10.某校有在校学生900人,其中男生400人,女生500人,为了解该校学生对学校课后延时服务的满意度,随机调查了40名男生和50名女生.每位被调查的学生都对学校的课后延时服务给出了满意或不满意的评价,统计过程中发现随机从这90人中抽取一人,此人评价为满意的概率为.在制定2×2列联表时,由于某些因素缺失了部分数据,而获得如下2×2列联表,下列结论正确的是(  )
性别 满意度评价 合计
满意 不满意
男 10

合计 90
参考公式与临界值表:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
A.调查过程采用了比例分配的分层随机抽样的抽样方法
B.50名女生中对课后延时服务满意的人数为20
C.χ2的观测值为9
D.根据小概率值α=0.1的独立性检验,不可以认为“对课后延时服务的满意度与性别有关”
答案 AD
解析 A选项,因为在校学生中有400名男生,500名女生,随机调查了40名男生和50名女生,
男女比例始终是4∶5,所以采用了比例分配的分层随机抽样的方法,故A正确;
B选项,调查的90人中对学校课后延时服务满意的人数为90×=60,
其中男生满意的人数为40-10=30,所以女生满意的人数为30,女生不满意的人数为20,故B错误;
C选项,由B选项的分析,补全列联表如下,
性别 满意度评价 合计
满意 不满意
男 30 10 40
女 30 20 50
合计 60 30 90
由列联表可得χ2==2.25,故C错误;
D选项,零假设为H0:对课后延时服务的满意度与性别无关,由χ2=2.25<2.706=x0.1,
根据小概率值α=0.1的独立性检验,没有充足的证据推断H0不成立,
即不可以认为“对课后延时服务的满意度与性别有关”,故D正确.
11.某农科所针对耕种深度x(单位:cm)与水稻每公顷产量(单位:t)的关系进行研究,所得部分数据如表.
耕种深度x/cm 8 10 12 14 16 18
每公顷产量y/t 6 8 m n 11 12
已知m参考数据:=510,(yi-)2=24,两个变量x,y之间的样本相关系数r为.
参考公式:=,=-,r=.
A.m+n=17 B.=
C.= D.e1+e2=-1
答案 ABD
解析 对于选项A,因为=510,(yi-)2=-6=24,所以=81,得到=9,
所以=9,得到m+n=17,所以选项A正确;
对于选项B,因为==13,r==,
(xi-)2=(8-13)2+(10-13)2+(12-13)2+(14-13)2+(16-13)2+(18-13)2=70,
所以(xi-)(yi-)=××=40,所以===,故选项B正确;
对于选项C,因为=-=9-×13=,所以选项C错误;
对于选项D,因为=x+,得到e1=m-,e2=n-,
所以e1+e2=m+n-18=-1,所以选项D正确.
三、填空题(本题共3小题,每小题5分,共15分)
12.为了提高学生参加体育锻炼的积极性,某校本学期依据学生特点针对性地组建了五个特色运动社团,学校为了了解学生参与运动的情况,对每个特色运动社团的参与人数进行了统计,其中一个特色运动社团开学第1周至第5周参与运动的人数统计数据如表所示.
周次x 1 2 3 4 5
参与运动的人数y 35 36 40 39 45
若由表中数据可得y关于x的经验回归方程为=2.3x+(1≤x≤18,x∈N*),则由此预测本学期第11周参与该特色运动社团的人数约为     .(精确到整数)
答案 57
解析 ==3,==39,
把(3,39)代入=2.3x+,得=39-2.3×3=32.1.
可得经验回归方程为=2.3x+32.1.
把x=11代入y=2.3x+32.1,
可得y=2.3×11+32.1=57.4≈57.
13.为了调查A,B两个地区的观众是否喜欢娱乐节目M,某电视台随机调查了A,B两个地区的2x名观众,已知A,B两个地区随机调查的人数相同,A地区喜欢娱乐节目M的人数占A地区参与调查的总人数的,B地区喜欢娱乐节目M的人数占B地区参与调查的总人数的,若根据独立性检验,认为喜欢娱乐节目M和地区有关,且此推断犯错误的概率超过0.01但不超过0.05,则所有x构成的集合为    .
附:χ2=,其中n=a+b+c+d.
α 0.05 0.01
xα 3.841 6.635
答案 {45,50,55,60,65}
解析 2×2列联表为
地区 娱乐节目M 合计
喜欢 不喜欢
A地区 x x x
B地区 x x x
合计 x x 2x
χ2==,
由认为喜欢娱乐节目M和地区有关,且此推断犯错误的概率超过0.01但不超过0.05,
则3.841≤<6.635,
解得40.330 5≤x<69.667 5,又x是5的倍数,
则x的取值可以为45,50,55,60,65,所以所有x构成的集合为{45,50,55,60,65}.
14.某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区进行试点,得到试点地区加盟店个数x及单店日平均营业额y(万元)的数据如表:
x 1 2 3 4 5
y 10.9 10.2 9.0 7.8 7.1
根据上表可得y与x线性相关,为保证规模和效益,该公司要求在其他5个地区需满足同一地区所有加盟店的日平均营业额预计值总和不低于35万元,则一个地区开设的加盟店个数m的所有可能取值为  .(参考数据:xiyi=125,=55)
答案 5,6,7
解析 由题意可得,==3,==9,
xiyi=125,=55,
设经验回归方程为=x+,
则===-1,=9-(-3)=12,
故经验回归方程为=-x+12.
根据题意,m(12-m)≥35,
解得5≤m≤7,又m∈N*,
所以m的所有可能取值为5,6,7.
四、解答题(本题共5小题,共77分)
15.(13分)为解决农产品难卖、知名度不高等问题,某县凝聚电商直播群体及电商直播销售行业“新”力量助力乡村振兴.如表所示为某农户在前7个月的直播中产生的农产品销售额.
月份代码x 1 2 3 4 5 6 7
销售额y(单位:千元) 0.84 1.37 2.76 4.43 5.49 7.66 8.94
参考数据:=4.5,xiyi=165.57,=140.
参考公式:=,=-.
(1)根据表格中的数据,求出y关于x的经验回归方程;(系数精确到0.1)(8分)
(2)规定当月销售额超过15万元时,能被评选为“优秀带货主播”,预测该农户在第几个月能被评选为“优秀带货主播”.(5分)
解 (1)由已知,=×(1+2+3+4+5+6+7)=4,
由表中数据可得===≈1.4,
∴=-=4.5-×4≈-1.2,
∴y关于x的经验回归方程为=1.4x-1.2.
(2)令=1.4x-1.2>15,解得x>11.57,
∴预测该农户在第12个月能被评选为“优秀带货主播”.
16.(15分)截至2024年底,我国新能源汽车保有量达到3 140万辆,占汽车总量的8.9%.某市调查了1 000名汽车驾驶员对燃油汽车和新能源汽车的偏好情况,调查结果如表.
性别 偏好 合计
燃油汽车 新能源汽车
男性
女性 100 400
合计 400 1 000
(1)请根据所给数据,完成上面的2×2列联表,并判断依据小概率值α=0.001的独立性检验,能否认为偏好燃油汽车或新能源汽车与驾驶员的性别有关;(8分)
(2)用频率估计概率,在所有参加调查的驾驶员中按性别进行比例分配的分层随机抽样,随机抽取10名驾驶员,再从这10名驾驶员中随机抽取2人进行问卷调查.抽取的2人中,求在有女性驾驶员参加问卷调查的条件下,恰有1名男性驾驶员也参加问卷调查的概率.(7分)
附:χ2=,n=a+b+c+d.
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
解 (1)2×2列联表为
性别 偏好 合计
燃油汽车 新能源汽车
男性 300 300 600
女性 100 300 400
合计 400 600 1 000
零假设为H0:偏好燃油汽车或新能源汽车与驾驶员的性别无关.
χ2==62.5>10.828=x0.001,
所以依据小概率值α=0.001的独立性检验,推断H0不成立,即认为偏好燃油汽车或新能源汽车与驾驶员的性别有关.
(2)抽取的10名驾驶员中,女性驾驶员有×10=4(人),男性驾驶员有×10=6(人),
记有女性驾驶员参加问卷调查为事件A,恰有1名男性驾驶员参加问卷调查为事件B,
P(A)==,P(AB)==,
所以P(B|A)==.
17.(15分)某公司为了解年研发资金x(单位:亿元)对年产值y(单位:亿元)的影响,对公司近8年的年研发资金xi和年产值yi(i∈N*,1≤i≤8)的数据对比分析,选用了两个回归模型,并利用最小二乘法求得相应的y关于x的经验回归方程:
①=13.05x-48.4;②=0.76x2+.
(1)求的值;(6分)
(2)已知①中的残差平方和S1≈3 610,②中的残差平方和S2≈658,请根据决定系数R2选择拟合效果更好的经验回归方程,并利用该经验回归方程预测年研发资金为20亿元时的年产值.(9分)
参考数据:xi=64,yi=448,=684,=32 900.
参考公式:刻画回归模型拟合效果的决定系数R2=1-.
解 (1)根据题意,令t=x2,则=0.76t+,
所以=ti==×684=85.5,=yi=×448=56,
将点(85.5,56)的坐标代入经验回归方程=0.76t+,
得56=0.76×85.5+,解得=-8.98.
所以的值为-8.98.
(2)设经验回归方程①的决定系数为,由S1≈3 610,得=1-≈0.89,
设经验回归方程②的决定系数为,由S2≈658,得=1-=0.98,
因为<,所以经验回归方程②的拟合效果更好.
当x=20时,=0.76×202-8.98=295.02,
所以年研发资金为20亿元时的年产值约为295.02亿元.
18.(17分)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量x(单位:辆)和空气中的PM2.5的平均浓度y(单位: μg/m3).调研人员采集了50天的数据,制作了关于(xi,yi)(i=1,2,3,…,50)的散点图,并用直线x=1 500与y=100将散点图分成如图所示的四个区域Ⅰ,Ⅱ,Ⅲ,Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的2×2列联表,并判断依据小概率值α=0.01的独立性检验,能否认为PM2.5的平均浓度y与汽车日流量x有关;(9分)
PM2.5的平均浓度 汽车日流量 合计
x<1 500 x≥1 500
y<100
y≥100
合计
(2)经计算得到经验回归方程为=0.12x-73.36,且这50天的汽车日流量x的标准差sx=252,PM2.5的平均浓度y的标准差sy=36,求样本相关系数r,并判断该经验回归方程是否有价值.(8分)
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
经验回归方程=x+,
其中=,=-.
样本相关系数r=.若|r|≥0.75,则认为y与x有较强的线性相关性.
解 (1)2×2列联表如下.
PM2.5的平均浓度 汽车日流量 合计
x<1 500 x≥1 500
y<100 16 8 24
y≥100 6 20 26
合计 22 28 50
零假设为H0:PM2.5的平均浓度y与汽车日流量x无关,
因为χ2=≈9.624>6.635=x0.01,
所以依据小概率值α=0.01的独立性检验,推断H0不成立,
即认为PM2.5的平均浓度y与汽车日流量x有关.
(2)因为经验回归方程为=0.12x-73.36,
所以==0.12,
又因为sx==252,sy==36,
所以r==·=0.12×=0.84.
因为|r|=0.84>0.75,所以y与x有较强的线性相关性,所以该经验回归方程有价值.
19.(17分)(2024·全国甲卷改编)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 合计
甲车间 26 24 0 50
乙车间 70 28 2 100
合计 96 52 2 150
(1)填写如下列联表:
优级品 非优级品
甲车间
乙车间
依据小概率值α=0.05的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?依据小概率值α=0.01的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?(9分)
(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率.如果>p+1.65,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)(8分)
附:χ2=.
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
解 (1)零假设为H0:甲、乙两车间产品的优级品率不存在差异.
根据题意可得列联表:
优级品 非优级品
甲车间 26 24
乙车间 70 30
可得χ2===4.687 5,
因为3.841<4.687 5<6.635,
所以依据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为甲、乙两车间产品的优级品率存在差异;依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为甲、乙两车间产品的优级品率不存在差异.
(2)由题意可知,生产线智能化升级改造后,该工厂产品的优级品的频率为=0.64,
用频率估计概率可得=0.64,
又因为升级改造前该工厂产品的优级品率p=0.5,
则p+1.65=0.5+1.65≈0.5+1.65×≈0.567,
可知>p+1.65,
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.

展开更多......

收起↑

资源预览