资源简介 中小学教育资源及组卷应用平台第九章 统计与成对数据的统计分析(综合训练)(考试时间:120分钟 试卷满分:150分)注意事项:1.答卷前,考生务必将自己的姓名、准考证号填写在答题卡上。2.回答选择题时,选出每小题答案后,用铅笔把答题卡对应题目的答案标号涂黑。如需改动,用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上。写在本试卷上无效。3.考试结束后,将本试卷和答题卡一并交回。第一部分(选择题 共58分)一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.对四组数据进行统计,获得如图散点图,其中线性相关性比较强且负相关的是( )A. B. C. D.2.已知两个线性相关变量与的统计数据如下表:其回归直线方程是,据此计算,则样本点在处的残差为( )A. B. C. D.3.已知一组数据的线性回归方程为,若的平均值为3,则的平均值为( )A.5 B.6 C.7 D.84.某兴趣小组研究光照时长和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,如下表所示.若去掉最后一组数据后,下列说法正确的是( )光照时长 1 2 3 8 10种子发芽数量y(颗) 4 6 5 11 2A.相关系数r的绝对值变小 B.相关变量具有负相关关系C.拟合误差变大 D.解释变量与响应变量的相关性变强5.某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20,则下列结论正确的是( )附表:0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828附:,其中.A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关C.根据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关D.是否接受去外地长时间出差与性别无关6.为了研究变量与的线性相关关系,收集了5组样本数据(如下表),若去掉样本点后,则样本的相关系数( )1 2 3 4 50.5 0.8 1 1.2 1.5A.变大 B.变小 C.不变 D.不能确定7.下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量(单位:百只)的数据,通过相关理论进行分析,知可用回归模型对与的关系进行拟合,则根据该回归模型,预测第7个月该物种的繁殖数量为( )第个月 1 2 3繁殖数量A.百只 B.百只 C.百只 D.百只8.已知变量,的5对样本数据为,,,,,用最小二乘法得到经验回归方程:,过点,的直线方程为:,则( )A.B.样本数据的残差为C.D.二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.9.已知变量x,y之间的线性回归方程为,且变量x,y之间的一组相关数据如表所示,则下列说法正确的是( ).x 6 8 10 12y 6 m 3 2A.变量x,y之间呈现负相关关系 B.C.可以预测,当时,y约为2.6 D.由表格数据知,该回归直线必过点10.根据分类变量x与y的成对样本数据,提出零假设,并计算得到,则下列说法正确的是( )0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828附:A.零假设为:分类变量x与y独立B.根据小概率值的独立性检验,可以认为x与y不独立,这个结论犯错误的概率不超过0.1C.根据小概率值的独立性检验,可以认为x与y不独立,这个结论犯错误的概率不超过0.01D.若所有样本数据都扩大为原来的10倍,根据小概率值的独立性检验,可以认为x与y不独立,这个结论犯错误的概率不超过0.0111.两个具有相关关系的变量的一组数据为,,…,,其经验回归方程为,记,,决定系数为;若将数据调整为,,…,,其经验回归方程为,记,决定系数为,则( )附:,,A. B. C. D.第二部分(非选择题 共92分)三、填空题:本题共3小题,每小题5分,共15分.12.两个相关变量的…组数据统计如下表2 3 4 5 62.8 3.1 3.3 3.8 4.0根据上表可得经验回归方程中的,据此经验回归方程,当时,的预测值为 ;13.某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生至少有 人.参考数据:,14.将某保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中个区域,统计这些区域内的某种水源指标和某植物分布的数量,得到样本,且其相关系数,记关于的线性回归公式为.经计算可知:,,,则 .x 1 2 3 5 7 10 11 20 25 30y 9.02 5.27 4.06 3.03 2.59 2.28 2.21 1.89 1.80 1.75四、解答题:本题共5小题,其中第15题13分,第16,17题15分,第18,19题17分,共77分.解答应写出文字说明、证明过程或演算步骤.15.某兴趣小组研究发现昼夜温差变化的大小与患感冒人数之间具有较强的线性相关关系,该兴趣小组在惠民医院抄录了2025年月份每月5日的昼夜温差情况以及附近的居民因患感冒到惠民医院就诊的人数,得到如下数据:日期 2月5日 3月5日 4月5日 5月5日昼夜温差 11 13 12 8因患感冒就诊人数(人) 25 29 26 16(1)求因患感冒到惠民医院就诊的人数关于昼夜温差的线性回归方程;(2)如果8月5日昼夜温差是时,试预测因患感冒到惠民医院就诊的人数(精确到整数).附:线性回归直线中,;16.某种传染性疾病的检测通过采集血样利用相关检测试剂盒进行检测,若呈阳性,则诊断为患病,若呈阴性,则诊断为不患病.某企业开发了一种新型检测试剂盒,现采用卡方检验的方法检验该试剂盒的检测效果,为此随机抽取了100份患病的血样和100份不患病的血样进行检验,试验结果显示,100份患病的血样中,检测出阳性血样90份,阴性血样10份;100份不患病的血样中,检测出5份阳性血样,95份阴性血样.(1)填写下面列联表,记检测结果为阳性者患该疾病的概率为,求的估计值;检测结果 患病情况 合计患病 不患病阳性阴性合计(2)根据小概率值的独立性检验,判断某人血样经该检测试剂盒检测的诊断结果与其患病是否有关.附:,其中.0.050 0.010 0.0013.841 6.635 10.82817.某田径协会组织开展竞走的步长和步频之间关系的课题研究,得到相应的试验数据:步频x(单位:步/s) 0.28 0.29 0.30 0.31 0.32步长y(单位:cm) 90 95 99 m 115(1)若步频和步长近似为线性相关关系,当时,,,根据表中数据,求出y关于x的回归直线方程.附:回归直线方程中,(2)记,其中为观测值,为预测值,为对应的残差,根据表中数据,若得出y关于x的经验回归方程为,且计算出在样本点处的残差为,求实数m的值.18.为了研究广告支出与销售额的关系,现随机抽取5家超市作为样本,得到其广告支出x(单位:万元)与销售额W(单位:万元)数据如下:超市 A B C D E广告支出x 1 2 3 4 5销售额W 4 9 14 18(1)当时,根据表中样本数据,计算相关系数r,并推断它们的相关程度(保留两位小数);(2)根据表中样本数据,用最小二乘法得到销售额W关于广告支出x的回归直线方程为,销售额W的方差为52.4,求的值,并计算广告支出为5(万元)时销售额的残差;(3)收集更多变量和的成对样本数据,由一元线性回归模型得到经验回归模型,对应的残差如图所示,则模型误差是否满足一元线性回归模型的与的假设(直接写出结果).附:相关系数,回归系数,参考数据:.19.某校开设劳动教育课程,共设置了两类课程:家政和园艺,共有400名学生参加.学校对选择了这两类课程的学生人数的分布进行了统计,相关数据记录在如下表格中,但其中有缺失.已知男生中选择家政课的比例为.课程 性别 合计男 女家政 160园艺 120合计 400(1)根据小概率值的独立性检验,能否认为学生选择不同劳动教育课程与性别有关联?(2)学校对某一课程中教授同一知识点教师的教授时长与学生任务完成率进行了跟进,授课时长(分钟)和学生任务完成率的对应数据如下:时长 20 24 28 32 36 40完成率 50 70 60 66 72 84在任务完成率不全相等的条件下,学校为了调研是否存在学生任务完成率与平均完成率偏差过大的情况,需计算偏差系数,现给出以下两种数据处理方式:甲:,乙:,已知偏差系数越大的处理方式,对于数据中大偏差数据的存在体现得越明显.①用两种处理方式分别计算学生任务完成率的偏差系数,并指出哪一种数据处理方式对大偏差数据的存在体现更明显;②判断此后学校每次调研均采用①中对大偏差数据的存在体现更明显的数据处理方式是否合理,并证明你的判断.附:.0.1 0.01 0.0012.706 6.635 10.828中小学教育资源及组卷应用平台第九章 统计与成对数据的统计分析(综合训练)(考试时间:120分钟 试卷满分:150分)注意事项:1.答卷前,考生务必将自己的姓名、准考证号填写在答题卡上。2.回答选择题时,选出每小题答案后,用铅笔把答题卡对应题目的答案标号涂黑。如需改动,用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上。写在本试卷上无效。3.考试结束后,将本试卷和答题卡一并交回。第一部分(选择题 共58分)一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.对四组数据进行统计,获得如图散点图,其中线性相关性比较强且负相关的是( )A. B. C. D.【答案】B【分析】根据散点图和相关性的关系,判断结果.【详解】由散点图知,相关系数对应的散点图呈负相关,线性相关性比较强.故选:B.2.已知两个线性相关变量与的统计数据如下表:其回归直线方程是,据此计算,则样本点在处的残差为( )A. B. C. D.【答案】B【分析】根据样本中心点在回归直线方程上,可得的值,然后计算样本估计值,从而得到残差.【详解】根据题意,,又在回归直线方程上,所以,所以回归直线方程为,时,得到预估值为3.15,所以样本点在处的残差为.故选:B.3.已知一组数据的线性回归方程为,若的平均值为3,则的平均值为( )A.5 B.6 C.7 D.8【答案】C【分析】由回归方程过点结合题意可得答案.【详解】由题,过点,则.故选:C4.某兴趣小组研究光照时长和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,如下表所示.若去掉最后一组数据后,下列说法正确的是( )光照时长 1 2 3 8 10种子发芽数量y(颗) 4 6 5 11 2A.相关系数r的绝对值变小 B.相关变量具有负相关关系C.拟合误差变大 D.解释变量与响应变量的相关性变强【答案】D【分析】观察图象,较其他的点偏离回归直线最大,去掉后,回归效果更好,结合相关系数、正负相关性、残差平方和以及相关性逐项分析判断.【详解】观察图象知:较其他的点偏离回归直线最大,因此去掉后,回归效果更好,对于A,相关系数越接近于1,线性相关性越强,因此去掉后,相关系数的绝对值变大,A错误;对于B,由表格数据可知越大,越大,所以相关变量具有正相关关系,B错误;对于C,因为残差平方和越大,拟合效果越差,因此去掉后,残差平方和变小,拟合误差变小,C错误;对于D,由选项A知,去掉后,相关系数的绝对值变大,因此解释变量与响应变量的相关性变强,D正确.故选:D5.某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20,则下列结论正确的是( )附表:0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828附:,其中.A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关C.根据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关D.是否接受去外地长时间出差与性别无关【答案】B【分析】求得卡方值,比对临界值,逐个判断即可.【详解】由题意,列出列联表:接受 不接受 合计男 40 60 100女 20 80 100合计 60 140 200零假设为:是否接受去外地长时间出差与性别相互独立,即是否接受去外地长时间出差与性别无关,所以,根据小概率值的独立性检验,我们推断不成立,即认为是否接受去外地长时间出差与性别有关,此推断犯错误的概率不大于0.005.故选:B.6.为了研究变量与的线性相关关系,收集了5组样本数据(如下表),若去掉样本点后,则样本的相关系数( )1 2 3 4 50.5 0.8 1 1.2 1.5A.变大 B.变小 C.不变 D.不能确定【答案】C【分析】根据相关系数公式计算得解.【详解】因为相关系数为,,,5组样本数据的,,相关系数为:,去掉样本中心点后,四组数据的,,相关系数为:,所以相关系数r不变.故选:C7.下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量(单位:百只)的数据,通过相关理论进行分析,知可用回归模型对与的关系进行拟合,则根据该回归模型,预测第7个月该物种的繁殖数量为( )第个月 1 2 3繁殖数量A.百只 B.百只 C.百只 D.百只【答案】B【分析】对两边取自然对数得,令,则,由回归直线必过样本点的中心即可求得,进而得解.【详解】由两边取自然对数得,令,则,即与呈线性相关关系,,,回归直线必过样本点的中心,,解得,,则,当时,.故选:B8.已知变量,的5对样本数据为,,,,,用最小二乘法得到经验回归方程:,过点,的直线方程为:,则( )A.B.样本数据的残差为C.D.【答案】D【分析】对于A,由回归方程必过样本中心点可知,只需求出样本中心就可以求出,进一步由直线方程的知识求出即可判断;对于B,由残差的定义即可判断;对于CD,由最小二乘法的意义即可判断.【详解】对于A选项,由已知可得,,,根据经验回归方程,可知,所以.根据已知,可求出,则直线的方程为,整理可得,所以,故A选项错误;对于B项,由已知,经验回归方程为,样本数据的预测值为,所以样本数据的残差为,故B项错误;对于C、D选项,根据最小二乘法的意义,可知,故D项正确.故选:D.二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.9.已知变量x,y之间的线性回归方程为,且变量x,y之间的一组相关数据如表所示,则下列说法正确的是( ).x 6 8 10 12y 6 m 3 2A.变量x,y之间呈现负相关关系 B.C.可以预测,当时,y约为2.6 D.由表格数据知,该回归直线必过点【答案】ACD【分析】根据回归直线斜率知A正确;利用回归直线必过样本中心点可构造方程求得,可知B错误,D正确;将代入回归直线知C正确.【详解】对于A,由,得,故呈负相关关系,故A正确;对于B,,,,解得,故B错误;对于C,当时,,故C正确;对于D,由得,回归直线必过点,即必过点,故D正确.故选:ACD.10.根据分类变量x与y的成对样本数据,提出零假设,并计算得到,则下列说法正确的是( )0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828附:A.零假设为:分类变量x与y独立B.根据小概率值的独立性检验,可以认为x与y不独立,这个结论犯错误的概率不超过0.1C.根据小概率值的独立性检验,可以认为x与y不独立,这个结论犯错误的概率不超过0.01D.若所有样本数据都扩大为原来的10倍,根据小概率值的独立性检验,可以认为x与y不独立,这个结论犯错误的概率不超过0.01【答案】ABD【分析】根据独立性检验的相关理论,可以判断ABC的真假,计算新数据的,判断D的真假.【详解】对A:零假设:分类变量x与y独立.是正确的,故A正确;对B:因为,所以根据小概率值的独立性检验,可以认为x与y不独立,这个结论犯错误的概率不超过0.1,故B正确;对C:因为,根据小概率值的独立性检验,我们不能拒绝零假设,即可以认为x与y独立.故C错误;对D:根据,当所有样本数据都扩大为原来的10倍,的值夜变成原来的10倍,且,所以根据小概率值的独立性检验,可以认为x与y不独立,这个结论犯错误的概率不超过0.01,故D正确.故选:ABD11.两个具有相关关系的变量的一组数据为,,…,,其经验回归方程为,记,,决定系数为;若将数据调整为,,…,,其经验回归方程为,记,决定系数为,则( )附:,,A. B. C. D.【答案】BC【分析】根据题意,由以及的计算公式,代入计算,逐一判断,即可得到结果.【详解】,А错误;的计算中,数据不变,也不变,所以不变,B正确;,C正确;由于,变成了,,,从而,都不变,所以,D错误.故选:BC第二部分(非选择题 共92分)三、填空题:本题共3小题,每小题5分,共15分.12.两个相关变量的…组数据统计如下表2 3 4 5 62.8 3.1 3.3 3.8 4.0根据上表可得经验回归方程中的,据此经验回归方程,当时,的预测值为 ;【答案】4.33【分析】先根据表格求出的平均值,然后代入经验回归方程求出,然后得到经验回归方程的解析式,最后将代入方程即可得到预测值.【详解】根据表格数据可得:,.因为经验回归方程过点,,所以,解得.所以经验回归方程为.当时,.故答案为:4.33.13.某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生至少有 人.参考数据:,【答案】45【分析】设被调查的男女生为人,写出列联表,应用卡方公式求卡方值,结合求参数范围,进而确定被调查的男生为,即可答案.【详解】设被调查的男女生为人,则男生喜欢抖音有人,女生喜欢抖音有人,所以列联表如下:喜欢抖音 不喜欢抖音 总计男生女生总计则,解得,因此被调查的男生为,又,则人数是5的正整数倍,所以大于等于45的5的整数倍都符合题意,调查人数中男生至少有人.故答案为:14.将某保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中个区域,统计这些区域内的某种水源指标和某植物分布的数量,得到样本,且其相关系数,记关于的线性回归公式为.经计算可知:,,,则 .x 1 2 3 5 7 10 11 20 25 30y 9.02 5.27 4.06 3.03 2.59 2.28 2.21 1.89 1.80 1.75【答案】【分析】利用相关系数与回归系数的关系,结合已知数据计算.需要先求出,再通过求出分子,最后代入公式得到.【详解】因为,,所以.由,解得,所以.故答案为:四、解答题:本题共5小题,其中第15题13分,第16,17题15分,第18,19题17分,共77分.解答应写出文字说明、证明过程或演算步骤.15.某兴趣小组研究发现昼夜温差变化的大小与患感冒人数之间具有较强的线性相关关系,该兴趣小组在惠民医院抄录了2025年月份每月5日的昼夜温差情况以及附近的居民因患感冒到惠民医院就诊的人数,得到如下数据:日期 2月5日 3月5日 4月5日 5月5日昼夜温差 11 13 12 8因患感冒就诊人数(人) 25 29 26 16(1)求因患感冒到惠民医院就诊的人数关于昼夜温差的线性回归方程;(2)如果8月5日昼夜温差是时,试预测因患感冒到惠民医院就诊的人数(精确到整数).附:线性回归直线中,;【答案】(1)(2)19人【分析】(1)先求出,,然后利用公式求出,从而可求得回归方程;(2)将代入回归方程中求解估计即可.【详解】(1),,,所以,,所以所求线性回归方程为.(2)时,,因此如果8月5日昼夜温差是时,预测因患感冒到惠民医院就诊的人数大约为19人.16.某种传染性疾病的检测通过采集血样利用相关检测试剂盒进行检测,若呈阳性,则诊断为患病,若呈阴性,则诊断为不患病.某企业开发了一种新型检测试剂盒,现采用卡方检验的方法检验该试剂盒的检测效果,为此随机抽取了100份患病的血样和100份不患病的血样进行检验,试验结果显示,100份患病的血样中,检测出阳性血样90份,阴性血样10份;100份不患病的血样中,检测出5份阳性血样,95份阴性血样.(1)填写下面列联表,记检测结果为阳性者患该疾病的概率为,求的估计值;检测结果 患病情况 合计患病 不患病阳性阴性合计(2)根据小概率值的独立性检验,判断某人血样经该检测试剂盒检测的诊断结果与其患病是否有关.附:,其中.0.050 0.010 0.0013.841 6.635 10.828【答案】(1)列联表见解析,(2)有关,理由见解析【分析】(1)根据题意可直接填出列联表并计算出概率;(2)提出零假设,代入公式计算出的值,与参考值进行比较推断原假设是否成立,即可得出结论.【详解】(1)根据试验结果得列联表:检测结果 患病情况 合计患病 不患病阳性 90 5 95阴性 10 95 105合计 100 100 200检测结果为阳性的共95人,其中患病的为90人,所以的估计值为.(2)零假设为:某人血样经该检测试剂盒检测诊断结果是否为阳性与其是否患病无关,根据列联表数据计算得.根据小概率值的独立性检验,我们推断不成立,即认为某人血样经该检测试剂盒检测诊断结果是否为阳性与其是否患病有关,此推断犯错误的概率不超过0.001.17.某田径协会组织开展竞走的步长和步频之间关系的课题研究,得到相应的试验数据:步频x(单位:步/s) 0.28 0.29 0.30 0.31 0.32步长y(单位:cm) 90 95 99 m 115(1)若步频和步长近似为线性相关关系,当时,,,根据表中数据,求出y关于x的回归直线方程.附:回归直线方程中,(2)记,其中为观测值,为预测值,为对应的残差,根据表中数据,若得出y关于x的经验回归方程为,且计算出在样本点处的残差为,求实数m的值.【答案】(1)(2)【分析】(1)根据题意,分别求得,,且,得到,即可求得回归直线方程;(2)根据题意,列出方程,求得,结合,,列出方程,即可求解.【详解】(1)解:根据统计表格中的数据,可得,,又由,,可得,则,所以回归直线方程为.(2)解:由回归方程为,且计算出在样本点处的残差为,可得,解得,因为,,可得,解得.18.为了研究广告支出与销售额的关系,现随机抽取5家超市作为样本,得到其广告支出x(单位:万元)与销售额W(单位:万元)数据如下:超市 A B C D E广告支出x 1 2 3 4 5销售额W 4 9 14 18(1)当时,根据表中样本数据,计算相关系数r,并推断它们的相关程度(保留两位小数);(2)根据表中样本数据,用最小二乘法得到销售额W关于广告支出x的回归直线方程为,销售额W的方差为52.4,求的值,并计算广告支出为5(万元)时销售额的残差;(3)收集更多变量和的成对样本数据,由一元线性回归模型得到经验回归模型,对应的残差如图所示,则模型误差是否满足一元线性回归模型的与的假设(直接写出结果).附:相关系数,回归系数,参考数据:.【答案】(1),相关性很强(2),0.8(3)满足一元线性回归模型的的假设,不满足一元线性回归模型的的假设.【分析】(1)求出和,求出即可求解;(2)根据销售额的方差52.4列方程求解,求出和,求出,求出销售量关于广告支出的回归直线方程即可求解;(3)根据残差图的性质即可求解.【详解】(1)由题知,0 1 21 5 7,,,相关系数,接近于1,可以推断两个变量正线性相关,且相关性很强;(2)因为销售额的方差52.4,即,所以,化为,解得(舍去),所以,因为回归直线方程为经过样本中心点,把代入得,销售量关于广告支出的回归直线方程为,当时,代入得预测值,而观测值,所以广告支出为5(万元)时销售额度的残差:(万元);(3)由残差图,模型误差满足一元线性回归模型的的假设,不满足一元线性回归模型的的假设.19.某校开设劳动教育课程,共设置了两类课程:家政和园艺,共有400名学生参加.学校对选择了这两类课程的学生人数的分布进行了统计,相关数据记录在如下表格中,但其中有缺失.已知男生中选择家政课的比例为.课程 性别 合计男 女家政 160园艺 120合计 400(1)根据小概率值的独立性检验,能否认为学生选择不同劳动教育课程与性别有关联?(2)学校对某一课程中教授同一知识点教师的教授时长与学生任务完成率进行了跟进,授课时长(分钟)和学生任务完成率的对应数据如下:时长 20 24 28 32 36 40完成率 50 70 60 66 72 84在任务完成率不全相等的条件下,学校为了调研是否存在学生任务完成率与平均完成率偏差过大的情况,需计算偏差系数,现给出以下两种数据处理方式:甲:,乙:,已知偏差系数越大的处理方式,对于数据中大偏差数据的存在体现得越明显.①用两种处理方式分别计算学生任务完成率的偏差系数,并指出哪一种数据处理方式对大偏差数据的存在体现更明显;②判断此后学校每次调研均采用①中对大偏差数据的存在体现更明显的数据处理方式是否合理,并证明你的判断.附:.0.1 0.01 0.0012.706 6.635 10.828【答案】(1)能认为学生选择不同劳动教育课程与性别有关联(2)①甲的计算公式计算为,乙的计算公式计算为,乙;②是,证明见解析【分析】(1)根据所给条件计算出列联表中各项数据,再计算卡方统计量并与临界值比较判断零假设是否成立.(2)①算出甲、乙的偏差系数.先求数据均值,再按甲、乙公式分别计算偏差系数,比较大小后发现乙对大偏差数据体现更明显.②证明乙处理方式合理,也就是证.设,构造函数,由得二次函数判别式,进而推出不等式,令,最终证得.【详解】(1)设男生有人,故,解得,故男生中选择园艺课的人数为40人,又因为其有400人参加课程 所以女生有200人,女生中选择家政课的人数为80人.完善列联表,单位:人课程 性别 合计男 女家政 160 80 140园艺 40 120 160合计 200 200 400零假设为:选择不同劳动教育课程与性别无关联.因为,故依据小概率值的独立性检验,我们推断不成立,即认为学生选择不同劳动教育课程与性别有关联,此推断犯错误的概率不大于0.001.(2)①,根据甲的计算公式计算:,故;根据乙的计算公式计算:,易知,因此乙的偏差系数大,从而乙对大偏差数据的存在体现更明显.②采用①中对大偏差数据的存在体现更明显的数据处理方式,即乙的处理方式是合理的.证明:不妨设,只需证明恒成立.不妨设,为任意实数,则,,欲证,则证即可,即证即可,故证即可,设函数,结合完全平方公式得,则二次函数的,可得,即,从而对于原式,不妨令,得到,,得到,即恒成立,故此后学校每次调研均采用①中对大偏差数据的存在体现更明显的数据处理方式是合理的. 展开更多...... 收起↑ 资源列表 第九章 统计与成对数据的统计分析(综合训练)(原卷版)2026年高考数学一轮复习讲练测.docx 第九章 统计与成对数据的统计分析(综合训练)(解析版)2026年高考数学一轮复习讲练测.docx