资源简介 第八章-成对数据的统计分析专题 学案问题层级图目标层级图课前检测(20mins)1.对分类变量与的随机变量的观测值,下列说法正确的是 ( )(A) 越大,“与有关系”可信度越小.(B) 越小,“与有关系”可信度越小.(C) 越接近于0,“与无关”程度越小.(D) 越大,“与无关”程度越大.2.假设关于某设备使用年限和所支出的维修费用(万元)有如下的统计资料:使用年限 2 3 4 5 6维修费用 2.2 3.8 5.5 6.5 7.0若由资料知对呈线性相关关系.试求:(1)线性回归方程的回归系数;(2)估计使用年限为10时,维修费用是多少 课中讲解能够准确计算并运用线性规划 LV.3(一)线性回归分析一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认具有线性相关关系后,再求回归直线方程.回归分析的一般步骤为:1.从一组数据出发,画出散点图,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义;2.如果具有线性相关关系,求出回归方程,其中是常数项, 是回归系数;3.根据回归方程,由一个变量的值,预测或控制另一个变量的值.(二)估计线性回归模型中的未知参数和时,一般利用最小二乘法.其计算公式为:其中,.对此公式不要求记忆,但要会用.例1.如果相互关联的两变量,一个增大另一个也增大,一个减小另一个也减小,变化方向一致,这叫做两变量之间有()。 负相关 B.正相关 C.完全相关 D.零相关例2.从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:身高 160 165 170 175 180体重 63 66 70 72 74根据上表可得回归直线方程,据此模型预报身高为的高三男生的体重为( )A. B.C. D.例3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值计算,得,,,,则其回归直线方程为( ). .. .过关检测(10mins)1.调查了某地若干户家庭的年收入 (单位:万元)和年饮食支出 (单位:万元),调查显示年收入与年饮食支出具有线性相关关系,并由调查数据得到对的回归直线方程:.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.2.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩、物理成绩进行分析.下面是该生7次考试的成绩:数学 88 83 117 92 108 100 112物理 94 91 108 96 104 101 106已知该生的物理成绩与数学成绩是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理性建议.二. 可以理解独立性检验意义LV.3根据独立性检验的基本思想,可知对于的观测值,存在一个正数为判断规则的临界值,当,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量没有关系”.在实际应用中,我们把解释为有的把握认为“两个分类变量之间有关系”;把解释为不能以的把握认为“两个分类变量之间有关系”,或者样本观测数据没有提供“两个分类变量之间有关系”的充分证据。表一:临界值表0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.0011.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828例1.当时,就有________的把握认为“与有关系”例2.下列说法正确的是________.(填序号)①对事件与的检验无关,即两个事件互不影响;②事件与关系越密切,就越大;③的大小是判断事件与是否相关的惟一数据;④若判定两事件与有关,则发生一定发生.例3.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 专业 性别 非统计专业 统计专业男 13 10女 7 20为了判断主修统计专业是否与性别有关系,根据表中的数据,得到.因为,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.例4.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )若的观测值满足,我们有的把握认为吸烟与患肺病有关系,那么在个吸烟的人中必有人患有肺病;②从独立性检验可知有的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有的可能患有肺病;③从统计量中得知有的把握认为吸烟与患肺病有关系,是指有的可能性使得推断出现错误A.① B.①③C.③ D.②过关检测(10mins)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计爱好 40 20 60不爱好 20 30 50总计 60 50 110算得:附表:0.050 0.010 0.0013.841 6.635 10.828参照附表,得到的正确结论是( )A.有以上的把握认为“爱好该项运动与性别有关”B.有以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”三. 能够准确计算“卡方”LV.4一般地,假设有两个分类变量和,它们的值域分别为和,其样本频数列联表(称为列联表)为:总计总计我们利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”,这种方法称为两个分类变量的独立性检验.例1.为了比较注射、两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物,另一组注射药物.下表1和表2分别是注射药物和后的试验结果:(疱疹面积单位: )表1:注射药物后皮肤疱疹面积的频数分布表:疱疹面积 [60,65) [65,70) [70,75) [75,80)频数 30 40 20 10表2:注射药物后皮肤疱疹面积的频数分布表:疱疹面积 [60,65) [65,70) [70,75) [75,80) [80,85)频数 10 25 20 30 15完成下面列联表,并回答能否有的把握认为“注射药物后的疱疹面积与注射药物后疱疹面积有差异”.表3疱疹面积小于 疱疹面积不小于 合计注射药物注射药物合计附:0.10 0.05 0.025 0.010 0.0012.706 3.841 5.024 6.635 10.828例2.某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:60分以下 61~70分 71~80分 81~90分 91~100分甲班(人数) 3 6 11 18 12乙班(人数) 4 8 13 15 10现规定平均成绩在80分以上(不含80分)的为优秀.由以上统计数据填写下面2×2列联表,并问是否有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.优秀人数 非优秀人数 合计甲班乙班合计参考公式及数据:,0.25 0.15 0.10 0.05 0.025 0.010 0.0011.323 2.072 2.706 3.841 5.024 6.635 10.828例3.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:支持新教材 支持旧教材 合计教龄在15年以上的教师 12 25 37教龄在15年以下的教师 10 24 34合计 22 49 71根据此资料,你是否认为教龄的长短与支持新的数学教材有关?过关检测(15mins)1.下表是某地区的一种传染病与饮用水的调查表:得病 不得病 总计干净水 52 466 518不干净水 94 218 312总计 146 684 830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.2.某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A、B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下.记成绩不低于90分者为“成绩优秀”.由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关.甲班(A方式) 乙班(B方式) 总计成绩优秀成绩不优秀总计附:0.10 0.05 0.025 0.010 0.0012.706 3.841 5.024 6.635 10.828课后练习补救练习(20mins)1.以下四个命题:从匀速传递的产品生产流水线上,质检员每从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1;在线性回归方程中,当解释变量每增加一个单位时,预报变量平均增加0.2个单位;对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大.其中正确命题的序号是________.2.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:气温(℃) 18 13 10 -1杯数 24 34 38 64由表中数据算得线性回归方程中的,预测当气温为时,热茶销售量为________杯.备注:已知回归系数3.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.图1-6将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷 体育迷 合计男女 10 55合计附:0.10 0.05 0.025 0.010 0.0012.706 3.841 5.024 6.635 10.828巩固练习(20mins)1.设某大学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归方程为,则下列结论中不正确的是( )A.与具有正的线性相关关系B.回归直线过样本点的中心C.若该大学某女生身高增加,则其体重约增加D.若该大学某女生身高为,则可断定其体重必为2.在2022年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价元和销售量件之间的一组数据如下表所示:价格 9 9.5 10 10.5 11销售量 11 10 8 6 5通过分析,发现销售量对商品的价格具有线性相关关系,则销售量对商品的价格的回归直线方程为________.3.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别 是否需要志愿者 男 女需要 40 30不需要 160 270(1)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(2)根据(1)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:0.10 0.05 0.025 0.010 0.0012.706 3.841 5.024 6.635 10.828拔高练习(20mins)1.分类变量和的列表如下,则下列说法判断正确的是________.(填序号)总计总计①越小,说明和的关系越弱;②越大,说明和的关系越强;③越大,说明和的关系越强;④越接近于0,说明和的关系越强.2.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组 [29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02)频数 12 63 86 182分组 [30.02,30.06) [30.06,30.10) [30.10,30.14)频数 92 61 4乙厂:分组 [29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02)频数 29 71 85 159分组 [30.02,30.06) [30.06,30.10) [30.10,30.14)频数 76 62 18由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.第八章-成对数据的统计分析专题 学案问题层级图目标层级图课前检测(20mins)1.对分类变量与的随机变量的观测值,下列说法正确的是 ( )(A) 越大,“与有关系”可信度越小.(B) 越小,“与有关系”可信度越小.(C) 越接近于0,“与无关”程度越小.(D) 越大,“与无关”程度越大.【解析】是反映变量与是否有相关关系的一个重要参数。值越大,说明备选假设“与有关系”成立。因此,越大,可信度越大;越小,可信度越小。【答案】2.假设关于某设备使用年限和所支出的维修费用(万元)有如下的统计资料:使用年限 2 3 4 5 6维修费用 2.2 3.8 5.5 6.5 7.0若由资料知对呈线性相关关系.试求:(1)线性回归方程的回归系数;(2)估计使用年限为10时,维修费用是多少 解题思路求回归直线方程的计算量较大,需要细心、谨慎地计算.可以通过列表,计算出,,,,后将这些量代入公式计算.解析:(1)制表如下:1 2 3 4 5 合计2 3 4 5 6 202.2 3.8 5.5 6.5 7.0 254.4 11.4 22.0 32.5 42.0 112.3 4 9 16 25 36 90 ; ; ;于是,.(2)回归直线方程为.当时, ,即估计使用10年时,维修费用是12.38万元.课中讲解能够准确计算并运用线性规划 LV.3(一)线性回归分析一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认具有线性相关关系后,再求回归直线方程.回归分析的一般步骤为:1.从一组数据出发,画出散点图,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义;2.如果具有线性相关关系,求出回归方程,其中是常数项, 是回归系数;3.根据回归方程,由一个变量的值,预测或控制另一个变量的值.(二)估计线性回归模型中的未知参数和时,一般利用最小二乘法.其计算公式为:其中,.对此公式不要求记忆,但要会用.例1.如果相互关联的两变量,一个增大另一个也增大,一个减小另一个也减小,变化方向一致,这叫做两变量之间有()。 负相关 B.正相关 C.完全相关 D.零相关【答案】B例2.从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:身高 160 165 170 175 180体重 63 66 70 72 74根据上表可得回归直线方程,据此模型预报身高为的高三男生的体重为( )A. B.C. D.【答案】B【解析】∴将点代入中得,∴回归直线方程,代入,则其体重为.例3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值计算,得,,,,则其回归直线方程为( )A. B.C. D.【答案】A【解析】 由,,,知:,,过关检测(10mins)1.调查了某地若干户家庭的年收入 (单位:万元)和年饮食支出 (单位:万元),调查显示年收入与年饮食支出具有线性相关关系,并由调查数据得到对的回归直线方程:.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【答案】 0.254【解析】 由回归直线方程为知收入每增加1万元,饮食支出平均增加0.254万元.2.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩、物理成绩进行分析.下面是该生7次考试的成绩:数学 88 83 117 92 108 100 112物理 94 91 108 96 104 101 106已知该生的物理成绩与数学成绩是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理性建议.【解析】由于与之间具有线性相关关系,根据回归系数公式得到∴回归直线方程为当时,,即该生物理成绩达到分时,他的数学成绩大约为分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.二. 可以理解独立性检验意义LV.3根据独立性检验的基本思想,可知对于的观测值,存在一个正数为判断规则的临界值,当,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量没有关系”.在实际应用中,我们把解释为有的把握认为“两个分类变量之间有关系”;把解释为不能以的把握认为“两个分类变量之间有关系”,或者样本观测数据没有提供“两个分类变量之间有关系”的充分证据。表一:临界值表0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.0011.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828例1.当时,就有________的把握认为“与有关系”【答案】例2.下列说法正确的是________.(填序号)①对事件与的检验无关,即两个事件互不影响;②事件与关系越密切,就越大;③的大小是判断事件与是否相关的惟一数据;④若判定两事件与有关,则发生一定发生.【答案】②例3.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 专业 性别 非统计专业 统计专业男 13 10女 7 20为了判断主修统计专业是否与性别有关系,根据表中的数据,得到.因为,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.【答案】 【解析】 根据独立性检验临界值表可知“与有关系”的可信度,,∴有的可能认为与有关系,即判断出错的可能性为.例4.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )若的观测值满足,我们有的把握认为吸烟与患肺病有关系,那么在个吸烟的人中必有人患有肺病;②从独立性检验可知有的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有的可能患有肺病;③从统计量中得知有的把握认为吸烟与患肺病有关系,是指有的可能性使得推断出现错误A.① B.①③C.③ D.②【答案】 【解析】①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除,③正确.排除,选.过关检测(10mins)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计爱好 40 20 60不爱好 20 30 50总计 60 50 110算得:附表:0.050 0.010 0.0013.841 6.635 10.828参照附表,得到的正确结论是( )A.有以上的把握认为“爱好该项运动与性别有关”B.有以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”【答案】 A【解析】 根据独立性检验的定义,由可知,有以上把握认为“爱好该项运动与性别有关”.三. 能够准确计算“卡方”LV.4一般地,假设有两个分类变量和,它们的值域分别为和,其样本频数列联表(称为列联表)为:总计总计我们利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”,这种方法称为两个分类变量的独立性检验.例1.为了比较注射、两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物,另一组注射药物.下表1和表2分别是注射药物和后的试验结果:(疱疹面积单位: )表1:注射药物后皮肤疱疹面积的频数分布表:疱疹面积 [60,65) [65,70) [70,75) [75,80)频数 30 40 20 10表2:注射药物后皮肤疱疹面积的频数分布表:疱疹面积 [60,65) [65,70) [70,75) [75,80) [80,85)频数 10 25 20 30 15完成下面列联表,并回答能否有的把握认为“注射药物后的疱疹面积与注射药物后疱疹面积有差异”.表3疱疹面积小于 疱疹面积不小于 合计注射药物注射药物合计附:0.10 0.05 0.025 0.010 0.0012.706 3.841 5.024 6.635 10.828【解析】疱疹面积小于 疱疹面积不小于 合计注射药物注射药物合计由于,所以有的把握认为“注射药物后的疱疹面积与注射药物后的疱疹面积有差异”.例2.某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:60分以下 61~70分 71~80分 81~90分 91~100分甲班(人数) 3 6 11 18 12乙班(人数) 4 8 13 15 10现规定平均成绩在80分以上(不含80分)的为优秀.由以上统计数据填写下面2×2列联表,并问是否有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.优秀人数 非优秀人数 合计甲班乙班合计参考公式及数据:,0.25 0.15 0.10 0.05 0.025 0.010 0.0011.323 2.072 2.706 3.841 5.024 6.635 10.828【解析】优秀人数 非优秀人数 合计甲班 30 20 50乙班 25 25 50合计 55 45 100因为所以由参考数据知,没有的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.例3.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:支持新教材 支持旧教材 合计教龄在15年以上的教师 12 25 37教龄在15年以下的教师 10 24 34合计 22 49 71根据此资料,你是否认为教龄的长短与支持新的数学教材有关?【解析】由公式得.∵∴我们没有理由说教龄的长短与支持新的数学教材有关.过关检测(15mins)1.下表是某地区的一种传染病与饮用水的调查表:得病 不得病 总计干净水 52 466 518不干净水 94 218 312总计 146 684 830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.【解析】 (1)假设:传染病与饮用水的卫生程度无关.由公式得因为.因此我们有的把握认为该地区这种传染病与饮用水的卫生程度有关.(2)依题意得2×2列联表:得病 不得病 总计干净水 5 50 55不干净水 9 22 31总计 14 72 86此时,由于,所以我们有的把握认为该种传染病与饮用水的卫生程度有关.两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)问中我们有的把握肯定结论的正确性,(2)问中我们只有的把握肯定结论的正确性.2.某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A、B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下.记成绩不低于90分者为“成绩优秀”.由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关.甲班(A方式) 乙班(B方式) 总计成绩优秀成绩不优秀总计附:0.10 0.05 0.025 0.010 0.0012.706 3.841 5.024 6.635 10.828【解析】由已知数据得:甲班(A方式) 乙班(B方式) 总计成绩优秀 1 5 6成绩不优秀 19 15 34总计 20 20 40根据列联表中数据,,由于,所以有的把握认为“成绩优秀”与教学方式有关.课后练习补救练习(20mins)1.以下四个命题:从匀速传递的产品生产流水线上,质检员每从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1;在线性回归方程中,当解释变量每增加一个单位时,预报变量平均增加0.2个单位;对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大.其中正确命题的序号是________.【答案】 ②③2.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:气温(℃) 18 13 10 -1杯数 24 34 38 64由表中数据算得线性回归方程中的,预测当气温为时,热茶销售量为________杯.备注:已知回归系数【答案】 70【解析】 根据表格中的数据可求得,∴,∴,当时,3.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.图1-6将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷 体育迷 合计男女 10 55合计附:0.10 0.05 0.025 0.010 0.0012.706 3.841 5.024 6.635 10.828【解析】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:非体育迷 体育迷 合计男 30 15 45女 45 10 55合计 75 25 100将2×2列联表中的数据代入公式计算,得因为3.030<3.841,所以有的把握认为“体育迷”与性别没有关希.巩固练习(20mins)1.设某大学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归方程为,则下列结论中不正确的是( )A.与具有正的线性相关关系B.回归直线过样本点的中心C.若该大学某女生身高增加,则其体重约增加D.若该大学某女生身高为,则可断定其体重必为【答案】 D【解析】 本题考查线性回归方程.D项中身高为时,体重“约为”,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系.2.在2022年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价元和销售量件之间的一组数据如下表所示:价格 9 9.5 10 10.5 11销售量 11 10 8 6 5通过分析,发现销售量对商品的价格具有线性相关关系,则销售量对商品的价格的回归直线方程为________.【答案】 【解析】 ,,, ,代入公式,得,所以,,故回归直线方程为 .3.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别 是否需要志愿者 男 女需要 40 30不需要 160 270(1)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(2)根据(1)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:0.10 0.05 0.025 0.010 0.0012.706 3.841 5.024 6.635 10.828【解析】(1) 科网]由于,所以有的把握认为该地区的老年人是否需要帮助与性别有关.(2)由(1)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.拔高练习(20mins)1.分类变量和的列表如下,则下列说法判断正确的是________.(填序号)总计总计①越小,说明和的关系越弱;②越大,说明和的关系越强;③越大,说明和的关系越强;④越接近于0,说明和的关系越强.【答案】③2.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组 [29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02)频数 12 63 86 182分组 [30.02,30.06) [30.06,30.10) [30.10,30.14)频数 92 61 4乙厂:分组 [29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02)频数 29 71 85 159分组 [30.02,30.06) [30.06,30.10) [30.10,30.14)频数 76 62 18由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.【解析】列表:甲厂 乙厂 总计优质品 360 320 680非优质品 140 180 320总计 500 500 1 000由列联表中的数据,得所以有99%的把握认为“两个分厂生产的零件的质量有差异”. 展开更多...... 收起↑ 资源列表 第八章-成对数据的统计分析 学案-2022-2023高二下学期.docx 第八章-成对数据的统计分析讲义解析版-2022-2023高二下学期.docx