资源简介 ☆注:请用Microsoft Word2016以上版本打开文件进行编辑,用WPS等其他软件可能会出现乱码等现象.专题八 概率与统计第2讲 统计案例1.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程为=x+,其中==, =-.(3)通过求的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.2.独立性检验(1)2×2列联表设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:y1 y2 总计x1 a b a+bx2 c d c+d总计 a+c b+d a+b+c+d(2)独立性检验利用随机变量K2(也可表示为χ2)的观测值k=(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.一.选择题(共8小题)1.通过随机询问200名性别不同的大学生是否爱好踢毽子运动,计算得到统计量K2的观测值k≈4.892,参照附表,得到的正确结论是( )P(K2≥k) 0.10 0.05 0.025k 2.706 3.841 5.024A.有97.5%以上的把握认为“爱好该项运动与性别有关”B.有97.5%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”2.某医疗研究所为了检验新开发的流感疫苗对甲型Hln1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型Hln1流感的作用”,并计算出P(Χ2≥6.635)≈0.01,则下列说法正确的是( )A.这种疫苗能起到预防甲型Hln1流感的有效率为1%B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型Hln1C.有1%的把握认为“这种疫苗能起到预防甲型Hln1流感的作用”D.有99%的把握认为“这种疫苗能起到预防甲型Hln1流感的作用”3.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:K2,其中n=a+b+c+d.参考数据:P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828A.130 B.190 C.240 D.2504.如图给出了某种豆类生长枝数y(枝)与时间t(月)的散点图,那么此种豆类生长枝数与时间的关系用下列函数模型近似刻画最好的是( )A.y=2t2 B.y=log2t C.y=t3 D.y=2t5.广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元):广告费x 2 3 4 5 6销售额y 29 41 50 59 71由上表可得回归方程为y=10.2x﹣a,据此模型,预测广告费为10万元时的销售额约为( )A.101.2 B.108.8 C.111.2 D.118.26.已知一组样本点(xi,yi)其中i=1,2,3,…,30根据最小二乘法求得的回归方程是bx+a则下列说法正确的是( )A.若所有样本点都在bx+a上,则变量间的相关系数为1B.至少有一个样本点落在回归直线bx+a上C.对所有的预报变量 xi(i=1,2,3,…,30),bxi+a的值一定与yi有误差D.若 bx+a斜率b>0则变量x与y正相关7.2020年初,新型冠状病毒(COVID﹣19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示:周数(x) 1 2 3 4 5治愈人数(y) 2 17 36 93 142由表格可得y关于x的二次回归方程为,则此回归模型第4周的残差(实际值与预报值之差)为( )A.5 B.4 C.1 D.08.某车间为了规划生产进度提高生产效率,记录了不同时段生产零件个数x(百个)与相应加工总时长y(小时)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为0.7x+0.05,则下列结论错误的是( )x 2 3 4 5y 1.5 2 m 3.5A.加工总时长与生产零件数呈正相关B.该回归直线一定过点(3.5,2.5)C.零件个数每增加1百个,相应加工总时长约增加0.7小时D.m的值是2.85二.多选题(共2小题)(多选)9.某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下所示的列联表.经计算K2的观测值k≈4.762,则可以推断出( )满意 不满意男 30 20女 40 10P(k2≥k) 0.100 0.050 0.010k 2.706 3.841 6.635A.该学校男生对食堂服务满意的概率的估计值为B.调研结果显示,该学校男生比女生对食堂服务更满意C.有95%的把握认为男、女生对该食堂服务的评价有差异D.有99%的把握认为男、女生对该食堂服务的评价有差异(多选)10.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列表述中不正确的是( )A.有95%的把握认为“这种血清能起到预防感冒的作用”B.若有人未使用该血清,那么他一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%三.解答题(共6小题)11.2020年4月底,随着新冠疫情防控进入常态化,为了促进消费复苏增长,上饶市开展“五一消费黄金周”系列活动,并发放亿元电子消费券.活动过后,我们随机抽取了50人,对是否使用过电子消费券进行调查,结果如表:年龄 (单位:岁) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70)抽取人数 2 10 13 12 10 3使用过消费券的人数 1 9 13 8 6 1若以“年龄40岁为分界点”,由以上统计数据完成下面2×2列联表,并判断是否有99%的把握认为使用电子消费券与按照40岁为分界点的人的年龄有关.年龄低于40岁的人数 年龄不低于40岁的人数 合计使用过消费券的人数没有使用消费券的人数合计参考数据:P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828,其中n=a+b+c+d.12.近些年美国政府对中国的打压对中国来说既是挑战也是机遇,但中国的复兴需要新一代青年牢牢树立国家意识,将自己理想与国家发展需要相结合,努力奋斗,投身于国家需要的行业中去.为了解高中生是否对“将自己的理想与国家的发展需要相结合”这一问题产生过思考,随机抽取了120名高中学生展开调查(其中文科学生60名,理科学生60名),统计数据如表所示:“思考过” “没思考过” 总计文科学生 50 10理科学生 40总计 120(1)补充上述列联表,并根据列联表判断能否在犯错率不超过5%的前提下认为是否思考过“将自己的理想与国家的发展需要相结合”这一问题与文理科学生有关?(2)从如表的120名学生中,用分层抽样抽取容量为8的样本,问其中“思考过”的学生有多少人?(3)在(2)问前提下,从“思考过”的学生(理科学生有2人)中随机选2人,问2名同学文理科不同的概率为多少?参考公式:,其中n=a+b+c+d.参考数据:P(K2≥k0) 0.050 0.010 0.001k0 3.841 6.635 10.82813.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米):男:173 178 174 185 170 169 167 164 161 170女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值.(2)请根据测量结果得到20名学生身高的中位数h(单位:厘米),将男、女生身高不低于h和低于h的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异?人数 男生 女生身高≥h身高<h参照公式:,n=a+b+c+d..P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001k0 2.706 3.841 5.024 6.635 7.879 10.828(3)若男生身高低于165厘米为偏矮,不低于165厘米且低于175厘米为正常,不低于175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.14.某位同学连续5次历史、政治的测试成绩如表:次数 1 2 3 4 5历史(x分) 79 81 83 85 87政治(y分) 77 79 79 82 83(1)求该生5次历史、政治成绩的平均分;(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x、y的线性回归方程.参考公式:,,,表示样本均值.15.某百货公司1~6月份的销售量x与利润y的统计数据如表:月份 1 2 3 4 5 6销售量x(万件) 10 11 13 12 8 6利润y(万元) 22 25 29 26 16 12附:)(1)根据2~5月份的统计数据,求出y关于x的回归直线方程x;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差均不超过2万元,则认为得到的回归直线方程是理想的,试问所得回归直线方程是否理想?(参考公式:.)16.2019年11月份,全国工业生产者出厂价格同比下降1.4%,环比下降0.1%某企业在了解市场动态之后,决定根据市场动态及时作出相应调整,并结合企业自身的情况作出相应的出厂价格,该企业统计了2019年1~10月份产品的生产数量x(单位:万件)以及销售总额y(单位:十万元)之间的关系如表:x 2.08 2.12 2.19 2.28 2.36 2.48 2.59 2.68 2.80 2.87y 4.25 4.37 4.40 4.55 4.64 4.75 4.92 5.03 5.14 5.26(1)计算的值;(2)计算相关系数r,并通过r的大小说明y与x之间的相关程度;(3)求y与x的线性回归方程,并推测当产量为3.2万件时销售额为多少.(该问中运算结果保留两位小数)附:回归直线方程中的斜率和截距的最小二乘估计公式分别为,;相关系数.参考数据:,,.☆注:请用Microsoft Word2016以上版本打开文件进行编辑,用WPS等其他软件可能会出现乱码等现象.专题八 概率与统计第2讲 统计案例1.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程为=x+,其中==, =-.(3)通过求的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.2.独立性检验(1)2×2列联表设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:y1 y2 总计x1 a b a+bx2 c d c+d总计 a+c b+d a+b+c+d(2)独立性检验利用随机变量K2(也可表示为χ2)的观测值k=(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.一.选择题(共8小题)1.通过随机询问200名性别不同的大学生是否爱好踢毽子运动,计算得到统计量K2的观测值k≈4.892,参照附表,得到的正确结论是( )P(K2≥k) 0.10 0.05 0.025k 2.706 3.841 5.024A.有97.5%以上的把握认为“爱好该项运动与性别有关”B.有97.5%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”【解答】解:∵计算得到统计量值K2的观测值k≈4.892>3.841,参照题目中的数值表,得到正确的结论是:在犯错误的概率不超过5%的前提下,认为“爱好该运动与性别有关”.故选:C.2.某医疗研究所为了检验新开发的流感疫苗对甲型Hln1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型Hln1流感的作用”,并计算出P(Χ2≥6.635)≈0.01,则下列说法正确的是( )A.这种疫苗能起到预防甲型Hln1流感的有效率为1%B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型Hln1C.有1%的把握认为“这种疫苗能起到预防甲型Hln1流感的作用”D.有99%的把握认为“这种疫苗能起到预防甲型Hln1流感的作用”【解答】解:∵并计算出P(Χ2≥6.635)≈0.01,这说明假设不合理的程度约为99%,即这种疫苗不能起到预防甲型Hln1流感的作用不合理的程度约为99%,∴有99%的把握认为“这种疫苗能起到预防甲型Hln1流感的作用”故选:D.3.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:K2,其中n=a+b+c+d.参考数据:P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828A.130 B.190 C.240 D.250【解答】解:依题意,设男、女生的人数各为5x,建立2×2列联表如下所示:喜欢网络课程 不喜欢网络课程 总计男生 4x x 5x女生 3x 2x 5x总计 7x 3x 10x由表中数据,计算K2,由题可知6.63510.828,所以139.335<10x<227.388.只有B符合题意.故选:B.4.如图给出了某种豆类生长枝数y(枝)与时间t(月)的散点图,那么此种豆类生长枝数与时间的关系用下列函数模型近似刻画最好的是( )A.y=2t2 B.y=log2t C.y=t3 D.y=2t【解答】解:从所给的散点图可以看出图象大约过(2,1)和(4,2),(8,3),…,把这组点代入所给的四个解析式中,只有y=log2t最合适.故选:B.5.广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元):广告费x 2 3 4 5 6销售额y 29 41 50 59 71由上表可得回归方程为y=10.2x﹣a,据此模型,预测广告费为10万元时的销售额约为( )A.101.2 B.108.8 C.111.2 D.118.2【解答】解:由表中数据,计算(2+3+4+5+6)=4,(29+41+50+59+71)=50;代入回归方程y=10.2x﹣a中,计算a=10.2×4﹣50=﹣9.2,∴回归方程为y=10.2x+9.2;当x=10时,y=10.2×10+9.2=111.2,∴预测广告费为10万元时销售额约为111.2万元.故选:C.6.已知一组样本点(xi,yi)其中i=1,2,3,…,30根据最小二乘法求得的回归方程是bx+a则下列说法正确的是( )A.若所有样本点都在bx+a上,则变量间的相关系数为1B.至少有一个样本点落在回归直线bx+a上C.对所有的预报变量 xi(i=1,2,3,…,30),bxi+a的值一定与yi有误差D.若 bx+a斜率b>0则变量x与y正相关【解答】解:所有样本点都在bx+a上,则变量间的相关系数为±1,故A错误;回归直线必过样本数据中心点,但样本点可能全部不在回归直线上,故B错误;若所有的样本点都在bx+a上,则bxi+a的值与yi相等,故C错误;相关系数r与b符号相同,若 bx+a斜率b>0,则r>0,样本点应分布从左到右应该是上升的,则变量x与y正相关,故D正确;故选:D.7.2020年初,新型冠状病毒(COVID﹣19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示:周数(x) 1 2 3 4 5治愈人数(y) 2 17 36 93 142由表格可得y关于x的二次回归方程为,则此回归模型第4周的残差(实际值与预报值之差)为( )A.5 B.4 C.1 D.0【解答】解:设t=x2,则,,58﹣6×11=﹣8,所以.令x=4,得.故选:A.8.某车间为了规划生产进度提高生产效率,记录了不同时段生产零件个数x(百个)与相应加工总时长y(小时)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为0.7x+0.05,则下列结论错误的是( )x 2 3 4 5y 1.5 2 m 3.5A.加工总时长与生产零件数呈正相关B.该回归直线一定过点(3.5,2.5)C.零件个数每增加1百个,相应加工总时长约增加0.7小时D.m的值是2.85【解答】解:由题意,线性回归方程为0.7x+0.05,对于A:∵b=0.7>0,∴加工总时长与生产零件数呈正相关;对于B:当x=3.5时,可得y=0.7×3.5+0.05=2.5,即该回归直线一定过点(3.5,2.5)对于C:由b=0.7,∴零件个数每增加1百个,相应加工总时长约增加0.7小时,对于D:回归方程过平均中心,,2.5.解得:m=3故选:D.二.多选题(共2小题)(多选)9.某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下所示的列联表.经计算K2的观测值k≈4.762,则可以推断出( )满意 不满意男 30 20女 40 10P(k2≥k) 0.100 0.050 0.010k 2.706 3.841 6.635A.该学校男生对食堂服务满意的概率的估计值为B.调研结果显示,该学校男生比女生对食堂服务更满意C.有95%的把握认为男、女生对该食堂服务的评价有差异D.有99%的把握认为男、女生对该食堂服务的评价有差异【解答】解:由统计表格知:女生对食堂的满意率为:;男生对食堂的满意率为;故A,该学校男生对食堂服务满意的概率的估计值为,A正确;对于B,应为该校女生比男生对食堂服务更满意;B错误;由题意算得,k2=4.762>3.841,参照附表,可得:有95%的把握认为男、女生对该食堂服务的评价有差异;故C正确,D错误.故选:AC.(多选)10.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列表述中不正确的是( )A.有95%的把握认为“这种血清能起到预防感冒的作用”B.若有人未使用该血清,那么他一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%【解答】解:根据查对临界值表知P(K2≥3.841)≈0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”,即A正确;95%仅是指“血清与预防感冒”可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能,即B,C,D不正确.故选:BCD.三.解答题(共6小题)11.2020年4月底,随着新冠疫情防控进入常态化,为了促进消费复苏增长,上饶市开展“五一消费黄金周”系列活动,并发放亿元电子消费券.活动过后,我们随机抽取了50人,对是否使用过电子消费券进行调查,结果如表:年龄 (单位:岁) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70)抽取人数 2 10 13 12 10 3使用过消费券的人数 1 9 13 8 6 1若以“年龄40岁为分界点”,由以上统计数据完成下面2×2列联表,并判断是否有99%的把握认为使用电子消费券与按照40岁为分界点的人的年龄有关.年龄低于40岁的人数 年龄不低于40岁的人数 合计使用过消费券的人数没有使用消费券的人数合计参考数据:P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828,其中n=a+b+c+d.【解答】解:由以上统计数据填写下面2×2列联表,如下:年龄低于40岁 的人数 年龄不低于40岁 的人数 合计使用过消费券的人数 23 15 38没有使用消费券的人数 2 10 12合计 25 25 50根据公式计算,∴有99%的把握认为使用电子消费券与按照40岁为分界点的人的年龄有关.12.近些年美国政府对中国的打压对中国来说既是挑战也是机遇,但中国的复兴需要新一代青年牢牢树立国家意识,将自己理想与国家发展需要相结合,努力奋斗,投身于国家需要的行业中去.为了解高中生是否对“将自己的理想与国家的发展需要相结合”这一问题产生过思考,随机抽取了120名高中学生展开调查(其中文科学生60名,理科学生60名),统计数据如表所示:“思考过” “没思考过” 总计文科学生 50 10理科学生 40总计 120(1)补充上述列联表,并根据列联表判断能否在犯错率不超过5%的前提下认为是否思考过“将自己的理想与国家的发展需要相结合”这一问题与文理科学生有关?(2)从如表的120名学生中,用分层抽样抽取容量为8的样本,问其中“思考过”的学生有多少人?(3)在(2)问前提下,从“思考过”的学生(理科学生有2人)中随机选2人,问2名同学文理科不同的概率为多少?参考公式:,其中n=a+b+c+d.参考数据:P(K2≥k0) 0.050 0.010 0.001k0 3.841 6.635 10.828【解答】解:(1)由题意可得2×2列联表,“思考过” “没思考过” 总计文科学生 50 10 60理科学生 40 20 60总计 90 30 120.∴可以在犯错率不超过5%的前提下认为思考过将自身理想与国家发展需要相结合与文理科学生有关.(2)思考过的学生与没思考过的学生数量之比为90:30,化简为3:1,则用分层抽样抽取容量为8的样本,因此思考过的学生有6人.(3)记其中理科学生为1号,2号,文科学生为3号,4号,5号,6号则从中随机选2人,所有的基本事件有12、13、14、15、16、23、24、25、26、34、35、36、45、46、56,共15种,其中文理科不同的有13、14、15、16、23、24、25、26,8种,所以2名同学文理科不同的概率为.故答案为:(1)2×2列联表见解析,在犯错率不超过5%的前提下认为思考过将自身理想与国家发展需要相结合与文理科学生有关.(2)思考过的学生有6人.(3)2名同学文理科不同的概率为.13.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米):男:173 178 174 185 170 169 167 164 161 170女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值.(2)请根据测量结果得到20名学生身高的中位数h(单位:厘米),将男、女生身高不低于h和低于h的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异?人数 男生 女生身高≥h身高<h参照公式:,n=a+b+c+d..P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001k0 2.706 3.841 5.024 6.635 7.879 10.828(3)若男生身高低于165厘米为偏矮,不低于165厘米且低于175厘米为正常,不低于175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.【解答】解:(1)茎叶图为:平均身高为:男:(161+164+167+169+170+170+173+174+178+185)=171.1,女:(153+156+158+162+163+165+166+169+170+172)=163.4;(2)20名学生身高的中位数h=165,男、女身高的2×2列联表:人数 男生 女生身高≥h 7 3身高<h 3 7∵K23.2>2.706,∴有90%把握认为男、女身高有差异;(3)10名男生中,身高偏矮的有2人,正常的有6人,偏高的有2人,采用分层抽样的方法从以上男生中抽取5人作为样本,身高正常的有3人.从样本中任取2人,恰有1人身高属于正常的概率P.14.某位同学连续5次历史、政治的测试成绩如表:次数 1 2 3 4 5历史(x分) 79 81 83 85 87政治(y分) 77 79 79 82 83(1)求该生5次历史、政治成绩的平均分;(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x、y的线性回归方程.参考公式:,,,表示样本均值.【解答】解:(1)该生5次月考历史成绩的平均分(79+81+83+85+87)=83,该生5次月考政治成绩的平均分(77+79+79+82+83)=80;(2)计算得30,40,∴回归系数为0.75,80﹣0.75×83=17.75,故所求的线性回归方程为0.75x+17.75.15.某百货公司1~6月份的销售量x与利润y的统计数据如表:月份 1 2 3 4 5 6销售量x(万件) 10 11 13 12 8 6利润y(万元) 22 25 29 26 16 12附:)(1)根据2~5月份的统计数据,求出y关于x的回归直线方程x;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差均不超过2万元,则认为得到的回归直线方程是理想的,试问所得回归直线方程是否理想?(参考公式:.)【解答】解:(1)计算得,,1092,,则,.故y关于x的回归直线方程为;(2)当x=10时,,此时||2;当x=6时,,此时||2.故所得的回归直线方程是理想的.16.2019年11月份,全国工业生产者出厂价格同比下降1.4%,环比下降0.1%某企业在了解市场动态之后,决定根据市场动态及时作出相应调整,并结合企业自身的情况作出相应的出厂价格,该企业统计了2019年1~10月份产品的生产数量x(单位:万件)以及销售总额y(单位:十万元)之间的关系如表:x 2.08 2.12 2.19 2.28 2.36 2.48 2.59 2.68 2.80 2.87y 4.25 4.37 4.40 4.55 4.64 4.75 4.92 5.03 5.14 5.26(1)计算的值;(2)计算相关系数r,并通过r的大小说明y与x之间的相关程度;(3)求y与x的线性回归方程,并推测当产量为3.2万件时销售额为多少.(该问中运算结果保留两位小数)附:回归直线方程中的斜率和截距的最小二乘估计公式分别为,;相关系数.参考数据:,,.【解答】解:(1)依题意,,.(2)依题意,,因为0.997>0.75,所以y与x之间具有很强的相关性.(3)由,所以所求回归直线方程为y=1.22x+1.75,故当x=3.2时,y=1.22×3.2+1.75≈5.65. 展开更多...... 收起↑ 资源列表 8.2统计案例-2023届高三数学(艺考生)一轮复习讲义(原卷版).docx 8.2统计案例-2023届高三数学(艺考生)一轮复习讲义(解析版).docx