资源简介 数学建模和数据分析 本章中的回归分析及独立性检验是统计在实际问题中的应用体现,重在培养学生的数学建模及数据分析等核心素养.培优一 一元线性回归分析【例1】 (多选)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的线性回归方程为=0.85x-85.71,则下列结论中正确的是( )A.-85.71,0.85是这个线性回归方程的系数B.回归直线过样本点中心(,)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg尝试解答培优二 非线性回归分析【例2】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(xi-)2 (wi-)2 (xi-)(yi-) (wi-)(yi-)46.6 563 6.8 289.8 1.6 1 469 108.8表中wi=,=wi.(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其线性回归方程为=+u,=,=- .尝试解答培优三 相关性分析【例3】 (2022·全国乙卷19题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i 1 2 3 4 5 6 7 8 9 10 总和根部横截 面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并计算得=0.038,=1.615 8,xiyi=0.247 4.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数r=,≈1.377.尝试解答培优四 独立性检验【例4】 (2023·全国甲卷19题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为:15.2 18.8 20.2 21.3 22.5 23.2 25.826.5 27.5 30.1 32.6 34.3 34.8 35.635.6 35.8 36.2 37.3 40.5 43.2试验组的小白鼠体重的增加量从小到大排序为:7.80 9.20 11.4 12.4 13.2 15.5 16.518.0 18.8 19.2 19.8 20.2 21.6 22.823.6 23.9 25.1 28.2 32.3 36.5(1)计算试验组的样本平均数;(2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表:<m ≥m对照组试验组②根据①中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:K2=,P(K2≥k) 0.100 0.050 0.010k 2.706 3.841 6.635.尝试解答培优五 统计与统计案例【例5】 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中有女性55名.如图是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40 min的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件列出2×2列联表,据此资料你是否认为“体育迷”与性别有关?(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望EX和方差DX.附:χ2=.尝试解答章末复习与总结【例1】 ABC 当x=170时,=0.85×170-85.71=58.79,体重的估计值为58.79 kg,故D错误,A、B、C均正确.【例2】 解:(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=,先建立y关于w的线性回归方程.由于===68,=-=563-68×6.8=100.6,所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.(3)①由(2)知,当x=49时,年销售量y的预报值=100.6+68=576.6,年利润z的预报值=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值=0.2(100.6+68)-x=-x+13.6+20.12.所以当==6.8,即x=46.24时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.【例3】 解:(1)估计该林区这种树木平均一棵的根部横截面积===0.06,估计该林区这种树木平均一棵的材积量===0.39.(2)(xi-)(yi-)=xiyi-10=0.013 4,(xi-)2=-10()2=0.002,(yi-)2=-10()2=0.094 8,所以==≈0.01×1.377=0.013 77,所以样本相关系数r=≈≈0.97.(3)设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以=,所以Y==1 209,即该林区这种树木的总材积量的估计值为1 209 m3.【例4】 解:(1)试验组的样本平均数为×(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=19.8.(2)①将40个数据按照从小到大的顺序依次排列,得最中间的两个数据即第20个和第21个数据分别为23.2和23.6,则40只小白鼠体重的增加量的中位数m==23.4.列联表如下:<m ≥m对照组 6 14试验组 14 6②K2===6.4>3.841,故有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.【例5】 解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:性别 是否是体育迷非体育迷 体育迷 总计男 30 15 45女 45 10 55总计 75 25 100将2×2列联表中的数据代入公式计算,得:χ2==≈3.030.因为3.030>2.706,所以有90%的把握认为“体育迷”与性别有关.(2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为.由题意知X~B(3,),从而X的分布列为X 0 1 2 3PEX=np=3×=,DX=np(1-p)=3××=.3 / 4(共31张PPT)章末复习与总结数学建模和数据分析 本章中的回归分析及独立性检验是统计在实际问题中的应用体现,重在培养学生的数学建模及数据分析等核心素养.培优一 一元线性回归分析【例1】 (多选)设某大学的女生体重 y (单位:kg)与身高 x (单位:cm)具有线性相关关系,根据一组样本数据( xi , yi )( i =1,2,…, n ),用最小二乘法建立的线性回归方程为 =0.85 x -85.71,则下列结论中正确的是( )A. -85.71,z0.85是这个线性回归方程的系数C. 若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD. 若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析: 当 x =170时, =0.85×170-85.71=58.79,体重的估计值为58.79 kg,故D错误,A、B、C均正确.培优二 非线性回归分析【例2】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x (单位:千元)对年销售量 y (单位:t)和年利润 z (单位:千元)的影响.对近8年的年宣传费 xi 和年销售量 yi ( i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.46.6 563 6.8 289.8 1.6 1 469 108.8表中 wi = , = wi .(1)根据散点图判断, y = a + bx 与 y = c + d 哪一个适宜作为年销售量 y 关于年宣传费 x 的回归方程类型?(给出判断即可,不必说明理由)解:由散点图可以判断, y = c + d 适宜作为年销售量 y关于年宣传费 x 的回归方程类型.(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程;解:令 w = ,先建立 y 关于 w 的线性回归方程.由于 = = =68,= - =563-68×6.8=100.6,所以 y 关于 w 的线性回归方程为 =100.6+68 w ,因此 y 关于 x 的回归方程为 =100.6+68 .(3)已知这种产品的年利润 z 与 x , y 的关系为 z =0.2 y - x .根据(2)的结果回答下列问题:①年宣传费 x =49时,年销售量及年利润的预报值是多少?②年宣传费 x 为何值时,年利润的预报值最大?附:对于一组数据( u1, v1),( u2, v2),…,( un , vn ),其线性回归方程为 = + u , = , =- .解:①由(2)知,当 x =49时,年销售量 y 的预报值 =100.6+68 =576.6,年利润 z 的预报值 =576.6×0.2-49=66.32.②根据(2)的结果知,年利润 z 的预报值=0.2(100.6+68 )- x =- x +13.6 +20.12.所以当 = =6.8,即 x =46.24时, 取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.培优三 相关性分析【例3】 (2022·全国乙卷19题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号 i 1 2 3 4 5 6 7 8 9 10 总和根部横截 面积 xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材积量 yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并计算得 =0.038, =1.615 8, xiyi =0.247 4.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;解:估计该林区这种树木平均一棵的根部横截面积 == =0.06,估计该林区这种树木平均一棵的材积量 == =0.39.(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);解: ( xi - )( yi - )= xiyi -10 =0.013 4,( xi - )2= -10( )2=0.002,( yi - )2= -10( )2=0.094 8,所以 = =≈0.01×1.377=0.013 77,所以样本相关系数 r = ≈ ≈0.97.(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数 r = , ≈1.377.解:设该林区这种树木的总材积量的估计值为 Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以 = ,所以 Y = =1 209,即该林区这种树木的总材积量的估计值为1 209 m3.培优四 独立性检验【例4】 (2023·全国甲卷19题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为:15.2 18.8 20.2 21.3 22.5 23.2 25.826.5 27.5 30.1 32.6 34.3 34.8 35.635.6 35.8 36.2 37.3 40.5 43.2试验组的小白鼠体重的增加量从小到大排序为:7.80 9.20 11.4 12.4 13.2 15.5 16.518. 0 18.8 19.2 19.8 20.2 21.6 22.823. 6 23.9 25.1 28.2 32.3 36.5(1)计算试验组的样本平均数;解:试验组的样本平均数为 ×(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=19.8.(2)①求40只小白鼠体重的增加量的中位数 m ,再分别统计两样本中小于 m 与不小于 m 的数据的个数,完成如下列联表:< m ≥ m对照组试验组②根据①中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附: K2= ,P ( K2≥ k ) 0.100 0.050 0.010k 2.706 3.841 6.635.解:(1)试验组的样本平均数为 ×(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=19.8.解: ①将40个数据按照从小到大的顺序依次排列,得最中间的两个数据即第20个和第21个数据分别为23.2和23.6,则40只小白鼠体重的增加量的中位数 m = =23.4.列联表如下:< m ≥ m对照组 6 14试验组 14 6② K2= = =6.4>3.841,故有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.培优五 统计与统计案例【例5】 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中有女性55名.如图是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40 min的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件列出2×2列联表,据此资料你是否认为“体育迷”与性别有关?解:由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:性别 是否是体育迷 非体育迷 体育迷 总计男 30 15 45女 45 10 55总计 75 25 100将2×2列联表中的数据代入公式计算,得:χ2= = ≈3.030.因为3.030>2.706,所以有90%的把握认为“体育迷”与性别有关.性别是否是体育迷非体育迷体育迷总计男301545女451055总计7525100(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为 X . 若每次抽取的结果是相互独立的,求 X 的分布列、期望 EX 和方差 DX .附:χ2= .解:由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为 .由题意知 X ~ B (3, ),从而 X 的分布列为X 0 1 2 3PEX = np =3× = , DX = np (1- p )=3× × = .谢 谢 观 看! 展开更多...... 收起↑ 资源列表 章末复习与总结.docx 章末复习与总结.pptx