第10章 统计、统计案例 学案(Word版含答案)

资源下载
  1. 二一教育资源

第10章 统计、统计案例 学案(Word版含答案)

资源简介

第十章 统计 统计案例
第一节 随机抽样
[复习要点] 1.理解随机抽样的必要性和重要性.
2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样方法,并进行简单计算.
知识点一 简单随机抽样
1.定义:设一个总体含有N个个体,从中________抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会________,就把这种抽样方法叫做简单随机抽样.
2.最常用的简单随机抽样的方法:________和________.
3.抽签法与随机数法的区别与联系
抽签法和随机数法都是简单随机抽样的方法,但是抽签法适合在总体和样本都较少,容易搅拌均匀时使用,而随机数法除了适合总体和样本都较少的情况外,还适用于总体较多但是需要的样本较少的情况,这时利用随机数法能够快速地完成抽样.
答案:1.逐个不放回地 都相等 2.抽签法 随机数法
知识点二 分层抽样
1.定义:在抽样时,将总体分成________的层,然后按照一定的________,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
2.分层抽样的应用范围:当总体是由________的几个部分组成时,往往选用分层抽样.
答案:1.互不交叉 比例 2.差异明显
?链/接/教/材
1.[必修3·P57·练习T2改编]假设从高一年级全体同学(500人)中随机抽出60人参加一项活动,利用随机数法抽取样本时,先将500名同学按000,001,…,499进行编号,如果从随机数表第8行第11列的数开始,按三位数连续向右读取,最先抽出的5名同学的号码是(下面摘取了此随机数表第7行和第8行) (  )
第7行:84421 75331 57245 50688 77047 44767 21763 35025 83921 20676
第8行:63016 37859 16955 56719 98105 07175 12867 35807 44395 23879
A.455 068 047 447 176
B.169 105 071 286 443
C.050 358 074 439 332
D.447 176 335 025 212
答案:B 解析:第8行第11列的数是1,依次是三位数:169,555,671,998,105,071,751,286,735,807,443,…,而555,671,998,751,735,807超过最大编号499,故删掉,所以最先抽出的5名同学的号码为169,105,071,286,443.
2.[必修3·P64·A组T5]一支田径队有男运动员56人,女运动员42人,用分层抽样的方法从全体运动员中抽出一个容量为28的样本.
解:田径队运动员的总人数是56+42=98(人),要得到28人的样本,占总体的比例为.
于是,应该在男运动员中随机抽取56×=16(人),
在女运动员中随机抽取28-16=12(人).
这样我们就可以得到一个容量为28的样本.
?易/错/问/题
分层抽样:按比例抽样.
某工厂生产A,B,C三种不同型号的产品,产品数量之比依次为k∶5∶3,现用分层抽样的方法抽出一个容量为120的样本,已知A种型号的产品共抽取了24件,则C种型号产品抽取的件数为__________.
答案:36 解析:∵A,B,C三种产品的数量之比依次为k∶5∶3,
∴由=,解得k=2,
则C种型号产品抽取的件数为120×=36.
?核/心/素/养
如图所示,某学校共有教师120人,从中选出一个30人的样本,其中被选出的青年女教师的人数为(  )
A.12人 B.6人
C.4人 D.3人
答案:D 解析:青年教师占的比例为1-30%-40%=30%,则青年教师的人数为120×30%=36(人),又青年男教师为24人,所以青年女教师为12人,故青年女教师被选出的人数约为12×=3(人).
题型 简单随机抽样
角度Ⅰ.随机数表的运用
试/题/调/研(题题精选,每题都代表一个方向)
1.[2021江西吉安模拟]总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为 (  )
附:第6行至第9行的随机数表如下:
2635 7900 3370 9160 1620 3882 7757 4950
3211 4919 7306 4916 7677 8733 9974 6732
2748 6198 7164 4148 7086 2888 8519 1620
7477 0111 1630 2404 2979 7991 9683 5125
A.3 B.16
C.38 D.20
[答案] D [解析] 按随机数法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,超出00~49及重复的不选,则编号依次为33,16,20,38,49,32,…,则选出的第3个个体的编号为20.故选D.
角度Ⅱ.简单随机抽样
试/题/调/研(题题精选,每题都代表一个方向)
2.[2021福建模拟]下面的抽样方法是简单随机抽样的是(  )
A.在某年明信片的销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖
B.某车间包装一种产品,在自动传送带上,每隔5分钟抽一包产品,称其质量是否合格
C.某校分别从行政、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见
D.用抽签法从10件产品中选取3件进行质量检验
[答案] D [解析] A,B不是简单随机抽样,因为抽取的个体间的间隔是固定的;C也不是,因为总体的个体有明显的层次;D是简单随机抽样中的抽签法.故选D.
3.[2021山西大同一中月考]用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是(  )
A., B.,
C., D.,
[答案] A [解析] 在抽样过程中,个体a每一次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为,故选A.
方/法/指/导(来自课堂的最有用的方法)
1.简单随机抽样的特点
(1)抽取的个体数较少.(2)是逐个抽取.(3)是不放回抽取.(4)是等可能抽取.只有四个特点都满足的抽样才是简单随机抽样.
2.抽签法与随机数法的适用情况
(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
(2)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.
题型 分层抽样
角度Ⅰ.求总体或样本容量
试/题/调/研(题题精选,每题都代表一个方向)
1.[2019全国卷Ⅲ]《西游记》 《三国演义》 《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为(  )
A.0.5 B.0.6
C.0.7 D.0.8
[答案] C [解析] 解法一:设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解得x=70,
所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为=0.7.故选C.
解法二:用Venn图表示调查的100位学生中阅读过《西游记》和《红楼梦》的人数之间的关系如图:
易知调查的100位学生中阅读过《西游记》的学生人数为70,
所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为=0.7.故选C.
2.交通管理部门为了解机动车驾驶员(简称驾驶员)对某项新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为 (  )
A.101 B.808
C.1 212 D.2 012
[答案] B [解析] 四个社区抽取的总人数为12+21+25+43=101,由分层抽样可知,=,解得N=808.
角度Ⅱ.求某部分样本的数量
试/题/调/研(题题精选,每题都代表一个方向)
3.[2020新高考Ⅰ]某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是(  )
A.62% B.56%
C.46% D.42%
[答案] C [解析] 该校60%的学生喜欢足球,82%的学生喜欢游泳,这两组数据包含既喜欢足球又喜欢游泳的学生,而96%的学生喜欢足球或游泳,则该校既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为60%+82%-96%=46%.故选C.
4.今年“3·15”,某报社做了一次关于“虚假广告”的调查,在A,B,C,D四个单位回收的问卷数依次成公差为正数的等差数列,共回收1 000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B单位抽取30份问卷,则在D单位抽取的问卷份数是(  )
A.45 B.50
C.60 D.65
[答案] C [解析] 由于B单位抽取的问卷是样本容量的,所以B单位回收问卷200份.
由等差数列知识,可得C单位回收问卷300份,D单位回收问卷400份,则D单位抽取的问卷份数是B单位的2倍,即为60份.
方/法/指/导(来自课堂的最有用的方法)
分层抽样问题的类型及解题思路
(1)求某层应抽个体数量:按该层所占总体的比例计算.
(2)已知某层个体数量,求总体容量:根据分层抽样就是按比例抽样,列比例式进行计算.
(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==”.
[提醒] 分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取ni=n·(i= 1,2,…,k)个个体(其中i是层数,n是抽取的样本容量,Ni是第i层中个体的个数,N是总体容量).
提醒 完成限时跟踪检测(五十三)
第二节 用样本估计总体
[复习要点] 1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图,体会它们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
知识点一 统计图表的含义
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距和组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图.
2.频率分布折线图:连接频率分布直方图中各小长方形上端的________,就得到频率分布折线图.
3.总体密度曲线:随着________的增加,作图时所分的________增加,________减小,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
答案:2.中点 3.样本容量 组数 组距
知识点二 样本的数字特征
数字特征 定义
众数 在一组数据中,出现次数________的数据叫做这组数据的众数
中位数 将一组数据按大小依次排列,把处在________位置的一个数据(或最中间两个数据的________)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积应该________
平均数 样本数据的算术平均数,即=________
方差 s2=________________,其中s为标准差
答案:最多 中间 平均数 相等 (x1+x2+…+xn) [(x1-)2+(x2-)2+…+(xn-)2]
?链/接/教/材
1.[必修3·P65·探究改编]某市为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.则直方图中a的值为________;设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数大约为________.
答案:0.30 36 000 解析:由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02,
由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,
解得a=0.30.
100位居民每人的月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数约为300 000×0.12=36 000.
2.[必修3·P81·A组T4]在去年的足球甲A联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;二队每场比赛平均失球数是2.1,全年失球个数的标准差为0.4.你认为下列说法中哪一种是正确的,为什么?
(1)平均说来一队比二队防守技术好;
(2)二队比一队技术水平更稳定;
(3)一队有时表现很差,有时表现又非常好;
(4)二队很少不失球.
解:(1)对,从平均数的角度考虑.
(2)对,从标准差的角度考虑.
(3)对,从标准差的角度考虑.
(4)对,从平均数和标准差的角度考虑.
?易/错/问/题
频率分布直方图:中位数与众数的区别;平均值.
某次月考后,从所有考生中随机抽取50名考生的数学成绩进行统计,得到频率分布直方图如图所示,则该次考试数学成绩的中位数的估计值是__________.
答案:71 解析:由频率分布直方图,可知中位数位于70到80之间,0.002+0.006+0.012+0.024=0.044,-0.044=0.006,所以由×10=,得中位数的估计值为71.
?核/心/素/养
数据分析——频率分布直方图问题中的核心素养
以随机抽样获取样本为基础,首先画频率分布表、频率分布直方图,然后应用这些图表计算频率、频数和数字特征.
某中学共有1 000名学生参加了该地区高三第一次质量检测的数学考试,数学成绩如表所示:
数学成绩分组 [0,30) [30,60) [60,90) [90,120) [120,150]
人数 60 90 300 x 160
(1)为了了解同学们前段复习的效果,以便制定下阶段的复习计划,学校将采用分层抽样的方法抽取100名同学进行问卷调查,甲同学在本次测试中数学成绩为95分,求他被抽中的概率;
(2)已知本次数学成绩的优秀线为110分,试根据所提供数据估计该中学达到优秀线的人数;
(3)作出频率分布直方图,并估计该学校本次考试的数学平均分.(同一组中的数据用该组区间的中点值作代表)
解:(1)分层抽样中,每个个体被抽到的概率均为,
故甲同学被抽到的概率P=.
(2)由题意x=1 000-(60+90+300+160)=390,
故估计该中学达到优秀线的人数为160+390×=290.
(3)频率分布直方图.
该学校本次考试数学平均分为
=90.
估计该学校本次考试的数学平均分为90分.
题型 样本的数字特征的计算与应用
角度Ⅰ.众数、中位数、平均值、方差
试/题/调/研(题题精选,每题都代表一个方向)
1.[2019全国卷Ⅱ]演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是(  )
A.中位数 B.平均数
C.方差 D.极差
[答案] A [解析] 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.
2.[2020全国卷Ⅲ,文]设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为(  )
A.0.01 B.0.1
C.1 D.10
[答案] C [解析] 由已知得数据10x1,10x2,…,10xn的方差为100×0.01=1.故选C.
3.[多选][2021山东济宁第五次测试]一组数据2x1+1,2x2+1,2x3+1,…,2xn+1的平均值为7,方差为4,记3x1+2,3x2+2,3x3+2,…,3xn+2的平均值为a,方差为b,则(  )
A.a=7 B.a=11
C.b=12 D.b=9
[答案] BD [解析] 设X=xi,数据2x1+1,2x2+1,2x3+1,…,2xn+1的平均值为7,方差为4,即E(2X+1)=7,D(2X+1)=4,由离散型随机变量的均值公式可得E(2X+1)=2E(X)+1=7,所以E(X)=3,因而3x1+2,3x2+2,3x3+2,…,3xn+2的平均值a=E(3X+2)=3E(X)+2=3×3+2=11.由离散型随机变量的方差公式可得D(2X+1)=4D(X)=4,所以D(X)=1,因而3x1+2,3x2+2,3x3+2,…,3xn+2的方差b=D(3X+2)=9D(X)=9.
4.已知一组正数x1,x2,x3,x4的方差s2=(x+x+x+x-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为________.
[答案] 4 [解析] 设正数x1,x2,x3,x4的平均数为,则s2=[(x1-)2+(x2-)2+(x3-)2+(x4-)2],得s2=(x+x+x+x)-2,又已知s2=(x+x+x+x-16)=(x+x+x+x)-4,所以2=4,所以=2,故[(x1+2)+(x2+2)+(x3+2)+(x4+2)]=+2=4.
方/法/指/导(来自课堂的最有用的方法)
众数、中位数、平均数、方差的意义及常用结论
(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
(2)方差的简化计算公式:s2=[(x+x+…+x)-n2],或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方.
角度Ⅱ.数字特征的应用
试/题/调/研(题题精选,每题都代表一个方向)
5.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
[答案] B [解析] 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.
故选B.
6.[2021甘肃天水模拟]甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为甲,乙,标准差分别为σ甲,σ乙,则(  )
A.甲<乙,σ甲<σ乙
B.甲<乙,σ甲>σ乙
C.甲>乙,σ甲<σ乙
D.甲>乙,σ甲>σ乙
[答案] C [解析] 由图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知甲>乙.题图中数据显示甲同学的成绩比乙同学稳定,故σ甲<σ乙.
7.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:
甲 乙 丙 丁
平均环数 8.3 8.8 8.8 8.7
方差s2 3.5 3.6 2.2 5.4
从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是(  )
A.甲 B.乙
C.丙 D.丁
[答案] C [解析] 由题目表格中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好,故选C.
题型 频率分布直方图
角度Ⅰ.频率分布直方图的计算
试/题/调/研(题题精选,每题都代表一个方向)
1.[多选]容量为100的样本,其数据分布在[2,18],将样本数据分为4组:[2,6),[6,10),[10,14),[14,18],得到频率分布直方图如图所示,则下列说法正确的是(  )
A.样本数据分布在[6,10)的频率为0.32
B.样本数据分布在[10,14)的频数为40
C.样本数据分布在[2,10)的频数为40
D.估计总体数据大约有10%分布在[10,14)
[答案] ABC [解析] 样本数据分布在[6,10)的频率为0.08×4=0.32,A正确;样本数据分布在[10,14)的频数为100×0.1×4=40,B正确;样本数据分布在[2,10)的频数为100×(0.02+0.08)×4=40,C正确;样本数据分布在[10,14)的频率为0.1×4=0.4,故估计总体数据大约有40%分布在[10,14),D不正确.故选ABC.
2.[多选]调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图和“90后”从事互联网行业岗位分布条形图,则下列结论中一定正确的是(  )
A.互联网行业从业人员中“90后”占一半以上
B.互联网行业中从事技术岗位的“90后”人数超过总人数的20%
C.互联网行业中从事运营岗位的“90后”人数比“80前”少
D.互联网行业中从事运营岗位的“90后”人数比“80后”多
[答案] AB [解析] 在A中,由整个互联网行业从业者年龄分布饼状图可知互联网行业从业人员中“90后”占56%,故A正确;
在B中,由整个互联网行业从业者年龄分布饼状图和“90后”从事互联网行业岗位分布条形图可知互联网行业中从事技术岗位的“90后”人数占总人数的56%×39.6%=22.176%,故B正确;
在C中,由于“80前”从事互联网行业岗位情况没有任何信息,所以互联网行业中从事运营岗位的“90后”人数不一定比“80前”少,故C错误;
在D中,由于80后的从事互联网行业岗位情况没有任何信息,所以互联网行业中从事运营岗位的“90后”人数不一定比“80后”多,故D错误.故选AB.
解/题/感/悟(小提示,大智慧)
频率、频数、样本容量的计算方法
(1)×组距=频率.
(2)=频率,=样本容量,样本容量×频率=频数.
角度Ⅱ.应用频率分布直方图估计样本的数字特征
试/题/调/研(题题精选,每题都代表一个方向)
3.“中国人均读书4.3本(包括网络文学和教科书),比韩国的11本、法国的20本、日本的40本、犹太人的64本少得多,是世界上人均读书最少的国家.”这个论断被各种媒体反复引用,出现这样的统计结果无疑是令人尴尬的.某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并购买一定数量的书籍丰富小区图书站.由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.
(1)求在这40名读书者中年龄分布在[40,70)的人数;
(2)求这40名读书者的年龄的平均数和中位数.
[解] (1)由频率分布直方图知,年龄在[40,70)的频率为(0.020+0.030+0.025)×10=0.75.
故这40名读书者中年龄分布在[40,70)的人数为40×0.75=30.
(2)这40名读书者年龄的平均数为25×0.05 +35×0.10+45×0.20+55×0.30+65×0.25+75×0.10=54.
设中位数为x,则0.005×10+0.010×10+0.020×10+0.030×(x-50)=0.5,解得x=55.
故这40名读书者年龄的中位数为55.
方/法/指/导(来自课堂的最有用的方法)
频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
角度Ⅲ.频率分布直方图与概率的综合
试/题/调/研(题题精选,每题都代表一个方向)
4.[2021湖北襄阳四校联考]某种产品的质量以其质量指标值来衡量,质量指标值越大表明质量越好,且质量指标值大于或等于100的产品为优质产品.现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值(都在区间[90,110]内),将这些数据分成4组:[90,95),[95,100),[100,105),[105,110],得到如下两个频率分布直方图:
已知这两种配方生产的产品利润y(单位:百元)与其质量指标值t的关系式均为y=若以上面数据的频率作为概率,分别从用A配方和B配方生产的产品中随机抽取一件,且抽取这两件产品相互独立,则抽得的这两件产品利润之和为0的概率为(  )
A.0.125 B.0.195
C.0.215 D.0.235
[答案] B [解析] 分别从用A配方和B配方生产的产品中随机抽取一件,且抽取这两件产品相互独立,则抽得的这两件产品利润之和为0的概率P=0.06×5×0.07×5+0.04×5×0.02×5+0.04×5×0.07×5=0.195.故选B.
5.[2021湖北黄冈模拟]2017年5月14日至15日,“一带一路”国际合作高峰论坛在中国首都北京举行,会议期间,达成了多项国际合作协议.假设甲、乙两种品牌的同类产品出口某国家的市场销售量相等,该国质量检验部门为了解它们的使用寿命,现从这两种品牌的同类产品中分别随机抽取300个进行测试,结果统计如图所示.
(1)估计甲品牌产品寿命小于200小时的概率;
(2)这两种品牌产品中,某个产品已使用了200小时,试估计该产品是乙品牌的概率;
(3)从这两种品牌产品中抽取寿命超过300小时的产品3个,设随机变量X表示抽取的产品是甲品牌的产品个数,求X的分布列与数学期望.
[解] (1)甲品牌产品寿命小于200小时的频率为=,
用频率估计概率,得甲品牌产品寿命小于200小时的概率为.
(2)根据抽样结果,寿命大于200小时的产品有220+210=430(个),其中乙品牌产品有210个,∴在样本中,寿命大于200小时的产品是乙品牌的频率为=,用频率估计概率,得已使用了200小时的该产品是乙品牌的概率为.
(3)由题意知X的可能取值为0,1,2,3,
且P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==.
∴X的分布列为
X 0 1 2 3
P
故E(X)=0×+1×+2×+3×=.
角度Ⅳ.实际问题中频率分布直方图的运用
试/题/调/研(题题精选,每题都代表一个方向)
6.[2019全国卷Ⅲ]为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
解/题/感/悟(小提示,大智慧)
运用频率分布直方图解决实际问题的决策问题,常会遇到标准值的制定,此标准值跟频率有关,根据要求的频率,结合直方图的频率分布小矩形面积才可以计算出来.
题型 其他图表的应用
试/题/调/研(题题精选,每题都代表一个方向)
1.[多选][2020新高考Ⅱ]我国新冠肺炎疫情防控进入常态化,各地有序推动复工复产,下面是某地连续11天的复工、复产指数折线图.
根据该折线图,(  )
A.这11天复工指数和复产指数均逐日增加
B.在这11天期间,复产指数的增量大于复工指数的增量
C.第3天至第11天,复工指数和复产指数都超过80%
D.第9天至第11天,复产指数的增量大于复工指数的增量
[答案] CD [解析] 由题中折线图可知,第7天至第9天,复产指数与复工指数均减小,故选项A错误.在这11天期间,复产指数的增量小于复工指数的增量,故选项B错误.易知选项C,D正确.
2.[2018全国卷Ⅰ,文,理]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是(  )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
[答案] A [解析] 设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选A.
提醒 完成限时跟踪检测(五十四)
第三节 变量间的相关关系、统计案例
[复习要点] 1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).
3.了解独立性检验的思想、方法,并能初步应用独立性检验的思想方法解决一些简单的实际问题.
4.通过典型案例了解回归分析的思想方法,并能初步应用回归分析的思想、方法解决一些简单的实际问题.
知识点一 变量间的相关关系
1.对具有________的两个变量进行统计分析的方法叫回归分析.其基本步骤是:(ⅰ)画散点图;(ⅱ)求__________;(ⅲ)用回归直线方程作预报.
2.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系.与函数关系不同,相关关系是一种非确定性关系.
3.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
答案:1.相关关系 回归直线方程
知识点二 回归方程与回归分析
1.线性相关关系与回归直线
如果散点图中点的分布从整体上看大致在________附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
2.回归方程
(1)最小二乘法:求回归直线使得样本数据的点到回归直线的________最小的方法叫做最小二乘法.
(2)回归方程:方程=x+是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中,是待定数.
3.回归分析
(1)定义:对具有________的两个变量进行统计分析的一种常用方法.
(2)样本点的中心:在具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中,=(x1+…+xn),=(y1+…+yn),=-,(,)称为样本点的中心.
(3)相关系数r=,当r>0时,两变量________相关,当r<0时,两变量________相关,当|r|≤1且|r|越接近于1,相关程度________,当|r|≤1且|r|越接近于0,相关程度________,通常|r|大于0.75时,认为两个变量有很强的线性相关性.
答案:1.一条直线 2.(1)距离的平方和 3.(1)相关关系 (3)正 负 越强 越弱
知识点三 独立性检验
1.独立性检验的有关概念
(1)分类变量
可用变量的不同“值”表示个体所属的________的变量称为分类变量.
(2)2×2列联表
假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
2.独立性检验
利用随机变量K2=(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.
步骤如下:
(1)计算随机变量K2的观测值k,查表确定临界值k0:
P(K2≥k0) 0.5 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
(2)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”.
答案:1.(1)不同类别
?链/接/教/材
1.[选修2-3·P97·习题T2改编]为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力(  )
A.回归分析 B.均值与方差
C.独立性检验 D.概率
答案:C
2.[选修2-3·P97·练习改编]下面是2×2列联表:
y1 y2 总计
x1 a 21 73
x2 22 25 47
总计 b 46 120
则表中的a=________,b=________.
答案:52 74
3.[选修2-3·P81·例1改编]某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.
零件数x(个) 10 20 30 40 50
加工时间y(min) 62 75 81 89
现发现表中有一个数据看不清,请你推断出该数据的值为________.
答案:68
?易/错/问/题
1.对回归系数的理解:解释变量;预报变量.
某工厂工人月工资y(元)依劳动产值x(万元)变化的回归直线方程为=900x+600,下列判断正确的是________.
①劳动产值为10 000元时,工资为500元;
②劳动产值提高10 000元时,工资提高1 500元;
③劳动产值提高10 000元时,工资提高900元;
④劳动产值为10 000元时,工资为900元.
答案:③ 解析:回归系数的意义:解释变量每增加1个单位,预报变量平均增加b个单位.
2.对独立性检验的理解:K2的计算;对P(K2≥k0)的解释.
[2021湖南张家界模拟]某高校教“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:
   专业性别    非统计专业 统计专业
男 13 10
女 7 20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2的观测值k=≈4.844.
因为k>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.
附表:
P(K2≥k0) 0.050 0.010 0.001
k0 3.841 6.635 10.828
答案:5% 解析:∵k>3.841,查临界值表,得P(K2≥3.841)=0.05,故这种判断出错的可能性为5%.
?核/心/素/养
数学建模——回归方程问题中的核心素养
先在实际问题中收集数据,画散点图确定相关关系,再用最小二乘法求回归方程,进而用回归模型对实际问题进行预测.
如图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2011~2017.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.
附注:
参考数据:i=9.32,iyi=40.17,
=0.55,≈2.646.
参考公式:相关系数r=,
回归方程=+t中斜率和截距的最小二乘估计公式分别为:=,=-.
解:(1)由折线图中数据和附注中参考数据,得=4,(ti-)2=28,
=0.55,
(ti-)(yi-)=iyi-i
=40.17-4×9.32=2.89,
r=≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(1),得
==≈0.103,
=-=1.331-0.103×4≈0.92.
所以y关于t的回归方程为=0.92+0.10t.
将2019年对应的t=9代入回归方程,得=0.92+0.10×9=1.82.
所以预测2019年我国生活垃圾无害化处理量约为1.82亿吨.
题型 变量间的相关关系
试/题/调/研(题题精选,每题都代表一个方向)
1.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(  )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
[答案] C [解析] 根据正相关和负相关的定义进行判断.若线性回归方程的斜率为正,则两个变量正相关,若斜率为负,则负相关.
因为y=-0.1x+1的斜率小于0,故x与y负相关.
因为y与z正相关,可设z=y+,>0,则z=y+=-0.1x++,
故x与z负相关.
2.对变量x,y有观测数据(xi,yi)(i=1,2,3,4,5),得表1;对变量u,v有观测数据(ui,vi)(i=1,2,3,4,5),得表2.由这两个表可以判断 (  )
表1:
x 1 2 3 4 5
y 2.9 3.3 3.6 4.4 5.1
表2:
u 1 2 3 4 5
v 25 20 21 15 13
A.变量x与y正相关,u与v正相关
B.变量x与y负相关,u与v正相关
C.变量x与y负相关,u与v负相关
D.变量x与y正相关,u与v负相关
[答案] D [解析] 由题可知,随着x的增大,对应的y值增大,其散点图呈上升趋势,故x与y正相关;
随着u的增大,v减小,其散点图呈下降趋势,故u与v负相关.
3.[2020全国卷Ⅰ,文,理]某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是(  )
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+bln x
[答案] D [解析] 根据题中散点图可知,散点大致分布在某一条“对数型”函数曲线的周围,而A选项是“直线型”的拟合函数,B选项是“抛物线型”的拟合函数,C选项是“指数型”的拟合函数,只有D选项的拟合函数更符合.故选D.
方/法/指/导(来自课堂的最有用的方法)
判断相关关系的两种方法
1.散点图法
如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.
2.相关系数法
利用相关系数判定,|r|越趋近于1,相关性越强.
题型 独立性检验
试/题/调/研(题题精选,每题都代表一个方向)
1.[多选]某机构在研究性别与是否爱好拳击运动的关系中,通过收集数据得到如下2×2列联表:
男 女 合计
爱好拳击 35 22 57
不爱好拳击 15 28 43
合计 50 50 100
经计算得K2=≈6.895.之后又对被研究者的身高进行了统计,得到男、女身高分别近似服从正态分布N(175,16)和N(164,9),则下列选项中正确的是(  )
附表:
P(K2≥k0) 0.50 0.05 0.010 0.005 0.001
k0 0.455 3.841 6.635 7.879 10.828
A.在犯错误的概率不超过1%的前提下,认为“爱好拳击运动与性别有关”
B.在100个男生中,至少有一个人爱好打拳击
C.男生身高的平均数为175,男生身高的标准差为16
D.女生身高的平均数为164,女生身高的标准差为3
[答案] AD [解析] K2≈6.895>6.635,所以选项A正确;显然选项B错误;男生身高的标准差为4,所以选项C错误;显然选项D正确,故选AD.
2.[2020全国卷Ⅲ,文,理]某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
      锻炼人次空气质量等级      [0,200] (200,400] (400,600]
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400 人次>400
空气质量好
空气质量不好
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
[解] (1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:
空气质量等级 1 2 3 4
概率的估计值 0.43 0.27 0.21 0.09
(2)一天中到该公园锻炼的平均人次的估计值为
(100×20+300×35+500×45)=350.
(3)根据所给数据,可得2×2列联表:
人次≤400 人次>400
空气质量好 33 37
空气质量不好 22 8
根据列联表得K2
=≈5.820.
由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
方/法/指/导(来自课堂的最有用的方法)
独立性检验的一般步骤
(1)根据样本数据列出2×2列联表.
(2)计算随机变量K2的观测值k,查下表确定临界值k0.
P(K2≥k0) 0.50 0.40 0.25 0.15 0.10
k0 0.455 0.708 1.323 2.072 2.706
P(K2≥k0) 0.05 0.025 0.010 0.005 0.001
k0 3.841 5.024 6.635 7.879 10.828
F](3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关”.
题型 线性回归方程
角度Ⅰ.线性方程的系数和应用
试/题/调/研(题题精选,每题都代表一个方向)
1.[2017山东卷]为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系.设其回归直线方程为=x+.已知i=225,i=1 600,=4.该班某学生的脚长为24,据此估计其身高为(  )
A.160 B.163
C.166 D.170
[答案] C [解析] ∵i=225,
∴=i=22.5.
∵i=1 600,
∴=i=160.又=4,
∴=-=160-4×22.5=70.
∴回归直线方程为=4x+70.
将x=24代入上式,得=4×24+70=166.故选C.
2.已知x与y之间的几组数据如下表:
x 1 2 3 4 5 6
y 0 2 1 3 3 4
假设根据上表数据所得线性回归直线方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是(  )
A.>b′,>a′ B.>b′,C.a′ D.[答案] C [解析] 
==,
==,
==,
=-=-,
b′==2>,a′=-2<.
角度Ⅱ.回归直线方程的计算
试/题/调/研(题题精选,每题都代表一个方向)
3.[多选]我国已成为名副其实的工业大国.据统计,在500多种主要工业品中,我国有220多种产品产量居全球第一位.工业化的大规模推进也消耗了大量的资源和能源.为加快推进工业节能与绿色发展,工业和信息化部及国家开发银行联合发布了《关于加快推进工业节能与绿色发展的通知》,大力支持工业节能降耗、降本增效,实现绿色发展.下面是某国企利用新科技进行节能降耗技术改造后连续五年的生产利润统计表:
年份 2014 2015 2016 2017 2018
年份代码x 1 2 3 4 5
年生产利润y(单位:千万元) 0.7 0.8 1 1.1 1.4
则下列说法正确的是(  )
A.这五年生产利润的方差为0.06
B.每年的年生产利润比前一年大约增长0.49千万元
C.预测2020年该国企的年生产利润为1.68千万元
D.要使年生产利润突破2千万元,至少要等到2022年
[答案] ACD [解析] 由题可得==3,==1,所以这五年生产利润的方差为×[(0.7-1)2+(0.8-1)2+(1-1)2+(1.1-1)2+(1.4-1)2]=×0.3=0.06,故A选项正确;易求得==0.17,又=-=1-0.17×3=0.49,所以回归方程为=0.17x+0.49,所以每年的年生产利润比前一年大约增长0.17千万元,故B选项错误;因为2020年对应的年份代码为7,所以=0.17×7+0.49=1.68,所以2020年的年生产利润约为1.68千万元,故C选项正确;令>2,即0.17x+0.49>2,解得x>≈8.9,因为x∈N*,所以x≥9,所以当x=9,即2022年时,该国企的年生产利润就会突破2千万元,故D选项正确.
4.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),根据收集到的数据可知=20,由最小二乘法求得回归直线方程为=0.6x+48,则i=(  )
A.60 B.120
C.150 D.300
[答案] D
5.[多选]已知由样本数据点集合{(xi,yi)|i=1,2,…,n},求得的回归直线方程为=1.5x+0.5,=3,现发现两个数据点(1.2,3.2)和(4.8,6.8)误差较大,去除后重新求得的回归直线l的斜率为1.2,则(  )
A.变量x与y具有正相关关系
B.去除后的回归方程为=1.2x+1.4
C.去除后y的估计值增加速度变快
D.去除后,当x=4时,y的估计值为6.2
[答案] ABD [解析]由样本数据点集合{(xi,yi)|i=1,2,…,n},求得的回归直线方程为=1.5x+0.5,=3,所以=1.5×3+0.5=5.又因为重新求得的回归直线l的斜率为1.2,是正相关,所以A正确;
设去除后的数据所有横坐标的平均值为′,则(n-2)′=n -(1.2+4.8)=3n-6=3(n-2),故′=3,纵坐标的平均值为′,则(n-2)′=n -(3.2+6.8)=n -10=5n-10=5(n-2),故′=5.设新的线性回归方程为=1.2x+b,把(3,5)代入得5=1.2×3+b,解得b=1.4,所以新的线性回归方程为=1.2x+1.4,所以B正确;
因为斜率1.2<1.5,所以去除后y的估计值增加速度变慢,所以C错误;
把x=4代入=1.2x+1.4,
得=1.2×4+1.4=6.2,
所以D正确.故选ABD.
解/题/感/悟(小提示,大智慧)
1.样本中心点的应用
回归直线过样本点的中心是回归直线的重要性质,在求回归直线的系数、求未知数据中有着广泛的应用.
2.关于回归直线方程的求法
求线性回归方程的关键是计算系数,首先要明确公式中各个因式的含义,其次是充分利用合并、约分等运算律简化运算.
角度Ⅲ.线性回归方程在实际中的应用
试/题/调/研(题题精选,每题都代表一个方向)
6.[2020全国卷Ⅱ,文,理]某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=60,i=1 200,(xi-)2=80,(yi-)2=9 000,(xi-)·(yi-)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
[解] (1)由已知得样本平均数=yi=60,从而该地区这种野生动物数量的估计值为60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
r===≈0.94.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
7.某书店刚刚上市了《中国古代数学史》,销售前该书店拟定了5种单价进行试销,每种单价(x元)试销1天,得到如表单价x(元)与销量y(册)数据:
单价x(元) 18 19 20 21 22
销量y(册) 61 56 50 48 45
(1)根据表中数据,请建立y关于x的回归直线方程;
(2)预计今后的销售中,销量y(册)与单价x(元)服从(1)中的回归方程,已知每册书的成本是12元,书店为了获得最大利润,该册书的单价应定为多少元?
附:=,=-,xiyi=5 160,x=2 010.
[解] (1)==20,
==52,
xiyi=5 160,x=2 010.

===-4,
=-=52-(-4)×20=132,
所以y关于x的回归直线方程为=-4x+132.
(2)设获得的利润为W,
W=(x-12)y=-4x2+180x-1 584,因为二次函数W=-4x2+180x-1 584的开口向下,
所以当x=22.5时,W取最大值,
所以当单价定为22.5元时,可获得最大利润.
解/题/感/悟(小提示,大智慧)
线性回归分析问题的类型及解题方法
1.求线性回归方程
(1)利用公式求出回归系数,;
(2)待定系数法:利用回归直线过样本点的中心求系数.
2.利用回归方程进行预测
把线性回归方程看作一次函数,求函数值.
3.利用回归直线判断正、负相关
决定正相关还是负相关的是系数.
4.回归方程的拟合效果可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.
提醒 完成限时跟踪检测(五十五)

展开更多......

收起↑

资源预览