资源简介 统计案例中的基本思想及应用通过对统计中典型案例的研究和讨论,我们可以提炼出许多基本思想方法,并体验这些基本思想方法在解决实际问题中的应用.一、独立性检验思想在日常生活中,经常会面临一些需要推断的问题.在对这些问题作出推断时,我们不能仅凭主观臆断得出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的推断,这就是独立性检验的基本思想.依据这一基本思想,我们可以考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.其基本步骤是:①考察需抽样调查的背景问题,确定所涉及的变量是否为两个分类变量;②根据样本数据制作2×2列联表;③计算统计量,并查表分析.例1 为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,990件产品中有合格品982件、次品8件;甲不在现场时,510件产品中有合格品493件、次品17件.画出列联表并用独立性检验的方法对数据进行分析.解:可得2×2列联表如下:正品数次品数总计甲在现场9828990甲不在现场49317510总计1475251500由2×2列联表中数据,计算 .所以约有的把握认为“质量监督员甲在不在现场与产品质量有关系”.二、回归分析思想回归分析是对具有相关关系的两个变量进行统计分析的常用方法.采用回归分析基本思想,解决实际问题的基本步骤如下:①明确对象;②画散点图;③选择模型,即通过观察分析散点图确定回归方程的类型,如果观察到数据呈线性关系,则选用线性回归方程;④估算方程,即按一定的规则估计回归方程的参数,如最小二乘法原理;⑤线性相关程度的判定,即通过样本相关系数的大小作出判断:;越接近于,线性相关程度越强;越接近于,线性相关程度越弱.例2 想象一下一个人从出生到死亡,在每个生日都测量身高,并作出这些数据的散点图,这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录:年龄/周岁3456789身高/cm90.897.6104.2110.9115.6122.0128.5101121世纪教育网1213141516134.2140.8147.6154.2160.9167.5173.0(1)用样本相关系数判定年龄和身高之间具有怎样的相关关系?求出与之间的回归直线方程;(2)如果年龄相差5岁,则身高有多大差异(3~16岁之间)?(3)如果身高相差20cm,其年龄相差多少?解:(1)已知样本相关系数公式为. 代入数据可得,表明有的把握认为“与之间具有线性相关关系”. 设年龄与身高之间的回归直线方程为,由公式,,所以;(2)如果年龄相差5岁,则预报变量变化,即身高相差约;(3)如果身高相差20cm,年龄相差(岁).三、数形结合思想数形结合思想,就是将抽象的数学语言与直观图形结合起来,通过数与形(以形助数、以数释形)的双向联系与沟通来处理数学问题,达到化抽象为直观、化难为易的目的.在统计案例中数形结合思想体现的较为充分,主要表现在:在回归分析中,常把数据用散点图表示出来.通过散点图,直观地了解两个变量的相关关系,进而构建回归模型,利用模型进一步刻画变量间的关系,并进行相应的预测.在直观地展示两个变量的相关关系方面,散点图具有特别重要的作用.例3 某商场经营一批进价为元/台的小商品,在市场销售中发现,此商品的销售单价(元)与日销售量(台)之间有如下关系:销售单价/元35404550日销售量/元57422712(1)与是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程;(2)设经营此商品的日销售利润为元,根据(1)写出关于的函数关系式,并预测当销售价为多少元时,能获得最大日销售利润?解:(1)作出散点图如右图所示,并从图中可以看出,这些点大致分布在一条直线附近,因此可判断两个变量具有线性相关关系.设回归直线方程为,则由公式易求得,,所以;(2)依题意有,当时,有最大值,即预测销售单价为元时,能获得最大日销售利润.四、化归转化思想化归转化思想是指把待解决的问题通过转化归结为在已有知识范围内可解的问题的一种思维方式,在数学中是应用最为广泛的一种思维形式.可以说数学解题就是转化问题.每一个数学问题无不是在不断地转化中获得解决的.在统计案例中,对两个具有非线性关系的变量进行回归分析时,常通过变量变换的方法,将问题转化为线性回归分析问题来解决,充分体现了化归转化思想. 例4 在试验中得到变量与的数据如下: 由经验知,与之间具有线性相关关系,试求与之间的回归曲线方程;当时,预测的值. 分析:通过换元转化为线性回归问题. 解:令,由题目所给数据可得下表所示的数据:序号115.039.42251552.36591225.842.9665.641840.411106.82330.041.090016811230436.643.11339.561857.611577.46544.449.21971.362420.642184.48合计151.8215.65101.569352.026689.76 计算得,,∴. 故所求回归曲线方程为,当时,.点评:非线性回归问题有时并不给出经验公式,此时我们可以由已知的数据画出散点图,并把散点图与已经学习过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出跟这些散点拟合的最好的函数,然后再采用变量的变换,把问题转化为线性回归问题,使问题得以解决.统计案例考试技巧点拨 本章的重点和难点是回归分析和独立性检验的基本思想、方法及其应用.除了掌握基本的公式和应用的步骤外,对考查题型的强化和把握也尤为重要.现把基本的题目类型归纳如下,以供参考. 1.有关基本概念的考查 如回归分析、相关性检验、独立性检验等,这是本章考查的主要内容,大多以选择题或填空题出现,如: 例1 下列说法中,错误的个数是( ). ①随机变量是引起预报值与真实值之间的误差的原因之一; ②,有95%的把握认为两变量有线性相关关系; ③. (A) (B)1 (C)2 (D)3 答案:(B). 例2 相关系数是衡量两变量之间的线性相关程度的,对此有下列说法: ①越接近于1,相关程度越大; ②越接近于0,相关程度越小; ③越接近于1,相关程度越小; ④越接近于0,相关程度越大. 其中正确的是( ). (A)①② (B)①④ (C)②③ (D)③④ 答案:(A). 2.注意巧妙利用“线性回归直线一定过样本中心点”这一特征 例3 已知两个变量的样本中心点是,则两个变量间的回归直线方程可能为( ). (A) (B) (C) (D) 答案:(B).(样本中心点的坐标为,代入验证即可) 3.一元线性回归分析是回归分析中最简单,也是最基本的一种类型,它类似于代数方程理论中的一元一次方程,但是不要盲目的去求回归直线方程,应该首先进行相关性检验,判断一下变量之间线性相关关系的强弱,否则很有可能得出没有价值甚至是完全错误的结论. 例4 某公司购进一新型设备,为了分配合适的工人操纵设备,进行该设备的工人劳动生产率与工龄之间的相关分析.下表是12个5~10年工龄的工人操纵新设备的劳动生产率的试验记录.工人(序号)12345678910111221世纪教育网工龄(年)55666778891010生产充(件/小时)7.17.27.57.57.78.38.69.29.2109.710 解:根据上表计算工龄与劳动生产率的相关关系,利用相关系数计算公式: , , ,, ,因此求得相关系数. 结果说明工龄与劳动生产率之间存在较强的线性相关关系. 经计算,,所以可得到回归直线方程为. 4.使用统计量作列联表的独立性检验时,要求表中的四个数据都要大于等于5,为此,在选取样品时,容量一定要适当. 例5 某些行为在运动员的比赛之间往往被赋予很强的神秘色彩,如有一种说法认为,在进入某乒乓球场比赛前先迈入左脚的运动员就会赢得比赛的胜利.某记者为此追踪了某著名乒乓球运动员在该球场中的308场比赛,获得数据如下表:胜负合计先迈入左脚17827205先迈入右脚8419103合计26246308 据此资料,你能得出什么结论? 解:由 . 因为,所以我们没有充分理由认为先迈进左脚与否跟比赛的胜负有关. 展开更多...... 收起↑ 资源预览