资源简介 统计案例知识梳理 一、知识结构图: 二、要点回顾: 1.2×2列联表. 2.独立性检验与相关性检验(见下表).含义所用统计量步骤相同点不同点独立性检验都是统计学中的常21世纪教育网用方法,且步骤相似,思想一致[来源:21世纪教育网]所用的统计量不同,临界值不同相关性检验21世纪教育网21世纪教育网[来源:21世纪教育网] 三、关键信息强化: 1.独立性检验的两个重要工具是:统计量和临界值,只有准确计算(熟记计算公式),熟记各临界值及统计决断的原则,才能正确地处理独立性检验的问题. 2.线性回归方程中回归系数和回归截距的意义: 的意义:x每增加(或减少)一个单位,y平均改变个单位. 的意义:y不受x变化影响的部分. 3.由线性回归方程中的计算公式知:回归直线必过点. 4.做回归分析要有实际意义,而如何才能知道有无实际意义呢?———相关性检验. 5.相关系数和临界值是正确进行相关性检验的两大重要因素. 要明确相关系数的大小与相关程度的关系(即的性质),并要会根据公式计算或利用计算器计算.另外的查法要熟练掌握. 6.相关性检验就是检验与的大小关系.四、特别警示: 1.分析两个变量相关关系的常用方法: (1)利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,如果这些点大致分布在通过散点图中心的一条直线的附近,那么就说这两个变量之间具有线性相关关系. (2)利用相关系数r进行判断:而且越接近于1,相关程度越强;越接近于0,相关程度越弱. 2.对具有相关关系的两个变量进行统计分析时,首先进行相关性检验,在确认具有线性相关关系后,再求线性回归方程. 3.在实际问题中,经常会面临需要推断的问题,在作推断时,我们不能仅凭主观意愿作出结论,而是需要通过试验来收集数据,并根据独立性检验的原理做出合理的推断. 4.统计方法是可能犯错误的,不管是回归分析还是独立性检验,得到的结论都可能犯错误.好的统计方法就是要尽量降低犯错误的概率,比如在推断吸烟与患肺癌是否有关时,通过收集数据,整理分析数据得出的结论是“吸烟与患肺癌有关”,而且这个结论犯错误的概率在0.01以下,实际上,这是统计思维与确定性思维差异的反应,这是数学问题,不一定在实际中得到验证. 五、应用举例: 例1 考察人的高血压是否与食盐摄入量有关,对某地区人群进行跟踪调查,得到以下数据:患高血压未患高血压合计喜欢较咸食物34220254喜欢清淡食物2613531379合计6015731633 有多大把握认为高血压病与食盐摄入量有关? 解:由公式得 , ∴有的把握说高血压病与食盐摄入量有关. 例2 对某种产品进行一项腐蚀加工试验,得到腐蚀时间x(s)和腐蚀深度y()数据如下:51020304050606590120681316171925252946 (1)进行相关性检验; (2)如果x与y之间具有线性相关关系,求出线性回归方程,并预测当腐蚀时间为75s时,腐蚀深度为多少? 解:(1)计算得, 则x与y具有线性相关关系. (2)求得,, ∴线性回归方程为, 当腐蚀时间为75s时,将代入得, ∴腐蚀深度约为29.身边的统计案例 统计与实际生活密切相关,涉及知识面广,题目新颖,特别是能够与工农业生产、生活、文化、体育等实际问题相结合,因而在高考中也会越来越受到重视. 一、统计知识在生产中的应用 例1 为了研究三月下旬的平均气温()与四月二十号前棉花害虫化蛹高峰日()的关系,某地区观察了2001年到2006年的情况,得到下面的数据:年份200120022003200420052006(℃)24.429.632.928.730.328.9(日)19611018 据气象预测,该地区在2007年三月下旬的平均气温为27℃,试估计2007年四月份化蛹高峰日为哪天? 解:运用科学计算器,得,,,, 所以,,可知回归方程为, 当时,,据此,可估计该地区2007年4月12日或13日为化蛹高峰日. 点评:求线性回归方程,只需掌握计算公式,通常用计算器来完成.在有的专门的计算器中,可通过直接按键得到线性回归方程的系数.而用一般的科学计算器进行计算,则需要列出表格,根据表格内的数据求出回归直线方程. 二、统计知识在质量监测中的应用 例2 某奶制品厂生产袋装奶粉,按标准每袋奶粉净重应为454克,在生产的实际过程中,由于各种随机因素的影响,装袋机不可能保证每袋奶粉的净重恰好等于454克,只可能限制它的误差,即要求:①奶粉平均净重为454克;②每袋奶粉净重不能偏离454克太多,有一个限度即偏差不大于5克. 某日该厂进行抽样检查,从8∶00开始,每隔15分钟抽检一次,下表是部分抽检结果:8:008:158:308:459:009:159:309:4510:00 (1)根据检查情况,绘制质量控制图; (2)请对检查情况作一分析. 解:(1)根据抽查结果,绘制质量控制图如右图(其中横坐标表示时间,纵坐标表示每袋奶粉的净重,单位:克).对于给定的标准454克,在图中画一条直线,它过纵坐标轴上标有454的点且平行于横轴,在上、下各画一条与之平行的直线,它们与纵轴分别交于459、449处,这两条线称为上下控制线; (2)通过控制图观察,当图中标出的点在两条控制线之间时,该袋奶粉的净重是符合要求的,可以认为生产是正常的;若该点在上、下控制线外,说明生产的产品出了问题,通常要调整设备甚至停产,寻找原因进行整顿. 根据控制图上多个点的变动趋势,可以了解到装袋机的运行情况,发现,尽管9点45(t8)以前的点都在控制线内,但在上方的点比在下方的点多,从而会使平均净重大于454克,另外从9点()开始,每袋奶粉越来越重,在10点()时,样本的重量已超过459克,所以该设备应停止生产. 点评:新课标要求学生通过对统计案例的学习,学会使用一些常用的统计方法解决实际问题,了解实际的推断原理、假设检验的基本思想、方法及初步应用,了解独立性检验及回归分析的基本思想、方法及初步应用.这部分内容比较开放,是新高考命题中较好的命题题型. 三、统计知识在人口预测中的应用 例3 某国从1790年至1950年人口数据统计资料:时间(年)179018001810182018301840185018601870人口(百万)3.9295.3087.249.36812.86617.06923.18231.44338.558时间(年)18801890190019101920193019401950人口(百万)50.15662.94875.99591.972105.711122.775131.669150.697 试利用上述资料预测该国1980年的人口数(假设该国政治、社会、经济环境稳定,且人口数相对于时间是连续的). 分析:以轴代表时间,轴代表人口数,建立直角坐标系,画出散点图(略).观察散点图可以发现,从1890年以后散点近似分布在一条直线上,故可采用线性回归模型拟合.(而从散点图的整体趋势来看,也可以认为散点近似分布在一条抛物线上,可采用二次函数模型拟合.请同学们自己试着做.) 解:由散点图可以看出,1890年以后散点大致分布在一条直线上,设线性回归直线方程为,由公式求得,,即. ∴当时,,即1980年该国人口预测为百万人. 点评:本题主要考查对信息的提取,图表的分析、加工和处理能力.线性回归模型是在依据部分已知数据的基础上作出的,因此精确度比较差.当然,同学们可以进一步利用回归分析的方法,通过相关系数来判断这个模型的拟合效果. 展开更多...... 收起↑ 资源预览