(苏教版选修1—2)数学:第一章《统计案例》素材

资源下载
  1. 二一教育资源

(苏教版选修1—2)数学:第一章《统计案例》素材

资源简介

统计案例知识梳理
  一、知识结构图:
  二、要点回顾:
  1.2×2列联表.
  2.独立性检验与相关性检验(见下表).
含义
所用统计量
步骤
相同点
不同点
独立性检验
都是统计学中的常21世纪教育网
用方法,且步骤相
似,思想一致[来源:21世纪教育网]
所用的统计量不
同,临界值不同
相关性检验
21世纪教育网
21世纪教育网
[来源:21世纪教育网]
  三、关键信息强化:
  1.独立性检验的两个重要工具是:统计量和临界值,只有准确计算(熟记计算公式),熟记各临界值及统计决断的原则,才能正确地处理独立性检验的问题.
  2.线性回归方程中回归系数和回归截距的意义:
  的意义:x每增加(或减少)一个单位,y平均改变个单位.
  的意义:y不受x变化影响的部分.
  3.由线性回归方程中的计算公式知:回归直线必过点.
  4.做回归分析要有实际意义,而如何才能知道有无实际意义呢?———相关性检验.
  5.相关系数和临界值是正确进行相关性检验的两大重要因素.
  要明确相关系数的大小与相关程度的关系(即的性质),并要会根据公式计算或利用计算器计算.另外的查法要熟练掌握.
  6.相关性检验就是检验与的大小关系.
四、特别警示:
  1.分析两个变量相关关系的常用方法:
  (1)利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,如果这些点大致分布在通过散点图中心的一条直线的附近,那么就说这两个变量之间具有线性相关关系.
  (2)利用相关系数r进行判断:而且越接近于1,相关程度越强;越接近于0,相关程度越弱.
  2.对具有相关关系的两个变量进行统计分析时,首先进行相关性检验,在确认具有线性相关关系后,再求线性回归方程.
  3.在实际问题中,经常会面临需要推断的问题,在作推断时,我们不能仅凭主观意愿作出结论,而是需要通过试验来收集数据,并根据独立性检验的原理做出合理的推断.
  4.统计方法是可能犯错误的,不管是回归分析还是独立性检验,得到的结论都可能犯错误.好的统计方法就是要尽量降低犯错误的概率,比如在推断吸烟与患肺癌是否有关时,通过收集数据,整理分析数据得出的结论是“吸烟与患肺癌有关”,而且这个结论犯错误的概率在0.01以下,实际上,这是统计思维与确定性思维差异的反应,这是数学问题,不一定在实际中得到验证.
  五、应用举例:
  例1 考察人的高血压是否与食盐摄入量有关,对某地区人群进行跟踪调查,得到以下数据:
患高血压
未患高血压
合计
喜欢较咸食物
34
220
254
喜欢清淡食物
26
1353
1379
合计
60
1573
1633
  有多大把握认为高血压病与食盐摄入量有关?
  解:由公式得
  ,
  ∴有的把握说高血压病与食盐摄入量有关.
  例2 对某种产品进行一项腐蚀加工试验,得到腐蚀时间x(s)和腐蚀深度y()数据如下:
5
10
20
30
40
50
60
65
90
120
6
8
13
16
17
19
25
25
29
46
  (1)进行相关性检验;
  (2)如果x与y之间具有线性相关关系,求出线性回归方程,并预测当腐蚀时间为75s时,腐蚀深度为多少?
  解:(1)计算得,
  则x与y具有线性相关关系.
  (2)求得,,
  ∴线性回归方程为,
  当腐蚀时间为75s时,将代入得,
  ∴腐蚀深度约为29.
身边的统计案例
  统计与实际生活密切相关,涉及知识面广,题目新颖,特别是能够与工农业生产、生活、文化、体育等实际问题相结合,因而在高考中也会越来越受到重视.
  一、统计知识在生产中的应用
  例1 为了研究三月下旬的平均气温()与四月二十号前棉花害虫化蛹高峰日()的关系,某地区观察了2001年到2006年的情况,得到下面的数据:
年份
2001
2002
2003
2004
2005
2006
(℃)
24.4
29.6
32.9
28.7
30.3
28.9
(日)
19
6
1
10
1
8
  据气象预测,该地区在2007年三月下旬的平均气温为27℃,试估计2007年四月份化蛹高峰日为哪天?
  解:运用科学计算器,得,,,,
  所以,,可知回归方程为,
  当时,,据此,可估计该地区2007年4月12日或13日为化蛹高峰日.
  点评:求线性回归方程,只需掌握计算公式,通常用计算器来完成.在有的专门的计算器中,可通过直接按键得到线性回归方程的系数.而用一般的科学计算器进行计算,则需要列出表格,根据表格内的数据求出回归直线方程.
  二、统计知识在质量监测中的应用
  例2 某奶制品厂生产袋装奶粉,按标准每袋奶粉净重应为454克,在生产的实际过程中,由于各种随机因素的影响,装袋机不可能保证每袋奶粉的净重恰好等于454克,只可能限制它的误差,即要求:①奶粉平均净重为454克;②每袋奶粉净重不能偏离454克太多,有一个限度即偏差不大于5克.
  某日该厂进行抽样检查,从8∶00开始,每隔15分钟抽检一次,下表是部分抽检结果:
8:00
8:15
8:30
8:45
9:00
9:15
9:30
9:45
10:00
  
(1)根据检查情况,绘制质量控制图;
  (2)请对检查情况作一分析.
  解:(1)根据抽查结果,绘制质量控制图如右图(其中横坐标表示时间,纵坐标表示每袋奶粉的净重,单位:克).对于给定的标准454克,在图中画一条直线,它过纵坐标轴上标有454的点且平行于横轴,在上、下各画一条与之平行的直线,它们与纵轴分别交于459、449处,这两条线称为上下控制线;
  (2)通过控制图观察,当图中标出的点在两条控制线之间时,该袋奶粉的净重是符合要求的,可以认为生产是正常的;若该点在上、下控制线外,说明生产的产品出了问题,通常要调整设备甚至停产,寻找原因进行整顿.
  根据控制图上多个点的变动趋势,可以了解到装袋机的运行情况,发现,尽管9点45(t8)以前的点都在控制线内,但在上方的点比在下方的点多,从而会使平均净重大于454克,另外从9点()开始,每袋奶粉越来越重,在10点()时,样本的重量已超过459克,所以该设备应停止生产.
  点评:新课标要求学生通过对统计案例的学习,学会使用一些常用的统计方法解决实际问题,了解实际的推断原理、假设检验的基本思想、方法及初步应用,了解独立性检验及回归分析的基本思想、方法及初步应用.这部分内容比较开放,是新高考命题中较好的命题题型.
  三、统计知识在人口预测中的应用
  例3 某国从1790年至1950年人口数据统计资料:
时间(年)
1790
1800
1810
1820
1830
1840
1850
1860
1870
人口(百万)
3.929
5.308
7.24
9.368
12.866
17.069
23.182
31.443
38.558
时间(年)
1880
1890
1900
1910
1920
1930
1940
1950
人口(百万)
50.156
62.948
75.995
91.972
105.711
122.775
131.669
150.697
  试利用上述资料预测该国1980年的人口数(假设该国政治、社会、经济环境稳定,且人口数相对于时间是连续的).
  分析:以轴代表时间,轴代表人口数,建立直角坐标系,画出散点图(略).观察散点图可以发现,从1890年以后散点近似分布在一条直线上,故可采用线性回归模型拟合.(而从散点图的整体趋势来看,也可以认为散点近似分布在一条抛物线上,可采用二次函数模型拟合.请同学们自己试着做.)
  解:由散点图可以看出,1890年以后散点大致分布在一条直线上,设线性回归直线方程为,由公式求得,,即.
  ∴当时,,即1980年该国人口预测为百万人.
  点评:本题主要考查对信息的提取,图表的分析、加工和处理能力.线性回归模型是在依据部分已知数据的基础上作出的,因此精确度比较差.当然,同学们可以进一步利用回归分析的方法,通过相关系数来判断这个模型的拟合效果.

展开更多......

收起↑

资源预览