资源简介 《成对数据的统计分析》总体设计I总体设计本章在必修课程统计内容的基础上,通过成对数据研究两个随机变量(以下简称变量)之间的关系,内容包括成对数据的统计相关性、一元线性回归模型、2×2列联表,通过本章学习,学生将掌握成对样本数据的直观表示方法及线性相关统计特征的刻画方法,能够根据成对数据的统计相关性推断两个变量的相关性,解决统计相关性的简单实际问题;理解一元线性回归分析的方法,会用一元线性回归模型刻画两个变量之间的相关关系,并进行预测;理解列联表的统计意义,会用列联表的方法解决两个变量独立性检验的简单实际问题在本章的学习过程中,学生将进一步感悟根据实际情况进行科学决策的必要性和可能性;体会统计思维与确定性思维的差异、归纳推断与演绎证明的差异;积累数据分析的经验,培养数据分析、数学建模、逻辑推理等素养.一、本章学习目标1.成对数据的统计相关性(1)结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.(2)结合实例,会通过样本相关系数比较多组成对数据的相关性.2.一元线性回归模型(1)结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.(2)针对实际问题,会用一元线性回归模型进行预测3.列联表(1)通过实例,理解列联表的统计意义,(2)通过实例,了解列联表独立性检验及其应用.二、本章知识结构框图三、内容安排在必修课程中,学生学习过一些样本数据的直观表示方法和统计特征的刻画方法,例如直方图、均值、方差、取值规律、分位数等,并根据样本数据的统计特征估计总体的统计特征.这些方法主要适用于解决单个变量的统计问题.本章在必修课程基础上,以样本估计总体为主要思想方法,通过成对样本数据的统计相关性研究两个变量之间的相关性.根据《标准(2017年版)》的要求,本章包括成对数据的统计相关性、一元线性回归模型、列联表三部分内容,教科书据此共安排了三节内容:“8.1 成对数据的统计相关性”“8.2 一元线性回归模型及其应用”“8.3 列联表与独立性检验”.这三节内容中,前两节主要是学习处理定量数据的统计方法,其中8.2节可以看作8.1节的后继知识,8.3节主要是学习处理定性数据的统计方法.8.1节主要是通过成对样本数据研究两个数值变量之间的相关性.按照先直观描述后定量刻画的原则,本节分为“8.1.1变量的相关关系”和“8.1.2样本相关系数”两小节.8.1.1.小节主要是引入变量之间相关关系的概念,并根据成对样本数据的散点图直观推断变量之间的相关关系.教科书通过案例“一个人身高与体重的关系”引入相关关系的概念,并通过举例明确概念外延,同时也让学生感受到研究此类问题的必要性.在此基础上,结合“人体的脂肪含量和年龄之间关系”,介绍成对样本数据的散点图,据此直观推断变量之间的相关关系,并引入正相关、负相关、线性相关三种特殊且重要的相关关系.8.1.2小节主要是引入样本相关系数的概念,样本相关系数不仅可以反映成对样本数据相关的正负性,而且可以定量地刻画成对样本数据线性相关的程度.教科书通过对散点图无法定量刻画成对样本数据相关程度的分析,让学生感受引入样本相关系数的必要性.对于样本相关系数的定义,教科书从统计直观出发,先初步建立刻画相关性的数学表达式,再通过逐步优化表达式得到样本相关系数公式,在过程中让学生体会样本相关系数定义的合理性,积累数据分析的经验引入样本相关系数的定义后,教科书对样本相关系数的性质进行讨论,明确样本相关系数的正负性可以反映成对样本数据相关的正负性,样本相关系数绝对值的大小可以刻画成对样本数据线性相关程度的强弱,并根据样本相关系数推断两个变量之间相关的正负性,以及线性相关程度的强弱.8.2节主要是利用一元线性回归模型刻画两个数值变量的相关关系,并利用估计得到的经验回归方程进行预测.根据先建立模型再估计模型参数的顺序,本节内容分为“8.2.1 一元线性回归模型”“8.2.2 一元线性回归模型参数的最小二乘估计”两小节.8.2.1小节主要是建立一元线性回归模型刻画两个数值变量之间的相关关系.教科书结合具体案例“儿子身高与父亲身高的关系”,在一次函数模型的基础上,通过引入随机误差项,建立一元线性回归模型刻画两个数值变量之间的相关关系.结合这个案例,教科书还讨论了回归模型中随机误差产生的原因.8.2.2小节主要是用最小二乘法估计一元线性回归模型中的参数,得到经验回归方程,进而根据解释变量的取值预测响应变量的取值.教科书结合“儿子身高与父亲身高的关系”这个案例,完整呈现了从直观寻找与散点整体接近的直线,到用定量刻画整体接近的程度,最后得到参数估计的数学化过程,在过程中让学生体会最小二乘法的思想,积累数据分析的经验.在此基础上结合具体案例,利用回归方程进行预测,并对结果进行合理解释,解到参数与的统计含义.对建立的模型进行评价是利用统计建模解决实际问题的一个重要环节,为此教科书还进一步介绍了残差分析的方法,据此对模型进行评价和改进.8.3节主要是基于列联表推断两个分类变量的独立性.按照先直观描述后定量刻画的原则,本节内容分为“8.3.1分类变量与列联表”“8.3.2独立性检验”两小节.8.3.1小节主要是基于2×2列联表直观推断两个分类变量的独立性.根据数据是普查还是抽样得到,这一小节还分两个层次:先研究普查数据的问题,再研究抽样数据的问题.教科书结合“男生和女生在体育锻炼的经常性”的普查数据,用比率和条件概率两种方法判断两个分类变量的独立性,其中通过比率判断比较符合直观,而通过条件概率判断,则是为了后续通过抽样数据推断分类变量的独立性作思想方法上的铺垫.8.3.2小节是基于列联表,用假设检验的思想推断两个分类变量的独立性,即独立性检验.教科书首先通过度量推断犯错误的可能性大小体现引入独立性检验的必要性.为了得到定量推断分类变量独立性的方法,教科书从频率和概率的关系出发,详细地展示了统计量的构造过程,目的还是在这个过程中让学生体会统计的思想方法,积累数据分析的经验.这样,利用统计量的近似分布和小概率原理,就可以根据的观测值对分类变量的独立性作出科学的推断.关于独立性检验,教科书设置了“基于同一组数据的分析,但却得出了不同的结论”和“独立性检验和反证法的比较”的两个思考,帮助学生深入认识独立性检验思想方法的特点.本章重点是成对数据的统计相关性、一元线性回归模型、独立性检验;难点是理解独立性检验的思想.四、课时安排本章教学时间约需9课时,具体分配如下(仅供参考):8.1成对数据的统计相关性 约2课时8.2一元线性回归模型及其应用 约3课时8.3列联表与独立性检验 约2课时小结 约2课时五、本章编写思考1.结合典型案例介绍统计的概念和方法统计概念和方法的学习应该结合具体案例进行,因此与必修课程中的统计编写思路一样,本章主要通过学生熟悉的具体案例提出统计问题,在问题的解决过程中学习统计的概念和方法,尽量避免在没有具体案例支撑的情况下抽象地介绍定义和方法.例如,在“8.2一元线性回归模型及其应用”中,教科书以案例“儿子身高与父亲身高的关系”为作为贯穿始终的线索.教科书首先根据生活经验和调查数据得到儿子身高和父亲身高正线性相关,在具体分析影响儿子身高的因素后,引入带有随机误差项的一元线性回归模型.然后以儿子身高与父亲身高的数据为载体,寻找散点的拟合直线,引入最小二乘法,得到模型参数的估计公式和经验回归方程.接着结合儿子身高与父亲身高的经验回归方程,介绍预测和模型的评价,引入观测值、预测值、残差等概念.2.重视内容逻辑和认知规律的融合在组织安排高中统计内容时,教科书特别重视内容逻辑和认知规律的融合.必修课程的统计主要通过数据研究单变量的统计问题,选择性必修课程的统计主要通过成对样本数据研究两个变量关系的统计问题.不管是单变量的数据还是两个变量的成对数据,研究的统计问题和处理数据所用的统计方法往往和变量的类型有关,在研究两个数值型变量的相关性时,成对样本数据的直观表示主要用散点图,线性相关程度的刻画主要用样本相关系数,线性相关关系的刻画用线性回归模型.而在研究两个分类变量的相关性时,则是基于列联表用独立性检验的方法推断其独立性.本章前两节安排的是数值变量的内容,其中8.2节为8.1节的后继知识,8.3节安排的是分类变量的内容.而每一节的内部,又基本按照先直观描述后定量刻画的原则进行安排,体现了统计中研究问题的一般思路.例如,对于两个数值变量相关性的推断,先通过散点图进行直观推断,在此基础上通过引入样本相关系数进行定量推断;对于两个分类变量的独立性检验,先根据全面调查数据推断两个变量之间的独立性,再根据抽样调查数据推断两个变量之间的独立性.这样安排,使内容组织具有整体性、层次性,每部分内容的呈现也体现从直观想法到数学表达的循序渐进的过程,符合学生的认知规律.3.体现引入统计概念和方法的必要性和合理性统计学习不应只是记住一些概念、公式或方法实施的操作步骤,更重要的是要了解概念和方法产生的必要性,以及方法的合理性,了解统计研究问题的思路和特点,进而学会用统计的眼光看问题,培养数据分析素养,因此,教科书在介绍有关统计的概念和方法时,特别重视在样本估计总体思想的指导下,呈现统计概念和方法的形成过程.在本章中,教科书主要通过典型案例体现统计概念和方法产生的必要性,例如,在案例“一个人身高与体重的关系”中,通过描述身高和体重之间的不确定性关系,引入相关关系的概念;通过刻画儿子身高和父亲身高的线性关系,建立一元线性回归模型.教科书主要通过呈现统计的直观想法到严格数学表达的逐步转化过程,体现统计概念或方法的合理性,例如,对于样本相关系数的定义,教科书先引导学生观察具有正、负相关性的成对数据散点图呈现的不同特征,然后初步构造出能反映增长趋势相同或相反的代数表达式,再通过数据标准化对表达式进行优化,最后得到不受样本量、单位等影响的样本相关系数公式,这个过程体现了样本相关系数定义的合理性,教科书对于一元线性回归模型参数的估计、统计量的定义也都是通过呈现它们产生和形成的过程来体现其合理性4.注重与已有知识的联系加强与已有知识的联系,既可以帮助理解新知识,又有利于以后用统一的观点看问题.例如,相关关系是两个变量之间的一种不确定性关系,教科书在引入相关关系的概念时,特意与已学过的用来刻画两个变量之间确定关系的函数概念进行比较,通过比较使学生更容易抓住相关关系的特点.又如,在引入一元线性回归模型时,先明确一次函数不能完全刻画线性相关关系,接着在一次函数模型的基础上构建一元线性回归模型,这样既建立了两种模型的联系与区别,又体现了建立一元线性回归模型的必要性和合理性.对初学者来说,通过与熟悉的类似知识比较,可以促进理解新知识.5.重视信息技术与统计内容的融合运用计算器、计算机等信息技术工具,不仅可以实现快速、准确地列表、画图、计算等数据处理,而且能使大量人工难以完成的数据处理变成可能,学会使用统计软件是统计学习的重要组成部分,《标准(2017年版)》对此也提出了有明确要求.在统计学习中,学会合理使用信息技术,可以把学生从机械、烦琐的数据处理中解放出来,把更多精力集中于统计概念和方法的理解,从而提高学习的效率.而且当处理真实数据不再困难时,必将提高学生学习统计和应用统计的提示.教科书在本章对信息技术与统计内容的融合给予了充分关注,在正文中以各种形式呈现了用信息技术处理数据的方法,但限于篇幅,教科书只给出R和 Excel两种软件对应函数或操作方法的提示.六、本章教学建议1.强调样本估计总体的思想用样本估计总体是统计的基本思想.在义务教育阶段,学生学习了用统计图表表示数据,用平均数和方差等数字特征刻画数据的特征,虽然也会涉及样本估计总体,但重点在于对数据本身的统计特征的描述和刻画,数据的随机性考虑不多.到高中阶段,统计的内容开始强调数据的随机性,要求通过随机样本数据对总体作出估计,估计的目标是得到总体的有关结论,此时对样本数据本身的刻画不再是最终目标,而是达到目标的一种手段.因此在高中统计教学中应该强调样本估计总体的思想.必修课程的统计主要是关于单变量总体的估计或推断,例如通过样本数据的均值、方差、分位数估计总体相应的数字特征.在选择性必修课程的统计中,样本估计总体仍然是基本的统计思想,只是数据由一维变为二维,总体由一个变量变为两个变量.在本章中,通过样本相关系数估计两个变量的相关性,通过一元线性回归模型刻画两个变量的相关关系,通过统计量检验两个分类变量的独立性,都是关于两个变量这个总体的估计或推断,在教学中应充分重视.2.准确把握统计的学科逻辑我们知道,函数、代数、几何、概率等内容是从定义出发,主要使用演绎推理的方法证明结论,演绎推理是从一般到特殊的推理,只要前提正确、推理形式正确,得到的结论必然正确.因此得出的结论具有确定性,而统计是从样本数据出发,根据样本数据的结论推断总体的结论,这是从部分到总体、特殊到一般的推理,在推理方法上属于不完全归纳.不完全归纳的特点是前提正确并不意味着得到的结论正确,也就是说统计的推断有可能犯错误,结论具有不确定性.由于出发点和推理方法的不同,统计与函数、代数等内容在对结论的判断标准上也不一样,前者是好与坏,后者是对与错.在教学中对此要准确把握.只有从整体上准确把握统计学科逻辑的特点,才能准确理解统计教学的内容,准确把握教科书的编写意图并展开教学.3.注重统计概念和方法的产生和形成过程统计中每一个概念和方法的引入都有其必要性,之所以成为目前的形式也都有其合理性.在教学中体现好这个过程,不但有利于明确学习的方向和任务、让学生感受到知识的产生是自然的、合理的,还有利于在概念和方法的形成过程中让学生体会统计的思想方法,积累数据分析的经验.在本章中,教科书特别强调从统计直观到数学表达的转化过程,在教学中应该较为完整地展现这个过程并让学生参与其中,例如,对于估计一元线性回归模型参数所用的最小二乘法,教学中可以让学生从寻找与散点在直觉上整体最接近的直线开始,逐步过渡到对整体最接近的数学刻画,再在若干表达式中选择平方和最小的作为标准.通过让学生经历这个过程,既可以体会统计方法从统计直观到数学表达的转化过程,从中体会统计思想,积累数据分析的经验,培养数据分析素养,又可以体会标准不同结论就不同的统计方法的特点,当然,数据分析素养的培养涉及很多方面,也是一个长期过程,但不断经历概念和方法形成的过程是重要的方面.4.加强信息技术工具的使用信息技术既是现代统计的组成部分,也是统计学习的有效辅助手段,《标准(2017年版)》明确要求在这部分内容中“会利用统计软件进行数据分析”.因此,在统计教学中,应该明确要求学生使用信息技术探索数据的规律,提高教学的效率和质量.当然,利用信息工具画图和计算应该在理解统计思想和方法的基础上进行.例如,对于一组样本数据,利用统计软件可以快速地进行排序等整理,计算出各种数字特征,画出各种统计图等,利用它们可以从不同的角度探索数据的规律.又如,用一元线性回归模型刻画两个变量之间关系,会涉及画散点图、计算样本相关系数、求经验回归方程、画残差图等一系列画图和计算.如果每一项工作都用纸笔进行,且样本数据又较多的话,那么工作量就会非常大,而且很多是重复、机械的工作.如果利用统计软件,一旦输入数据,那么上面每一项工作,只需要进行简单的菜单操作或函数调用即可完成,而且输出结果既快捷又准确.1 / 7 展开更多...... 收起↑ 资源预览