资源简介 (共88张PPT)情境五 描述统计分析统计学目 录一数据集中趋势二离散程度测度偏态和峰度三学习重点算术平均数的计算方法;中位数、众数的计算方法;算术平均数与中位数、众数的关系;计算和应用平均指标时应该注意的问题。标准差的计算方法和应用;标准差系数的计算与使用方法。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(一) 算术平均数(二) 众数(三) 中位数情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度数据分布的特征情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度数据分布的特征情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度数据分布的特征情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度集中趋势的特点(1)一组数据向其中心值靠拢的倾向和程度(2)测度集中趋势就是寻找数据水平的代表值或中心值(3)不同类型的数据用不同的集中趋势测度值情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(4)低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(一)算术平均数算术平均数是统计中最基本的、应用最广泛的一种平均数。算术平均数的计算,由于掌握资料的不同,可分别采用简单算术平均数和加权算术平均数。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度1.简单算术平均数——适用于总体资料未经分组整理、尚为原始资料的情况情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度2. 加权算术平均数——适用于总体资料经过分组整理形成变量数列的情况如果已掌握的资料经过分组,已编成变量数列,那么应采用加权算术平均数计算平均灵敏。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度加权算术平均数是用各单位的标志值乘以相应的各组单位数求出各组标志总量,并加总得到总体标志总量,再除以总体单位总量,而求得平均数。其计算公式为情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度权数指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各组的标志值对平均数的影响程度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度绝对权数表现为次数、频数、单位数;相对权数表现为频率、比重;权数是以某种数量形式对比、权衡被评价事物总体中诸因素相对重要程度的量值。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度第一,权数的数量形式可以是多种多样的,可以是绝对数,也可以是相对数;可以是结构相对数,也可以是比例相对数;可以取正数,甚至有时也可以取负数。第二,权数尽管可以以绝对数或比例相对数的形式出现,但权数的实质是结构相对数。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度第三,权数是用来衡量诸内部因素在总体中重要程度的,由于人们是从不同方面来把握重要程度的,因而这个定义就不是把权数仅仅限于频率和同度量因素这一狭窄的范围内。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度3.算术平均数的主要数学性质⒈变量值与其算术平均数的离差之和衡等于零,即:⒉变量值与其算术平均数的离差平方和为最小,即:情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(二)众数1.众数的概念众数是指总体中出现次数最多的那个标志值。2,众数的确定方法(1)未分组资料众数的确定。根据概念来确定,出现次数最多的变量值即为该分组数据的众数值。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(2)单项式变量数列众数的确定。①确定众数组,出现次数最多的组即为众数组。②众数组的变量值即为该数列的众数值。(3)组距式变量数列众数的确定。组距式变量数列众数的确定,则较为复杂一点。①将频数最多的变量值所在组定为众数组。②利用上限公式或下限公式来计算众数值。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(三)中位数排序后处于中间位置上的值情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小,即情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度对于顺序数据:对于数值数据:(常用方式)情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度顺序数据的中位数 (例题分析)情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度中位数的位置为300/2=150从累计频数看,中位数在“一般”这一组别中中位数为 Me=一般情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。比如有5笔付款:9元,10元,10元,11元,60元情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度平均付款为100/5=20元。很明显,这并不是一个好的代表值,而中位数10元是一个更好的代表值。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度数值型数据的中位数(未分组 奇数数据的算例)【例】9个家庭的人均月收入数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排序: 750 780 850 960 1080 1250 1500 1630 2000情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度位置: 1 2 3 4 5 6 7 8 9中位数 1080情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度中位数的确定(未分组资料)情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度数值型数据的中位数(未分组偶数数据的算例)【例】10个家庭的人均月收入数据排序:660 750 780 850 960 1080 1250 1500 1630 2000情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度位置:1 2 3 4 5 6 7 8 9 10情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度中位数的确定(未分组资料)情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度中位数的确定(单值数列)情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度中位数的确定(组距数列)情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度中位数的确定(组距数列)情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度众数、中位数和均值的关系情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度众数、中位数、均值的特点和应用众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度中位数不受极端值影响数据分布偏斜程度较大时应用算术平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度数据集中趋势的测度指标确实能反映某种事物的一般水平,在比较不同空间和时间上的情况是能消除规模大小的影响,是衡量其差距的重要指标。但只依据平均指标来评价事物的优劣远远不够。因为总体内部各单位标志值具有差异,有高低、大小、多少之别。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度就总体而言,平均数背后隐藏最大值与最小值之间的差距,有的差距不大,有的则非常悬殊。总体内部各单位标志值差距悬殊的平均数就掩盖着尖锐的矛盾,让人们感到不真实。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度所以,在反映具体问题时,除了从集中趋势角度分析外,还应把总体内部各单位标志值中最大值、最小值及其差距摆出来,要列出平均差异大小和差异的相对程度,即要对待研究现象进行离散程度的测度。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度某班三名同学三门课程的成绩如下:情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度离中趋势指总体中各单位标志值背离分布中心的规模或程度,用标志变异指标来反映。反映统计数据差异程度的综合指标,也称为标志变动度变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度测定离中趋势的意义用来衡量和比较平均数代表性的大小;用来反映社会经济活动过程的均衡性和节奏性;用来测定变量数列次数分布较正态分布的偏离程度。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(一)全距——极差(1)一组数据的最大值与最小值之差,又称全距。(2)离散程度的最简单测度值(3)易受极端值影响(4)未考虑数据的分布情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度7891078910情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度【例】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度全距的特点优点:计算方法简单、易懂;缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差往往应用于生产过程的质量控制中情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(二)内距情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(三)标准差平均差是总体各单位标志值与平均数离差的绝对值的算术平均数。平均差的计算考虑到了各个标志值之间的差异,因而较能确切地反映变量数列的标志变异程度。平均差的计算如下。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(四)方差和标准差数据离散程度的最常用测度值反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度4 6 8 10 12 x = 8.3情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度总体方差和标准差情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度标准差是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用 来表示;标准差的平方又叫作方差,用 来表示。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度计算公式:⑴ 简单标准差——适用于未分组资料情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度标准差的特点不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度由同一资料计算的标准差的结果一般要略大于平均差。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度样本方差和标准差 (simple variance and standard deviation)情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度样本方差自由度(degree of freedom)(1)一组数据中可以自由取值的数据的个数(2)当样本数据的个数为 n 时,若样本均值 x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(3)例如,样本有3个数值,即x1=2,x2=4,x3=9,则 x = 5。当 x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(4)样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(五)离散系数一般用标准差(也可用平均差)与其相应的均值之比对数据相对离散程度的测度消除了数据水平高低和计量单位的影响情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度用于对不同组别数据离散程度的比较,计算公式为情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度变异系数指标情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度应用:用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小:——标准差系数小的总体,其平均数的代表性大;反之,亦然。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度解:一班成绩的标准差系数为:二班成绩的标准差系数为:情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度因为 ,所以一班平均成绩的代表性比二班大。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(一)偏度(二)峰度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(一)偏度1.偏度的概念偏度是指反映次数分布偏态方向和程度的指标,我们知道次数分布若用图形表示,可以看出有的是对称的,有的是非对称的,即偏态。它是对分布偏斜方向和程度的测试。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度它和平均数、标准差一样,也是反映次数分布性质的一个重要指标。偏态通常分为两种:右偏(或正偏)与左偏(或负偏)。在分布中心对称时,算术平均数、中位数和众数是一致的。分布越偏,三者差距越大。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度(二)峰度1.峰度的概念峰度(Kurtosis),是指次数分布曲线与正态曲线相对平坦或尖峭程度。它反映次数分布的各个度量集中于平均数左右的相对程度。同偏度一样,也是次数分布的一个重要特征。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度2.峰度的类型峰度通常分为三种:一是正态峰度,又称标准峰度,是指次数分布各变量值在平均数左右均匀分布,形成正态曲线的峰度;二是尖顶峰度,又叫变峰度,是指次数分布各变量值在平均数左右分布密集形成类峭曲线的峰度;情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度三是平顶峰度,又叫低峰度,是指次数分布各变量值在平均数左右分布离散形成平坦曲线的峰度。情境五 描述统计分析一、 数据集中趋势三、 分布形状的测度二、 离散程度测度学习难点描述统计指标的选择;描述统计指标的软件(Excel,SPSS,Matlab)实现谢谢观看,请您多提宝贵意见!谢谢 展开更多...... 收起↑ 资源预览