4综合指标(2)平均与变异指标 课件(共85张PPT)- 《统计学理论与实务》同步教学(人民邮电版)

资源下载
  1. 二一教育资源

4综合指标(2)平均与变异指标 课件(共85张PPT)- 《统计学理论与实务》同步教学(人民邮电版)

资源简介

(共85张PPT)
*
*
概念:反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平。
特点:
平均指标将总体内各单位的差异抽象化了。 平
均指标是一个代表值,代表总体综合数量 特征的一
般水平。
一、平均指标的意义
第三节平均指标
*
*
作用:
1、反映总体各单位变量分布的集中趋势
或集中程度;
2、比较同类现象在不同单位的发展水平,
用来说明生产水平、经济效益或工作质量的
差距;
3、分析现象之间的依存关系。
应用平均指标的基本要求是:只能对同质
总体计算平均指标。
*
*
二、平均指标的种类及其计算
种类:
按反映的时间状况不同
按平均指标计
算方法不同
位置平均数
算术平均数
调和平均数
几何平均数
数值平均数
众数
中位数
静态平均指标(本节讲述)
动态平均指标(下章讲述)
*
*
(一)算 术 平 均 数
(Arithmetic Mean)
算术平均数
1、算术平均数的基本公式
总体标志总量
总体单位总量
=
用此公式计算算术平均数,必须注意分子与分母
之间存在的内在经济联系。即分子是分母所具有的标
志值。注意强度相对指标和平均指标的区别:
某企业职工月平均工资1200元/人月(平均指标);
某城市的月人均收入为570元/人月(强度相对数).
如:
*
*
区别主要表现在以下两点:
(1)指标的含义不同。强度相对指标说明某一现象在另一现象中发展的强度、密度或普遍程度;而平均指标说明的是现象发展的一般水平。
(2)计算方法不同。强度相对指标分子与分母的联系,只表现为一种经济关系,而平均指标是在一个同质总体内标志总量和单位总量的比例关系。分子与分母是内在的一一对应的联系,即分子是分母(总体单位)所具有的标志,对比结果是对总体各单位标志值的平均。
*
*
2、算术平均数 的计算形式
(1)简单算术平均数:
例如:已知5名工人的工资为:600元、780元、1050元、
1100元、900元。根据资料计算五名工人的平均工资:
解:设工人的工资为 “ ”, i= 1、2、3、4、5,则工人的
平均工资为:
(适用于未分组资料)
*
*
切尾均值
72
99
90
97
93
81
82
75
3
去掉一个最高分…
3号参赛选手的最终得分是86.33分。”
简单算术平均数特点
86.33
受各变量值本身大小的影响
不会超过变量值的变动范围
受极端变量值的影响较明显
*
*
(2)加权算术平均数: 适用于分组资料。
计算公式:
公式中:“X” 代表各组变量值
“f” 代表各组变量值出现的次数或频数
“∑”为合计符号
根据分组资料计算算术平均数,平均数的大小不仅受到各组变量值大小的影响,而且受到各个变量值出现次数多少的影响,因此需用下式计算其平均数:

*
*
因为各组变量值出现次数的多少对平均
数的形成产生权衡轻重的作用,所以将“f”称
为权数。权数即可以表现为“次数”的形式,
也可以表现为“比重”的形式。
用“比重”权数计算算术平均数的公式为:
计算公式:
—— ②
*
*
A、根据单项式数列计算算术平均数
例:某企业工人按日产量分组资料如下:
要求:根据资料计算工人的平均日产量。
日产量(件) 工人人数(人)
(x) (f) (f/∑f)
15 10   7
16 20 13
17 30 20
18 50 33
19 40 27
合计 150 100
*
*
A、根据单项式数列计算算术平均数
解:按第一个公式计算
按第二个公式计算:
*
*
B、根据组距数列计算算术平均数
要求:根据资料计算全部职工的平均工资。
例:某企业职工按工资分组资料如下:
工 资 (元) 职工人数(人)
x f f/∑f
400 —500 50 16.7
500 —600 70 23.3
600 —700 120 40.0
700 —800 60 20.0
合 计 300 100
*
*
解:计算过程如下:
工 资
(元) 组中值
x 职工人数 x f x(f/∑f)
f f/∑f
400—500
500—600
600—700
700—800 450
550
650
750 50
70
120
60 16.7
23.3
40.0
20.0 22500
38500
78000
45000 75.15
128.15
260.00
150.00
合 计 — 300 100 184000 613.33
平均工资:
根据组距数列计算算术平均数
*
*
两个班组工人生产资料如下:根据资料分别计算两个班组工人的平均日产量。
一班 二班
日产量 工人数 比重 日产量 工人数 比重
(件) (人) (%) (件) (人) (%)
20 2 10 20 1 5
21 1 5 21 1 5
22 15 75 22 1 5
23 1 5 23 1 5
24 1 5 24 16 80
合计 20 100 合计 20 100
C、权数在平均数形成中起的作用
*
*
计算得到:
一班工人平均日产量
二班工人平均日产量
*
*
D、权数的选择
当分组的标志为相对数或平均数时,经常会
遇到选择哪一个条件为权数的问题。如下例:
要求:计算全部企业的平均计划完成程度。
计划完成程度 企业数 计划产值
(%) (个) (万元)
80 — 90 5 50
90 —100 10 80
100 —110 120 200
110 —120 30 70
合 计 165 400
*
*
D、权数的选择
选择权数的原则:
1、变量与权数的乘积必须有实际经济意义。
2、依据相对数或平均数本身的计算方法来选择权数。
根据原则本题应选计划产值为权数,计算如下:
平均计划完成程度:
*
*
(3)简单算术平均数与加权算术平均数的关系
权数起作用必须有两个条件:
一是:各组标志值必须有差异。如果各组标志值没有差异
标志值成为常数,也就不存在权数了。
二是:各组的次数或比重必须有差异。如果各组次数或比
重没有差异,意味着各组权数相等,权数成为常数,则不
能起到权衡轻重的作用,这时加权算术平均数就等于简单
算术平均数。
用公式表示二者的关系:
当:
*
*
(4)算术平均数的数学性质:
1、算术平均数与变量值个数的乘积等于各个变量值的总和。
2、各个变量值与算术平均数的离差的总和为零。
3、各个变量值与算术平均数的离差的平方之和为最小。
*
*
4、两个独立的同性质变量代数和的平均数等于各变量平均数的代数和;其乘积的平均数等于各变量平均数的乘积。
5、各个变量值加或减一个任意数A,则算术平均数也增加或减少该数A
6、各个变量值乘或除以一个任意数A,则算术平均数也乘或除以该数A
*
*
分数 人数f 组中值x xf Y=x-75 yf z=y/10 zf
60以下 2 55 110 -20 -40 -2 -4
60—70
70—80
80—90
90以上 11
18
13
6 65
75
85
95 715
1350
1105
570 -10
0
10
20 -110
0
130
120 -1
0
1
2 -11
0
13
12
合计 50 — 3850 - 100 - 10
利用平均数的性质作简化运算
*
*
优点:
①容易理解, 便于计算
②灵敏度高
③稳定性好
缺点:
①易受极端值影响
②在偏斜分布和U形分布中,不具代表性
5、算术平均数的特点
*
*
调 和 平 均 数 的 计 算 方 法
(1)简单调和平均数
(2)加权调和平均数
(二)调和平均数(Harmonic Mean )
调和平均数是各个标志值倒数的算术平均数的倒数,所以又称倒数平均数。
加权调和平均数作为加权算术平均数的变形使用,仍
然依据算术平均数的基本公式计算。
*
*
调和平均数举例
2.50 元/kg
2.00元/kg
1.00元/kg
我各买1元的吃…
*
*
苹果价格及购买情况表
求平均价格
*
*
体会含义并进行比较
某种水产品早中晚价格各不相同,分别为3元/kg 、2元/kg和1元/kg
(1)消费者早中晚各买一公斤时;
(2)消费者早中晚各买一元时;
请计算两种情况下,消费者购买这种水产品的平均价格(元/kg)
加权算术平均
加权调和平均
*
*
调和平均数举例
苹果价格及购买情况表
购买数量
*
*
某工业局下属各企业按产值计划完成程度分组资料如下,
根据资料计算该工业局产值平均计划完成程度:
计划完成程度 企业数 实际产值
(%) (个) (万元)
80 — 90 5 50
90 —100 10 80
100 —110 120 200
110 —120 30 70
合 计 165 400
x
xh
m
∑m

=
平均计划完成程度
=
400
394
= 101.52%
例 题
组中值 m
(%) x x
85 59
95 84
105 190
115 61
— 394
m
说明:该工业局实际比计划多完成6万元,超额1.52%
完成产值计划任务。
计划产值
*
*
某车间各班组工人劳动生产率和实际产量资料如下:
班组 劳动生产率 实际产量
(件 工时) (件)
一 10 1000
二 12 2400
三 15 4500
四 20 6000
五 30 6000
合计 — 19900
例 题
要求:计算五个班组工人的平均劳动生产率。
x
m
m
x
100
200
300
300
200
1100
解:平均劳动生产率为:
(总工时)
*
*
※ 当m=xf时:
加权调和平均数公式就变成加权算术平均数公式
结论是:调和平均与算术平均的计算只是由于资料不同而出现的差异,其经济含义完全一致.
注意
*
*
优点:
①灵敏度高
②在某种不能计算算术平均数的条件
下,可以用调和平均数代替 。
缺点:
①不易理解
②易受极端值影响
③有“0”值时不能计算
调和平均数的特点
*
*
几何平均数:是另一种计算平均标志值的平均数。
也可区分为简单几何平均数和加权几何平均数。
简单几何平均数就是n个变量值(Xi)连乘积的n
次方根。
(三) 几何平均数(Geometric Mean)
为了计算方便,通常利用对数进行计算:
Log =(LogX1+LogX2+LogX3 +…+LogXn)/ n
=(∑LogXi)/ n
*
*
车 间 产品合格率(%)Xi 合格率的对数(LogXi)
铸造车间
金加工车间
电镀车间 95.0
95.8
93 1.9777
1.9814
1.9685
合计 —— 5.9276
例如:某企业生产一产品,要经过三个连续作业的车间,各车间的产品合格率如下表所示:试计算各车间产品的平均合格率。
XG =√∏Xi = √95%×95.8% ×93% = 94.58%
n
3
*
*
Log XG =(∑LogXi)/ n = 5.9276/3 = 1.9758
还可以按对数方法计算如下:
所以,车间产品合格率为94.58%
加权几何平均数:
XG =√X1 X2 X3 … Xn = √∏Xi
∑f
∑f
f3
f1
f2
fn
fi
同样可以用对数计算:
f1LogX1+f2LogX2+f3LogX3+ …+fnLogXn ∑fiLogXi
f1+f2+f3+ … +fn ∑fi
=
LogXG =
*
*
几何平均数的特点
优点:
①灵敏度高
②受极端值的影响相对较小
③对于等比或近似等比的数列几何平均
数比算术平均数更具代表性。
缺点:
①不易理解
②有“0”值时不能计算
*
*
数值平均数之间的关系:X≥XG≥XH
以两个变量来证明:
(a—b) = a — 2ab + b ≥0
a + b — 2ab + 4ab ≥ 4ab
(a+b) ≥4ab (a+b) ≥ 2 √ab
(a+b)/ 2 ≥√ab,
分别令 a=X1,b=X2 , 即得 X≥XG,
代入 a=1/X1,b=1/X2,即可得 XG≥XH
*
*
(四) 众 数 (Mode)
众数是现象总体中出现次数最多的标志值。
它反映了现象的一种集中趋势
众 数 的 确 定 方 法
(1)由未分组数列及单项数列确定众数
数列中出现次数最多的变量值就是众数。
例如:十个同学的英语成绩:55 63 65
70 78 78 78 82 87 91。则众数为78分。
也有可能没有众数或有多个众数的情况。
*
*
鞋码 需求量(双)
22
22.5
23
23.5
24
24.5
25 136
500
1950
2150
2500
1942
822
合计 10000
某鞋厂某种鞋市场需求调查情况
众数MO =24
结论:根据定义确定单项式数列的众数
单项式数列确定众数
*
*
(2)由组距数列确定众数
步骤:
①找出众数所在的组,即次数出现最多的一组的分组区间。即众数组可以直接观察确定。
②根据下列的公式计算众数
*
*
计算公式
其中:MO为众数,U、L分别为众数组上、下限,fm、fm-1、fm+1分别为众数组次数、众数组前一组次数及众数组后一组次数;d为组距
*
*
某班成绩分布表
分数 人数f 组中值x xf
60以下
60-70
70-80 √
80-90
90以上 2
11
18 √
13
6 55
65
75
85
95 110
715
1350
1105
570
合计 50 — 3850
组距数列确定众数
(分)
(分)
*
*
众数是一种位置平均数,不受各项变量值的影响,用它作为平均水平的代表值有不足之处,但当数列中出现异常变量值时,它不受极端值的影响,比平均数的代表性好。一般只适用于分布的次数较多且具有明显的集中趋势的总体。
众数不一定存在 无众数
存在时也不一定是唯一的
只有一个众数的分布 单峰分布
有两个众数的分布 双峰分布
结论
*
*
Mo
Mo
Mo
Mo
*
*
将总体中各单位的标志值按大小顺序排列,处于数列中点位置的标志值就是中位数。
中 位 数 的 计 算 方 法
(1)根据未分组资
料计算中位数
步骤:①将资料按大小顺序排列
②计算中位数的位次:
+ 1
2
n
③确定中位数
(五) 中 位 数(Median)
例:五(六)位同学的统计学成绩为 53 68 78 (82) 85 93,则中位数为 78,资料为奇数位时中位数即为中间位置的变量值;为偶数时中位数即为中间两个变量值的平均数 80。
*
*
拥有套数(套) 企业数(个) 向上累计 向下累计
1
2
3
4
5 35
48
26
12
4 35
83 √
109
121
125 125
90 √
42
16
4
合计 125 — —
根据定义:中位数所在位置(1+125)/2=63
中位数为 2 套
例:某省所有工业企业生产流水线拥有情况:
(2)根 据 单 项 数列计算中位数
步骤:①计算数列的中间位置点:
f
+ 1
2

②计算累计次数找出中位数所在的组
③确定中位数
*
*
(3)根据组距数列计算中位数
步骤:
①计算数列的中间位置点:
②计算累计次数,找出中位数所
在的分组
③用公式计算中位数
2

f
*
*
式中: L 表示中位数组的下限
U 表示中位数组的上限
fm 表示中位数所在组的次数
Sm-1 表示中位数所在组以前各组的向上累计次数
Sm+1 表示中位数所在组以后各组的向下累计次数
∑f 表示总次数
d 表示中位数所在组的组距。
下限公式
上限公式
*
*
分数 人数
f 向上累计
次数 向下累计
次数
60以下 2 2 50
60—70
70—80√
80—90
90以上 11
18√
13
6 13
31√
44
50 48
37√
19
6
合计
50 — —
例:某班成绩分布表
注意:单位为(分)
*
*
位置平均数与算术平均数的关系
(对称分布)
正(右)偏态分布
负(左)偏态分布
X
f
X
f
X
f
*
*
三种平均数的差别大小与偏斜程度的大小
呈正比例。这是由于各自受极端值的影响
不同。算术平均数受其影响最大;中位数
只受其位置影响,不受其数值大小影响;
众数都不受其影响。所以算术平均数或大
于众数,或小于众数,中位数总位于两者
之间。如上图。需要指出的是,有时中位
数实际的数字并不在其他两者之间。
*
*
在偏斜适度(轻微)时,可用英国统计学家卡尔皮尔逊(Karl Pearson)提出的以下经验公式:算术平均数到众数的距离约等于算术平均数到中位数距离的三倍。
*
*
应用平均指标计算和分析社会经济现象应注意以下原则:
①必须注意现象总体的同质性。消除不同质的“虚假平均数”。
②要用组平均数来说明总平均数
有些情况下,只计算总平均数不足以反映问题,要对总体内部进行分组,通过组平均数来补充。如下例:
③要用分配数列来补充说明总平均数
*
*

甲村
乙村
播种
亩数
总产量
公斤
平均
亩产
播种面积亩
总产量
公斤
平均
亩产
山地
50
12500
250
150
45000
300
平地
200
120000
600
100
65000
650
合计
250
132500
530
250
110000
440
通过上例可以看出:从总平均数看甲村的总单产530公斤/亩,乙村440公斤/亩,结论是甲村的粮食亩产比乙村高。但从组平均数看,不论是山地还是平地的亩产量,都是乙村好于甲村。
*
*
第四节 标志变异指标
一、标志变异指标的意义
1、概念:变异指标又称标志变动度,综合反映总
体各个单位标志值差异的程度。
2、作用:标志变异指标在统计分析研究中的作用
主要有如下几方面:
(1)变异指标反映总体各单位标志值分布的离
中趋势。总体各单位的标志值围绕平均指标上下
波动。所以平均指标反映总体各单位标志值的集
中趋势。而变异指标则表明总体各单位标志值的
分散程度,对于变动中心来说,也就是反映标志
值的离中趋势。
*
*
(2)变异指标可以说明平均指标的代表程度。
平均指标作为总体各单位标志值一般水平的代
表,其代表性的高低,随着标志值的差异程度
不同而有很大区别。
(3)变异指标说明现象变动的均衡性或稳定性。现象活动过程的稳定性和均衡性,可以从
每一时期的工作和整个时期中的平均工作量的
关系上反映,如果每一时期的工作量与平均工
作量大体相等,则现象活动过程、是均衡的、
稳定的。
*
*
二、变异指标的种类及计算方法
(一)全距Range :最大变量值与最小变量值
之差,它说明标志值的变动范围.用R表示
优点:计算简便、易懂、意义明确
缺点:受极端值影响较大;不能全面反映各单 位标志值的变异情况
全距
平均差
标准差
变异系数
第一组 5 5 6 4 5 平均值=5 比较集中
第二组 2 3 9 7 4 平均值=5 比较分散
第一组 R= 6-4 = 2,第二组 R= 9-2 = 7
*
*
(适用于未分组资料) (适用于分组资料)
3、计算方法
2、特点:
根据总体单位所有标志值来计算差异程度
以算术平均数为计算的标准
对离差取绝对值
简单平均差公式:
加权平均差公式:
(二)平 均 差Average Deviation
1、涵义:
是总体各单位标志值对算术平均数的
离差绝对值的算术平均数。
优点: 1.分析意义完整;
  2.反映各标志值差异。
缺点:不便于数学处理
*
*
甲乙两个班组工人日产量资料如下:
甲班工人日产量(件): 25 28 30 35 42
乙班工人日产量(件): 18 24 32 38 48
要求:比较两个班组工人平均日产量的代表性。
解:1、计算平均日产量
甲班:x =
n
∑x
=
5
160
=
5
160
= 32(件)
32(件)
甲班:
= 5.2 (件)
乙班:
A.D.= 8.8 (件)
例 题
2、平 均 差
∵甲班工人日产量的平均差小于乙班,
∴甲班工人平均日产量的代表性大于乙班。
乙班:x =
n
∑x
=
*
*
(三)标 准 差Standard Deviation
1、涵义:
2、计算方法:方差(Variance)的正根
简单标准差公式
加权标准差公式
(适用于未分组资料)
(适用于分组资料)
是总体中各单位标志值对算术平均
数离差平方的算术平均数的平方根
计算标准差的简化式

*
*
例 单项式资料(单位:元)
月工资x 员工数f Xf ∣X-X∣f (X-X) 2f x2f
800
1000
1200
1500
2000
2500 5
10
20
7
5
3 4000
10000
24000
10500
10000
7500 2600
3200
2400
1260
3400
3540 1352000
1024000
288000
226800
2312000
4177200 3200000
10000000
28800000
15750000
20000000
18750000
合计 50 66000 16400 9380000 96500000
(元)
*
*
例题:
根据资料计算工人的平均日产量和标准差:
工人平均日产量:
= 74.4 (件)
工人日产量标准差:
= 11 (件)
日产量 (x) 工人数(f)
55 10
65 24
75 36
85 22
95 8
合计 100
550
1560
2700
1870
760
-19
-9
1
11
21
3610
1944
36
2662
3528
11780
30250
101400
202500
158950
72200
565300
7440
按简化式计算:
σ
= 11(件)
*
*
例: 组距式资料(单位:元)
按工资分组(元) 工人数
(人) 组中值
x ∣x- ∣ ∣x- ∣f
x2f
600-700
700 -800
800 -900
900 -1000
1000 -1100 10
15
35
12
8 650
750
850
950
1050 191.25
91.25
8.75
108.75
208.75 1912.5
1368.75
306.25
1305
1670 4225000
8437500
25287500
10830000
8820000
合计 80 - - 6562.5 57600000
*
*
3、是非(交替)标志的标准差:
将总体单位划分为具有某种性质的单位和不具有某种性质的两部分,它们合并构成一个总体。能通过“是、非;有、无”的区分将总体单位划分为两部分的标志标志,称为是非(交替)标志。它在总体单位间交替出现,非此即彼。主要反映总体单位之间的性质属性上的差别。
统计上是通过(1,0)变量值的处理将其数量化。即用“1”代表具有某种性质的标志值, “0”代表不具有某种性质的标志值。
*
*
P =
N1
N
q =
N0
N
将总体中或数列中具有某种标志表现或某种性质的单位数N1占全部单位数N的比重(称为成数)用p表示,将不具有某种标志表现或某种性质的单位数N0占全部单位数N的比重用q表示:
N1 + N0=N p + q = 1
*
*
是非标志值
成数(权数)
标志值x权数
是 1
非 0 P (N1)
q (N0) P
0
合计 1 (N) P
是非标志的平均数
是非标志平均数计算表
*
*
是非标志的平均数就等于总体中或数列中具有某种性质的成数。因此,成数是一种特殊的平均数。
*
*
是非标志值
成数(权数)
是 1
非 0 P (N1)
q (N0)
合计 1 (N) -
是非标志的标准差
是非标志标准差计算表
*
*
所以是非标志标准差为:
*
*
是非标志的方差、标准差有极值:当
时取得最大值,方差最大值为0.25(或
25%),标准差最大值为0.5(或50%),
就是说,此时是非标志的变异程度最大。
*
*
比较下列的资料:甲地的职工平均工资
和标准差 2000元, 420元。
乙地的职工平均工资和标准差为
1200元, 276元。
比较两地平均工资的代表性及其均衡性。
不能由于乙地的标准差小于甲地,就得出乙
地平均工资代表性大于甲地的结论。这时要
用到离散系数来计算分析。
*
*
(四) 变 异(离散)系 数
Coefficient of Variance
标准差系数 V
σ
=
σ
X
1、涵义:用相对数形式反映各个变量值与其平均数
的离差程度,其数值表现为系数或百分数。主要用于
不同平均水平及不同性质的现象对比平均数代表性及其均衡性时,不能直接用全距、平均差、标准差来进行对比。
2、计算方法:消除不同平均水平的影响。求全距、平均差、标准差与算术平均数的比值。离散系数包括:全距系数、平均差系数 、标准差系数。使用最多的是标准差系数。
*
*
例题:
已知甲乙两个班组工人日产量资料如下:
甲 班 乙 班
日产量 工人数 日产量 工人数
(件) (人) (件) (人)
5 6 8 11
7 10 12 14
9 12 14 7
10 8 15 6
13 4 16 2
合计 40 合计 40
要求:比较一下哪个班组工人的平均日
产量的代表性高?
*
*
解题过程如下:
甲 班 乙 班
日产量
工人数
日产量
工人数
5 6 8 11
7 10 12 14
9 12 14 7
10 8 15 6
13 4 16 2
合 计 40 合 计 40
30
70
108
80
52
340
88
168
98
90
32
476
150
490
972
800
676
3088
704
2016
1372
1350
512
5954
*
*
甲班:
= 8.5(件)
乙班:
= 11.9(件)
甲班: σ = 2.22(件)
乙班: σ = 2.69(件)
1、计算工人平均日产量:
2、计算日产量的标准差:
3、计算变异系数:
甲班:
乙班:
∵乙班变异系数小于甲班 ∴乙班工人的平均日产量代表性高。
*
*
例:两种不同水稻品种,分别在5个田块上试种,其产量如下:
甲品种 乙品种
田块面积 总产量 田块面积 总产量
(亩) (公斤) (亩) (公斤)
1.2 600 1.5 840
1.1 495 1.4 770
1.0 445 1.2 540
0.9 540 1.0 520
0.8 420 0.9 450
*
*
要求:
⑴分别计算两品种的单位面积产量。
⑵计算两品种亩产量的标准差和标准差系数。
⑶假定生产条件相同,确定哪一品种具有较大稳定性,宜于推广。
*
*
*
*
*
*
因 V 乙 < V 甲
故乙品种具有较大稳定性,宜于推广。
*
*
简单介绍:偏度和峰度指标:
1、偏度:是指次数分布非对称的偏态方向程度。测定方法主要有两种:
(1)比较法:偏态=算术平均数-众数
数值大于零为右偏;小于零为左偏。
偏斜度(偏态系数):偏态/标准差
取值一般在-3到3之间,为零时表示对称分布,为-3或3表示极左偏态和极右偏态。
*
*
⑵动差法:偏斜度为:
  和比较法一样,取值在-3到3之间,意义也基本相同。就是计算更为复杂,精确度高。
*
*
2、峰度:是指次数分布曲线顶峰的尖平程度。常以正态分布曲线为标准来观察分布的顶端是尖是平以及尖平程度的大小。
  峰度有三种形态:以正态分布为标准峰度,比正态分布曲线更为隆起尖峭的称为尖顶分布,比正态分布曲线更为平缓的称为平顶分布。测定方法如下:
*
*
 当次数分布为正态分布曲线时,测定值为3,以此为标准,就可以比较各种次数分布曲线的尖平程度。
 测定值大于3,表示为尖顶曲线,说明变量值的次数较为密集的分布在众数周围,值越大于3,分布曲线的顶端越尖峭;
 测定值小于3,表示为平顶曲线,说明变量值的次数比较均匀的分散在众数两侧,值越小于3,分布曲线的顶峰就越平缓。
*
*
 另注意:当测定值接近于1 8时,分布曲线呈水平矩形分布状态,说明各组变量值的次数相同;当测定值小于1 8时,次数分布曲线呈“U”形分布状态。
 进行统计分析时,通常将偏度和峰度结合起来运用以判断变量数列的分布是否接近于正态分布。当偏度接近于0而峰度接近于3时,则可判断该分布与正态分布无显著差异。
*
*
本章结束
再见!

展开更多......

收起↑

资源预览