第4章 统计数据分布特征的描述 课件(共39张PPT)-《统计学基础》同步教学(东北财大版)

资源下载
  1. 二一教育资源

第4章 统计数据分布特征的描述 课件(共39张PPT)-《统计学基础》同步教学(东北财大版)

资源简介

(共39张PPT)
第4章 统计数据分布特征的描述
学习目标
明确统计数据分布特征的描述方法,包括:集中趋势、离散程度、偏态及峰度的测度。
4.1 分布的集中趋势
4.1.1 位置平均数
众数和分位数(中位数、四分位数)
1)众数
众数是位置平均数,不受极端值的影响
一组数据可能没有众数或有几个众数;(无众数、复众数、单众数)
缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不象数值平均数那样利用了全部数据信息
(1)未分组数据或单项式分组的众数
例:在某城市中随机抽取9个家庭,调查得到每 个家庭的人均月收入数据如下(单位:元),计算人均月收入的众数。
1780 1850 1780 1780 2850 1960 2000 1250 1630
思考:1、定性数据是否可以确定众数?
2、对于组距式分组的数值型数据,如何确定众数?
(2)组距式分组的众数
例:某会计师事务所审计时间频数分布表
解:由表可知,频数最大为8,所以众数在15~19 这一组,
于是L=15,U=19,i=4,Δ1=8-4=4,Δ2=8-5=3,则
2)中位数
(1)未分组数据或单项式分组的中位数
①变量值的个数为奇数
例:1,2,3,4,5,6,7的中位数
②变量值的个数为偶数
例:1,6,3,2,8,4,5,7的中位数
(2)组距式分组的中位数
例:某行业上市公司2015年每股净利润增长率资料如表所示,计算每股净利润增长率的中位数。
3)四分位数
思考:定性数据是否可以确定中位数和四分位数?
4.1.2 计算平均数
算术平均数、调和平均数、几何平均数、切尾均值
1)算术平均数
(1)简单算术平均数
例:某班组5名工人的月工资(元)分别为:1500、1860、2020、1740、1530,计算平均月工资。
(2)加权算术平均数
基本公式
影响加权算术平均数的因素:变量值和权数
选择权数的原则:变量值与其乘积是具有实际经济意义的标志总量。
加权算术平均数与简单算术平均数的关系:
当 时,
例:计算某车间工人月食品平均支出(单项式)
某班组工人平均支出的计算(单项式数列)
解:
支出(x) 工人数(f) 支出总额(xf)
800 2 1600
950 4 3800
1100 8 8800
1500 5 7500
2000 1 2000
合计 20 23700
(元)
例:计算某班组20名工人的平均奖金(组距式数列)
解:
权数对均值的影响
甲乙两组各有10名学生,他们的考试成绩及其分布数据如下
甲组: 考试成绩(x ): 0 20 100
人数分布(f ): 1 1 8
乙组: 考试成绩(x): 0 20 100
人数分布(f ): 8 1 1
2)调和平均数
(1)简单调和平均数
例:某农贸市场上白菜的价格是早晨1.50元/千克,中午1.25元/千克,晚上1.00元/千克。若早、中、晚各买1元钱的白菜,问所购买白菜的平均价格是多少?
(2)加权调和平均数
思考 :某农贸市场上白菜的价格是早晨1.50元/千克,中午1.25元/千克,晚上1.00元/千克。若早、中、晚各买1斤的白菜,问所购买白菜的平均价格是多少?
某日三种蔬菜的批发成交数据 蔬菜 名称 批发价格(元) x 成交额(元) M 成交量(公斤)
f
甲 乙 丙 1.20 0.50 0.80 18000 12500 6400 15000
25000
8000
合计 — 36900 48000
例:某蔬菜批发市场三种蔬菜的日成交数据如表,计算三种蔬菜该日的平均批发价格
练习1:某管理局所属的15个企业,2000年按其生产某产品平均单位成本的高低分组资料如下,试计算平均单位成本。
按平均单位成本分组 (元/件) 企业数 (个) 各组产量在总产量中所占的比重(%)
10~12 12~14 14~18 2 7 6 22
40
38
合计 15 100
试指出那个厂的总平均成本高,其原因何在?
品种 单位成本 (元) 总成本 一厂 二厂
甲 乙 丙 15 20 30 2100 3000 1500 3225
1500
1500
练习2:有两个工厂生产三种产品的单位成本和总成本资料如下:
练习3:计算某地区工业企业产值平均计划完成程度
计划完成% 企业数(个) 计划产值(万元)
90以下 7 140
90——100 22 310
100——110 57 1650
110——120 26 710
120以上 3 40
合计 115 2850
平均数计算方法的选择
(已知m、f)
(已知x、f)
(已知x、m)
原来只是计算时使用了不同的数据!
x
m
m
x
f
xf
x
f
m
x
S
S
=
S
S
=
S
S
=
3)几何平均数
(1)简单几何平均数
例:某企业产量逐年提高,2008年是2007年的108%,2009年比2008年增长10%,2010年是2009年的1.5倍。求平均发展速度。
(2)加权几何平均数
例:某银行某项10年期贷款利率按复利计算。该银行规定前两年利率为3%,第3年至第5年利率为5%,第6年至第10年利率为8%。求平均年利率。
4)切尾平均数(切尾均值)
例:某地方公务员面试共有9名考官,面试中考官给予某位考生的成绩分别为85分、76分、87分、73分、90分、95分、93分、91分和95分。要求:试用切尾均值计算这位考生的面试成绩。
解:观察原始面试成绩发现73分和95分为离群值,于是根据切尾均值的定义有:
(85+76+87+90+93+91+95)÷7=88.14(分)
4.1.3 众数、中位数和均值的关系
如果变量值分布呈对称型,则算术平均数、中位数和众数三者相等;
若不对称,则中位数必居中,算术平均数和众数分列两侧。
右偏 左偏
4.2 分布的离散程度
极差、方差和标准差、离散系数
衡量平均数代表性的大小
反映社会经活动过程的均衡性和节奏性
量度产品的稳定性
思考:有两个小组工人每月食品支出资料如下:
甲:500 600 700 800 900
乙:600 650 700 750 800
哪一组工人工资平均数的代表性大?
4.2.1 极差
极差(R)=最大标志值-最小标志值(原始数据)
R=最高组上限值-最低组下限值(组距数列)
4.2.2 平均差
例:某连锁超市A城市50家门店月销售额
解:
=8.552(万元)
4.2.3 方差和标准差
1)根据未分组资料计算方差和标准差
总体方差
总体标准差
样本方差
样本标准差
2)根据分组资料计算方差和标准差
总体方差
总体标准差
样本方差
样本标准差



例:某企业工人日加工零件数如下表,
计算工人日加工零件的标准差
按零件数分组(个)
组中值(X)
人数
(f)
105—110
110—115
115—120
120—125
125—130
130—135
135—140
107.5
112.5
117.5
122.5
127.5
132.5
137.5
3
5
8
14
10
6
4
246.49
114.49
32.49
0.49
18.49
86.49
204.49
739.47
572.45
259.92
6.86
184.90
518.94
817.96
合计

50

3100.5
解:
4.2.4 变异系数
消除了数据水平高低和计量单位的影响
例:甲、乙两商店营业员及销售额的分组资料如下:
甲商店 乙商店 组中值x 人数f xf 组中值x 人数f xf
25 35 45 55 65 3 12 9 6 —— 75 420 405 330 —— 768 432 144 1176 —— 25 35 45 55 65 —— 2 8 6 4 —— 70 360 330 260 ——
512
288
96
784
合计 30 1230 2520 合计 20 1020 1680
试问两个商店营业员平均销售额的代表性哪个大?
为什么
解:
4.3 分布的偏态与峰度
4.3.1 偏态及其测定(偏态系数)
未分组
已分组
SK=0 正态分布或对称
SK>0 正偏或右偏
SK<0 负偏或左偏
SK的绝对值越大,表示偏斜的程度就越大。
4.3.2 峰度及其测定(峰度系数)
未分组
已分组
K=0 标准正态分布
K<0 平坦峰,说明频数分布离散度高
K>0 尖态峰,说明频数分布集中趋势显著
4.4 Excel描述分析
数据分布特征的各种描述性统计指标,其中多数可以通过Excel的统计函数【数据分析】工具中的【描述统计】命令得出计算结果。
上机实践
本章小结
1、集中趋势的描述:算术平均数、调和平均数、几何平均数、众数、中位数
2、离散程度的描述 :极差、平均差、方差与标准差以及变异系数的计算方法和应用
3、数据分布形态的描述:偏态系数、峰度系数
4、Excel在统计数据描述分析中的运用方法
THANKS

展开更多......

收起↑

资源预览