4.3 离散程度的测度 课件(共31张PPT)-《统计学基础》同步教学(人民邮电版)

资源下载
  1. 二一教育资源

4.3 离散程度的测度 课件(共31张PPT)-《统计学基础》同步教学(人民邮电版)

资源简介

(共31张PPT)
任务四
数据特征的描述
4.1 总量与相对量的测度
任务四 数据特征的描述
学 习 目 标
4.2 集中趋势的测度
4.3 离散程度的测度
任务四
数据特征的描述
4.3 离散程度的测度
数据分布的特征和测度
分布的形状
集中趋势
离散程度
众 数
中位数
离散系数
方差和标准差
算术平均数
几何平均数
峰 度
偏 态
异众比率
四分位差
极差
任务四
数据特征的描述
4.3 离散程度的测度
学习要点
4.3.1 离散程度的含义
4.3.2 离散程度的度量方法
4.3.3 数据的标准化
4.3.4 离散指标的Excel操作
4.3.5 偏态与峰度
任务四
数据特征的描述
4.3 离散程度的测度
4.3.1 离散程度的含义
离散程度:各变量值远离其中心值的
程度,也称为离中趋势.
从另一个侧面说明了集中趋势测度值
的代表程度

中心值
任务四
数据特征的描述
4.3.1 离散程度的含义
任务四
数据特征的描述
离散程度测度值的作用
反映总体各单位变量值分布的均衡性
判断平均指标对总体各单位变量值代表性的高低
4.3.1 离散程度的含义
任务四
数据特征的描述
离散程度测度指标
异众比率
四分位差
离散系数
(标准差系数)
标准差
极差
4.3.2 离散程度的度量方法
任务四
数据特征的描述
4.3.2 离散程度的度量方法
任务四
数据特征的描述
平均差
用于衡量众数对一组数据的代表程度 。
是非众数组的频数之和占总频数的比重(%)。
【例4-20】随机抽选100名顾客,调查购买AI牌产品的地点。其中20人声称只去AI专卖店,70人说只去商场或超市,10人说专卖店和商场都去。如果认为购买AI牌产品的主要地点是商场或超市,则“商场或超市”就是众数。众数的代表性如何呢
“商场或超市”作为主要购物地点是有代表性的。
异众比率
1、异众比率
4.3.2 离散程度的度量方法
任务四
数据特征的描述
分位数:排序后处于25%、50%和75%位置上的值
反映了中位数对一组数据的代表程度。四分位差的意义是,
约有50%的数据应落在上四分位数和下四分位数之间。
的位置=
下四分位数
中位数
上四分位数
四分位差
的位置=
的位置=
2、四分位差
4.3.2 离散程度的度量方法
任务四
数据特征的描述
四分位数 (例子)


【例】:9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630
排 序 750 780 850 960 1080 1250 1500 1630 2000
位 置: 1 2 3 4 5 6 7 8 9
四分位差 =1565-815=750
5个数据落在区间内
4.3.2 离散程度的度量方法
任务四
数据特征的描述
是一组数据的最大值与最小值之差,
又称为全距,用“R”表示
离散程度的最简单测度值
易受极端值影响
3、极差
4.3.2 离散程度的度量方法
任务四
数据特征的描述
4、平均差
4.3.2 离散程度的度量方法
任务四
数据特征的描述
平均差与标准差的区别
◆是离散程度最常用的测度值。
◆根据全部数据计算,反映了各变量值
与其算术平均数的平均离差程度。
◆标准差是方差的平方根 ,有量纲单位,与变量
值的计量单位相同,其实际意义比方差清楚。
5、标准差
4.3.2 离散程度的度量方法
任务四
数据特征的描述
◆计算公式
总体标准差
未分组
数据
分 组
数 据
4.3.2 离散程度的度量方法
样本标准差
注意:样本的自由度是n-1。
标准差计算实例
例4-25:简单式
甲组营业员(5人)的销售量(件)为 :20、40、50、90、50
平均数:
标准差:
=25.5(件)
4.3.2 离散程度的度量方法
任务四
数据特征的描述
标准差计算实例
例4-26 :加权式
零件个数 (件) 天 数 (天) 组中值 (件)
270以下 270-290 290-310 310-330 330以上 15 25 35 65 40 260 280 300 320 340 3900 7000 10500 20800 13600 2500 900 100 100 900 37500
22500
3500
6500
36000
合计 180 — 55800 — 106000
表4-18 乙批发商上半年日销售量资料 单位:件
4.3.2 离散程度的度量方法
任务四
数据特征的描述
经验法则
假设一组数据呈对称分布,则:
约68.27%的数据在平均数±1个标准差的范围内
约95%的数据在平均数±1.96个标准差的范围内
约95.45%的数据在平均数±2个标准差的范围内
约99.73%的数据在平均数±3个标准差的范围内
4.3.2 离散程度的度量方法
任务四
数据特征的描述
是非变量的标准差
只表现为是与否、有或无的标志,称为是非变量,
也称为交替变量
是非变量用文字表示,在进行统计处理时,具有某
种属性的用“1”代表,不具有某种属性的用“0”代表。
假设总体有“ ”个单位,具有某种属性的有
“ ”个,不具有某种属性的有“ ”个,
则 。
4.3.2 离散程度的度量方法
任务四
数据特征的描述
是非变量的方差与标准差
总体
样本
比例的平均数
比例的方差
比例的标准差
比 例
=
4.3.2 离散程度的度量方法
任务四
数据特征的描述
『例』从一批产品中随机抽取100件产品进行质量测试,测试的结果为90件合格,10件不合格,试计算合格率的方差和标准差
解:
4.3.2 离散程度的度量方法
任务四
数据特征的描述
6、离散系数
◆是对数据相对离散程度的测度。
◆消除了数据水平高低和计量单位的影响。
◆用于对不同组别数据离散程度的比较。
◆一般计算标准差系数,公式为:
样本
总体
4.3.2 离散程度的度量方法
任务四
数据特征的描述
离散系数实例
身高 体重
平均数为123.10cm 平均数为22.29kg
标准差为4.71cm 标准差为2.26kg
问:是身高的差异大还是体重的差异大
例:某地7岁男童
结论:同一批儿童体重的差异更大
4.3.2 离散程度的度量方法
任务四
数据特征的描述
对某一个值在一组数据中相对位置的度量
可用于判断一组数据是否有离群点
用于对变量的标准化处理
计算公式为
总体
样本
4.3.3 数据的标准化
任务四
数据特征的描述
业务员编号 1 2 3 4 5 6 7
原始数据 标准化值 8500 0.7722 5400 -1.2223 9500 -1.4157 5100 -1.4157 6500 -0.5148 8500 0.7722 7600
0.1931
表4-19
=1554元
标准差
例:1号业务员的
工资标准化值为:
平均数
=7300元
任务四
数据特征的描述
4.3.3 数据的标准化
任务四
数据特征的描述
4.3.4 离散程度的Excel操作
利用Excel函数计算离散指标
利用Excel的“描述统计”功能
MAX(最大值)
MIN(最小值)
QUARTILE(四分位点)
STDEV(样本标准差)
VAR(样本标准差)
KURT(峰度系数)
SKEW(偏态系数)
工具 数据分析 描述统计
任务四
数据特征的描述
偏态及其测度
峰度及其测度
4.3.5 偏态与峰度
任务四
数据特征的描述
偏态及其测度
偏态( Skewness )是指频数分布的偏斜方向和程度 。
左偏分布
右偏分布
与标准正态分布比较!
4.3.5 偏态与峰度
任务四
数据特征的描述
偏态系数(Skewness coefficient)是测度频数分布偏斜程度的统计指标,用SK表示。
计算公式为:
即:SK=O,正态分布
SK>O,右偏分布
SK<O,左偏分布
4.3.5 偏态与峰度
任务四
数据特征的描述
扁平分布
尖峰分布
峰度及其测度
峰度:是指频数分布曲线顶端尖峭或扁平的程度。有时两组数据的算术平均数、标准差和偏态系数都相同,但其频数分布曲线顶端的高耸程度却不同。
4.3.5 偏态与峰度
任务四
数据特征的描述
峰度系数 (Coefficient of kurtosis )
峰度系数是测度频数分布曲线顶端尖峭或扁平程度的指标,用K表示。
计算公式为:
4.3.5 偏态与峰度
即:K=O,正态分布
K>O,尖峰分布
K<O,扁平分布
任务四
数据特征的描述
任务四 要点回顾

展开更多......

收起↑

资源预览