资源简介 项目四 统计数据的描述 目录 CONTENTS 1 离散趋势分析 2 偏态和峰态 3 Excel 在统计描述中的应用 学习目标 · 理解平均数、中位数和众数三者之间的关系; · 掌握统计数据集中程度指标的概念和计算方法; · 掌握表示离散程度的各种指标的概念和计算方法,重点理解标准差; 01 02 03 04 05 · 了解分布偏斜程度的指标及其图形; · 学会运用 Excel 进行各种指标的计算。 项目导航 统计数据的描述 统一数据集中程度指标 离散趋势分析 偏态和峰态 平均指标的种类 标志变异指标的概念和作用 极差 四分位差 平均差 方差与标准差 偏态 峰态 计算算数平均数 计算几何平均数 计算调和平均数 变异系数的异众比率 Excel在统计描述中的作用 平均指标的概念和作用 计算众数 计算中位数 计算方差和标准差 案例导入 在正常的市场经济环境下,投资的高收益总是伴随着高风险的。所以,投资理财专家总是提醒人们不仅要看到收益率的高低,还要注意到风险的大小。投资人在做出投资决策时,理解这一点是极其必要的。具有不同风险承受能力的投资人往往有不同的投资决策。 一研究者为了比较不同类型投资基金的收益率水平并说明收益率高低与风险大小的关系,收集了 30 只投资基金某年的收益率数据,其中偏债券型投资基金 8 只,中间型投资基金和偏股票型投资基金各 11 只。它们的收益率数据如表 4-1 所示。 投资的收益与风险并存 思考与讨论 {2D5ABB26-0587-4C30-8999-92F81FD0307C}偏债券型投资基金的收益率/ % 中间型投资基金的收益率/ % 偏股票型投资基金的收益率/ % 6.3 10.8 13.9 6.0 6.9 18.7 5.2 9.8 5.1 8.1 7.2 -1.8 7.5 11.5 9.6 3.9 2.3 8.4 4.8 4.1 7.6 5.9 8.7 12.0 7.4 10.5 7.3 14.3 8.1 11.4 (1)如何比较三种类型投资基金的收益率高低? (2)各种类型投资基金的风险大小如何度量? (3)哪一类投资基金的收益率波动较大? (4)对于一个稳健型投资者,应建议其购买哪一类投资基金? 为什么? 02 模块二 离散趋势分析 前言 · 集中趋势是各变量值向其中心值聚集的程度,在反映统计数据一般水平的同时,掩盖了图 4-3 均值相同,离散程度不同总体各单位标志值的数量差异。因此,要分析数据总体的分布规律,仅知道集中趋势指标是不够的,还要知道数据的离散程度或差异状况。 · 数据的离散趋势分析主要是用来反映数据之间的差异程度的,离散趋势指标值越大,说明数据内部变异程度越大。 一、标志变异指标的概念和作用 (一)标志变异指标的概念 标志变异指标是反映总体各单位标志值差异程度的综合指标,它表明总体各单位标志值的离散程度和离中趋势,又称为标志变动度或离散指标。 标志变异指标和平均指标是一对相互联系的对应指标,它们从两个不同的侧面反映同质总体的共同特征。 标志变异指标表明总体各单位标志值的差异程度大小,说明变量值的离中趋势;平均指标表明总体各单位标志值的一般水平,说明变量数列中变量值的集中趋势。 标志变异指标和平均指标 综合指标 一、标志变异指标的概念和作用 (二)标志变异指标的作用 (1)标志变异指标是衡量平均数代表性的尺度。平均数是个代表值,其代表性取决于总体各单位标志值的差异程度。 (2)标志变异指标可以用来研究现象发展变化的均衡性和协调性。 常用的标志变异指标有极差(range )、四分位差( quartiledeviation )、平均差、方差和标准差以及变异系数等,最常用的指标是标准差。 二、极差 极差也称全距,是一组数据的最大值与最小值之差,通常记为 R : R =max { x i } -min { x i } (4-12 )式中, max { x i }和 min { x i }分别为数据 x i 中的最大值和最小值。 显然,一组数据的差异越大,其极差也越大,它是数据离散或差异程度最简单的测度值。 极差是最简单的变异指标,它被广泛应用于产品质量管理中,以控制质量的差异,一旦发现某一质量指标超过控制范围,就得采取措施进行纠正,以保证产品质量的稳定。 三、四分位差 四分位差也称中点分布,是一组数据 75% 位置上的四分位数和 25% 位置上的四分位数的差,也就是上四分位数和下四分位数的差,记为 Q ,其计算公式为 Q = QU - QL 四分位差反映了中间 50% 数据的离散程度,其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。四分位差测量的是中间 50% 数据的离散趋势,没有考虑比Q L 小和比 Q U 大的数,不受极端值的影响。四分位差的大小在一定程度上说明了中位数对一组数据的代表程度。 四、平均差 如果考虑每个数据 xi 与其平均数 x 之间的差异,以此作为一组数据差异水平的度量,结果就要比极差和四分位差更加全面和准确。这就需要求出每个数据 xi 与其平均数 x 离差的平均数。但由于????=1????(?????????????)=0 ,因此需要进行一定的处理。其中一种方法是将离差取绝对值,求和后再平均,其结果称为平均差。 ? 平均差是总体各单位标志值同其算术平均值的绝对离差的算术平均数,它能综合反映总体各单位标志值的变动程度,用 A · D 表示。 四、平均差 (一)简单平均差 当拥有的资料未分组时,采用简单平均差公式计算: 【例 4-13 】 某车间有甲、乙两个生产小组,每组 6 个工人,日产量资料如表 4-8所示。请根据表 4-8 计算两个生产小组日产量的平均差,并用平均差判定平均数的代表性。 {2D5ABB26-0587-4C30-8999-92F81FD0307C}组 别 日产量/件 甲 20 40 60 80 100 120 乙 67 68 69 70 71 72 四、平均差 (一)简单平均差 因为(A · D ) 乙 < ( A · D ) 甲 ,所以乙组的平均日产量比甲组的平均日产量更具有代表性。 四、平均差 (二)加权平均差 当拥有的资料已被分组时,采用加权平均差公式计算: 【例 4-14 】 A 班 40 名学生的平均身高为 171 厘米,平均差为 8.5厘米;B 班学生身高资料如表 4-9 所示,比较两个班学生平均身高的代表性。 {2D5ABB26-0587-4C30-8999-92F81FD0307C}身高/厘米 组中值 x /厘米 人数 f /人 x - x? |x - x?|f 150~160 155 5 -16 80 160~170 165 11 -6 66 170~180 175 19 4 76 180~190 185 5 14 70 40 292 四、平均差 (二)加权平均差 A 、 B 两班学生的平均身高相同,均为 171cm ,但( A · D ) A > ( A · D ) B ,所以 B 班学生的平均身高 x B 比 A 班学生的平均身高 x A 更具有代表性。 四、平均差 (二)加权平均差 · 平均差是各标志值对平均数的平均距离:平均差越大,标志变动度越大,平均数的代表性越差;平均差越小,标志变动度越小,平均数的代表性越强。平均差较适用于某些质量检查工作,如纺织厂对棉纤维的长度检查。但是,由于平均差是通过取绝对值来消除离差正负号的,这与统计上的数字处理规则不合,有碍于用它来做进一步的统计分析,因此在实际应用中受到很大的限制。 五、方差和标准差 方差和标准差是应用最广泛的变异指标。方差是总体各单位标志值与其算术平均数的离差平方的算术平均值,通常用σ?2 表示。标准差为方差的算术平方根,所以标准差又称为均方差,通常用 σ 表示。 ? 由于方差带有与数据相同的计量单位和量纲,而且其计量单位为数据的平方倍,因此,方差不便于从经济意义上对计算结果进行解释。 五、方差和标准差 1. 简单算术平均形式 当拥有的资料未分组时,采用简单算术平均形式来计算方差和标准差,计算公式为 五、方差和标准差 2. 加权算术平均形式 当拥有的资料已被分组时,采用加权算术平均形式来计算方差和标准差,计算公式为 式中,n 为样本容量; x i 为样本观测值; x 为样本均值; f i 为分组数据各组的频数。 六、变异系数和异众比率 (一)变异系数 【例 4-17 】 两组同学的成绩分别用 5 分制和 100 分制打分,其数值为 第一组(5 分制): 1 , 2 , 3 , 4 , 5 。 第二组(100 分制): 80 , 81 , 82 , 83 , 84 。 试判断两组数据的离散程度。 解:第一组数据的平均数为 ????1??=3 ,第二组数据的平均数为 ????2??=82 。 第一组的标准差为 ? 第二组的标准差为 六、变异系数和异众比率 (一)变异系数 从这两组数据来看,两组数据的平均数不等,标准差相等,但两组的数据离散程度显然不一样,用标准差来判断两组数据的离散程度大小是不正确的。 当需要比较不同总体的离散程度时,因性质不同、使用的度量单位不同(如体重和身高)或它们的数量级相差很大(如大象和蜜蜂),用绝对值表示的标准差就缺乏可比性。 六、变异系数和异众比率 (一)变异系数 变异系数也称离散系数或标准差系数,是标准差除以平均数的比值,通常表示为 V σ ,计算公式为 式中,σ 为标准差; x ?为算术平均数。 六、变异系数和异众比率 (一)变异系数 变异系数也称离散系数或标准差系数,是标准差除以平均数的比值,通常表示为 V σ ,计算公式为 式中,σ 为标准差; x ?为算术平均数。 六、变异系数和异众比率 (二)异众比率 · 以上的变异指标均只适用于定量数据,对于定性数据,可以通过计算异众比率来衡量集中趋势值众数的代表性。异众比率是指非众数值的次数之和在总次数中所占的比重,若用V mo 表示异众比率, f i 和 f m 分别表示众数所在组的次数和总次数,则异众比率的计算公式为 展开更多...... 收起↑ 资源预览