资源简介 (共43张PPT)应用统计学Applied Statistics第01章 绪论第02章 统计数据的收集第03章 统计数据的整理第04章 描述性统计第05章 抽样第06章 参数估计第07章 假设检验第08章 方差分析第09章 时间序列分析第10章 统计指数第11章 相关回归分析授课内容第四章 描述性统计第四章 描述性统计第四章 描述性统计第四章 描述性统计Practical Statistics理论部分第四章 描述性统计Practical Statistics 一组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据水平的代表值或中心值 不同类型的数据用不同的集中趋势测度关于集中趋势 一组数据中出现次数最多的变量值。 适合于数据量较多时使用 主要用于分类数据,也可用于顺序数据和数值型数据 不受极端值的影响 一组数据可能没有众数或有几个众数 排序后处于中间位置上的值 不受极端值的影响 主要用于顺序数据,也可用数值型数据,但不能用于分类数据。类型 年龄中位数年轻型 20岁以下成年型 20-30岁老年型 30岁以上 排序后处于前四分之一和后四分之一位置上的值 不受极端值的影响 主要用于顺序数据,也可用数值型数据,但不能用于分类数据。 也称为均值,是集中趋势最常用的测度值 易受极端值的影响 根据总体数据计算的,称为平均数,记为μ;根据样本数据计算的,称为样本平均数。 有简单平均数和加权平均数之分 简单平均数 加权平均数 几何平均数(Geomean)n 个变量值乘积的 n 次方根 适用于对比率数据的平均 主要用于计算平均增长率 [例]一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率 计算几何平均数 计算算术平均数分类数据顺序数据数值型数据第四章 描述性统计Practical Statistics第四章 描述性统计Practical Statistics 反映各变量值远离其中心值的程度(离散程度) 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值关于离散程度 非众数组的频数占总频数的比例。 对分类数据离散程度的测度 可用于衡量众数的代表性 上四分位数与下四分位数之差,也称为内距或四分间距。 对顺序数据离散程度的测度 反映了中间50%数据的离散程度 用于衡量中位数的代表性 极差:一组数据的最大值与最小值之差。 易受极端值影响 极差 平均差 方差和标准差 常用于质量控制5位评委的极差质控图 平均差:各变量值与其平均数离差绝对值的平均数。 极差 平均差 方差和标准差 方差:一组数与其算术平均数的离差平方平均数。 极差 平均差 方差和标准差 标准差:方差的平方根。 极差 平均差 方差和标准差 标准差与其相应的均值之比。 对数据相对离散程度的测度 消除了数据水平高低和计量单位的影响。 【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度。某管理局所属8家企业的产品销售数据 企业编号 产品销售额(万元) x1 销售利润(万元)x21 2 3 4 5 6 7 8 170 220 390 430 480 650 950 1000 8.112.518.022.026.540.064.069.0结论:计算结果表明, v1分类数据顺序数据数值型数据相对离散程度第四章 描述性统计Practical Statistics第四章 描述性统计Practical Statistics 数据分布偏斜程度的测度。左偏分布 数据分布偏斜程度的测度。右偏分布 数据分布扁平程度的测度。尖峰分布 数据分布扁平程度的测度。扁平分布左偏分布均值中位数众数对称分布均值=中位数=众数右偏分布众数中位数均值 描述统计的Excel应用 常用函数的应用 图形的绘制 数据库管理上机内容 展开更多...... 收起↑ 资源预览