资源简介 (共85张PPT)**概念:反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平。特点:平均指标将总体内各单位的差异抽象化了。 平均指标是一个代表值,代表总体综合数量 特征的一般水平。一、平均指标的意义第三节平均指标**作用:1、反映总体各单位变量分布的集中趋势或集中程度;2、比较同类现象在不同单位的发展水平,用来说明生产水平、经济效益或工作质量的差距;3、分析现象之间的依存关系。应用平均指标的基本要求是:只能对同质总体计算平均指标。**二、平均指标的种类及其计算种类:按反映的时间状况不同按平均指标计算方法不同位置平均数算术平均数调和平均数几何平均数数值平均数众数中位数静态平均指标(本节讲述)动态平均指标(下章讲述)**(一)算 术 平 均 数(Arithmetic Mean)算术平均数1、算术平均数的基本公式总体标志总量总体单位总量=用此公式计算算术平均数,必须注意分子与分母之间存在的内在经济联系。即分子是分母所具有的标志值。注意强度相对指标和平均指标的区别:某企业职工月平均工资1200元/人月(平均指标);某城市的月人均收入为570元/人月(强度相对数).如:**区别主要表现在以下两点:(1)指标的含义不同。强度相对指标说明某一现象在另一现象中发展的强度、密度或普遍程度;而平均指标说明的是现象发展的一般水平。(2)计算方法不同。强度相对指标分子与分母的联系,只表现为一种经济关系,而平均指标是在一个同质总体内标志总量和单位总量的比例关系。分子与分母是内在的一一对应的联系,即分子是分母(总体单位)所具有的标志,对比结果是对总体各单位标志值的平均。**2、算术平均数 的计算形式(1)简单算术平均数:例如:已知5名工人的工资为:600元、780元、1050元、1100元、900元。根据资料计算五名工人的平均工资:解:设工人的工资为 “ ”, i= 1、2、3、4、5,则工人的平均工资为:(适用于未分组资料)**切尾均值72999097938182753去掉一个最高分…3号参赛选手的最终得分是86.33分。”简单算术平均数特点86.33受各变量值本身大小的影响不会超过变量值的变动范围受极端变量值的影响较明显**(2)加权算术平均数: 适用于分组资料。计算公式:公式中:“X” 代表各组变量值“f” 代表各组变量值出现的次数或频数“∑”为合计符号根据分组资料计算算术平均数,平均数的大小不仅受到各组变量值大小的影响,而且受到各个变量值出现次数多少的影响,因此需用下式计算其平均数:①**因为各组变量值出现次数的多少对平均数的形成产生权衡轻重的作用,所以将“f”称为权数。权数即可以表现为“次数”的形式,也可以表现为“比重”的形式。用“比重”权数计算算术平均数的公式为:计算公式:—— ②**A、根据单项式数列计算算术平均数例:某企业工人按日产量分组资料如下:要求:根据资料计算工人的平均日产量。日产量(件) 工人人数(人)(x) (f) (f/∑f)15 10 716 20 1317 30 2018 50 3319 40 27合计 150 100**A、根据单项式数列计算算术平均数解:按第一个公式计算按第二个公式计算:**B、根据组距数列计算算术平均数要求:根据资料计算全部职工的平均工资。例:某企业职工按工资分组资料如下:工 资 (元) 职工人数(人)x f f/∑f400 —500 50 16.7500 —600 70 23.3600 —700 120 40.0700 —800 60 20.0合 计 300 100**解:计算过程如下:工 资(元) 组中值x 职工人数 x f x(f/∑f)f f/∑f400—500500—600600—700700—800 450550650750 507012060 16.723.340.020.0 22500385007800045000 75.15128.15260.00150.00合 计 — 300 100 184000 613.33平均工资:根据组距数列计算算术平均数**两个班组工人生产资料如下:根据资料分别计算两个班组工人的平均日产量。一班 二班日产量 工人数 比重 日产量 工人数 比重(件) (人) (%) (件) (人) (%)20 2 10 20 1 521 1 5 21 1 522 15 75 22 1 523 1 5 23 1 524 1 5 24 16 80合计 20 100 合计 20 100C、权数在平均数形成中起的作用**计算得到:一班工人平均日产量二班工人平均日产量**D、权数的选择当分组的标志为相对数或平均数时,经常会遇到选择哪一个条件为权数的问题。如下例:要求:计算全部企业的平均计划完成程度。计划完成程度 企业数 计划产值(%) (个) (万元)80 — 90 5 5090 —100 10 80100 —110 120 200110 —120 30 70合 计 165 400**D、权数的选择选择权数的原则:1、变量与权数的乘积必须有实际经济意义。2、依据相对数或平均数本身的计算方法来选择权数。根据原则本题应选计划产值为权数,计算如下:平均计划完成程度:**(3)简单算术平均数与加权算术平均数的关系权数起作用必须有两个条件:一是:各组标志值必须有差异。如果各组标志值没有差异标志值成为常数,也就不存在权数了。二是:各组的次数或比重必须有差异。如果各组次数或比重没有差异,意味着各组权数相等,权数成为常数,则不能起到权衡轻重的作用,这时加权算术平均数就等于简单算术平均数。用公式表示二者的关系:当:**(4)算术平均数的数学性质:1、算术平均数与变量值个数的乘积等于各个变量值的总和。2、各个变量值与算术平均数的离差的总和为零。3、各个变量值与算术平均数的离差的平方之和为最小。**4、两个独立的同性质变量代数和的平均数等于各变量平均数的代数和;其乘积的平均数等于各变量平均数的乘积。5、各个变量值加或减一个任意数A,则算术平均数也增加或减少该数A6、各个变量值乘或除以一个任意数A,则算术平均数也乘或除以该数A**分数 人数f 组中值x xf Y=x-75 yf z=y/10 zf60以下 2 55 110 -20 -40 -2 -460—7070—8080—9090以上 1118136 65758595 71513501105570 -1001020 -1100130120 -1012 -1101312合计 50 — 3850 - 100 - 10利用平均数的性质作简化运算**优点:①容易理解, 便于计算②灵敏度高③稳定性好缺点:①易受极端值影响②在偏斜分布和U形分布中,不具代表性5、算术平均数的特点**调 和 平 均 数 的 计 算 方 法(1)简单调和平均数(2)加权调和平均数(二)调和平均数(Harmonic Mean )调和平均数是各个标志值倒数的算术平均数的倒数,所以又称倒数平均数。加权调和平均数作为加权算术平均数的变形使用,仍然依据算术平均数的基本公式计算。**调和平均数举例2.50 元/kg2.00元/kg1.00元/kg我各买1元的吃…**苹果价格及购买情况表求平均价格**体会含义并进行比较某种水产品早中晚价格各不相同,分别为3元/kg 、2元/kg和1元/kg(1)消费者早中晚各买一公斤时;(2)消费者早中晚各买一元时;请计算两种情况下,消费者购买这种水产品的平均价格(元/kg)加权算术平均加权调和平均**调和平均数举例苹果价格及购买情况表购买数量**某工业局下属各企业按产值计划完成程度分组资料如下,根据资料计算该工业局产值平均计划完成程度:计划完成程度 企业数 实际产值(%) (个) (万元)80 — 90 5 5090 —100 10 80100 —110 120 200110 —120 30 70合 计 165 400xxhm∑m∑=平均计划完成程度=400394= 101.52%例 题组中值 m(%) x x85 5995 84105 190115 61— 394m说明:该工业局实际比计划多完成6万元,超额1.52%完成产值计划任务。计划产值**某车间各班组工人劳动生产率和实际产量资料如下:班组 劳动生产率 实际产量(件 工时) (件)一 10 1000二 12 2400三 15 4500四 20 6000五 30 6000合计 — 19900例 题要求:计算五个班组工人的平均劳动生产率。xmmx1002003003002001100解:平均劳动生产率为:(总工时)**※ 当m=xf时:加权调和平均数公式就变成加权算术平均数公式结论是:调和平均与算术平均的计算只是由于资料不同而出现的差异,其经济含义完全一致.注意**优点:①灵敏度高②在某种不能计算算术平均数的条件下,可以用调和平均数代替 。缺点:①不易理解②易受极端值影响③有“0”值时不能计算调和平均数的特点**几何平均数:是另一种计算平均标志值的平均数。也可区分为简单几何平均数和加权几何平均数。简单几何平均数就是n个变量值(Xi)连乘积的n次方根。(三) 几何平均数(Geometric Mean)为了计算方便,通常利用对数进行计算:Log =(LogX1+LogX2+LogX3 +…+LogXn)/ n=(∑LogXi)/ n**车 间 产品合格率(%)Xi 合格率的对数(LogXi)铸造车间金加工车间电镀车间 95.095.893 1.97771.98141.9685合计 —— 5.9276例如:某企业生产一产品,要经过三个连续作业的车间,各车间的产品合格率如下表所示:试计算各车间产品的平均合格率。XG =√∏Xi = √95%×95.8% ×93% = 94.58%n3**Log XG =(∑LogXi)/ n = 5.9276/3 = 1.9758还可以按对数方法计算如下:所以,车间产品合格率为94.58%加权几何平均数:XG =√X1 X2 X3 … Xn = √∏Xi∑f∑ff3f1f2fnfi同样可以用对数计算:f1LogX1+f2LogX2+f3LogX3+ …+fnLogXn ∑fiLogXif1+f2+f3+ … +fn ∑fi=LogXG =**几何平均数的特点优点:①灵敏度高②受极端值的影响相对较小③对于等比或近似等比的数列几何平均数比算术平均数更具代表性。缺点:①不易理解②有“0”值时不能计算**数值平均数之间的关系:X≥XG≥XH以两个变量来证明:(a—b) = a — 2ab + b ≥0a + b — 2ab + 4ab ≥ 4ab(a+b) ≥4ab (a+b) ≥ 2 √ab(a+b)/ 2 ≥√ab,分别令 a=X1,b=X2 , 即得 X≥XG,代入 a=1/X1,b=1/X2,即可得 XG≥XH**(四) 众 数 (Mode)众数是现象总体中出现次数最多的标志值。它反映了现象的一种集中趋势众 数 的 确 定 方 法(1)由未分组数列及单项数列确定众数数列中出现次数最多的变量值就是众数。例如:十个同学的英语成绩:55 63 6570 78 78 78 82 87 91。则众数为78分。也有可能没有众数或有多个众数的情况。**鞋码 需求量(双)2222.52323.52424.525 1365001950215025001942822合计 10000某鞋厂某种鞋市场需求调查情况众数MO =24结论:根据定义确定单项式数列的众数单项式数列确定众数**(2)由组距数列确定众数步骤:①找出众数所在的组,即次数出现最多的一组的分组区间。即众数组可以直接观察确定。②根据下列的公式计算众数**计算公式其中:MO为众数,U、L分别为众数组上、下限,fm、fm-1、fm+1分别为众数组次数、众数组前一组次数及众数组后一组次数;d为组距**某班成绩分布表分数 人数f 组中值x xf60以下60-7070-80 √80-9090以上 21118 √136 5565758595 11071513501105570合计 50 — 3850组距数列确定众数(分)(分)**众数是一种位置平均数,不受各项变量值的影响,用它作为平均水平的代表值有不足之处,但当数列中出现异常变量值时,它不受极端值的影响,比平均数的代表性好。一般只适用于分布的次数较多且具有明显的集中趋势的总体。众数不一定存在 无众数存在时也不一定是唯一的只有一个众数的分布 单峰分布有两个众数的分布 双峰分布结论**MoMoMoMo**将总体中各单位的标志值按大小顺序排列,处于数列中点位置的标志值就是中位数。中 位 数 的 计 算 方 法(1)根据未分组资料计算中位数步骤:①将资料按大小顺序排列②计算中位数的位次:+ 12n③确定中位数(五) 中 位 数(Median)例:五(六)位同学的统计学成绩为 53 68 78 (82) 85 93,则中位数为 78,资料为奇数位时中位数即为中间位置的变量值;为偶数时中位数即为中间两个变量值的平均数 80。**拥有套数(套) 企业数(个) 向上累计 向下累计12345 354826124 3583 √109121125 12590 √42164合计 125 — —根据定义:中位数所在位置(1+125)/2=63中位数为 2 套例:某省所有工业企业生产流水线拥有情况:(2)根 据 单 项 数列计算中位数步骤:①计算数列的中间位置点:f+ 12∑②计算累计次数找出中位数所在的组③确定中位数**(3)根据组距数列计算中位数步骤:①计算数列的中间位置点:②计算累计次数,找出中位数所在的分组③用公式计算中位数2∑f**式中: L 表示中位数组的下限U 表示中位数组的上限fm 表示中位数所在组的次数Sm-1 表示中位数所在组以前各组的向上累计次数Sm+1 表示中位数所在组以后各组的向下累计次数∑f 表示总次数d 表示中位数所在组的组距。下限公式上限公式**分数 人数f 向上累计次数 向下累计次数60以下 2 2 5060—7070—80√80—9090以上 1118√136 1331√4450 4837√196合计50 — —例:某班成绩分布表注意:单位为(分)**位置平均数与算术平均数的关系(对称分布)正(右)偏态分布负(左)偏态分布XfXfXf**三种平均数的差别大小与偏斜程度的大小呈正比例。这是由于各自受极端值的影响不同。算术平均数受其影响最大;中位数只受其位置影响,不受其数值大小影响;众数都不受其影响。所以算术平均数或大于众数,或小于众数,中位数总位于两者之间。如上图。需要指出的是,有时中位数实际的数字并不在其他两者之间。**在偏斜适度(轻微)时,可用英国统计学家卡尔皮尔逊(Karl Pearson)提出的以下经验公式:算术平均数到众数的距离约等于算术平均数到中位数距离的三倍。**应用平均指标计算和分析社会经济现象应注意以下原则:①必须注意现象总体的同质性。消除不同质的“虚假平均数”。②要用组平均数来说明总平均数有些情况下,只计算总平均数不足以反映问题,要对总体内部进行分组,通过组平均数来补充。如下例:③要用分配数列来补充说明总平均数** 甲村乙村播种亩数总产量公斤平均亩产播种面积亩总产量公斤平均亩产山地501250025015045000300平地20012000060010065000650合计250132500530250110000440通过上例可以看出:从总平均数看甲村的总单产530公斤/亩,乙村440公斤/亩,结论是甲村的粮食亩产比乙村高。但从组平均数看,不论是山地还是平地的亩产量,都是乙村好于甲村。**第四节 标志变异指标 一、标志变异指标的意义1、概念:变异指标又称标志变动度,综合反映总体各个单位标志值差异的程度。2、作用:标志变异指标在统计分析研究中的作用主要有如下几方面:(1)变异指标反映总体各单位标志值分布的离中趋势。总体各单位的标志值围绕平均指标上下波动。所以平均指标反映总体各单位标志值的集中趋势。而变异指标则表明总体各单位标志值的分散程度,对于变动中心来说,也就是反映标志值的离中趋势。**(2)变异指标可以说明平均指标的代表程度。平均指标作为总体各单位标志值一般水平的代表,其代表性的高低,随着标志值的差异程度不同而有很大区别。(3)变异指标说明现象变动的均衡性或稳定性。现象活动过程的稳定性和均衡性,可以从每一时期的工作和整个时期中的平均工作量的关系上反映,如果每一时期的工作量与平均工作量大体相等,则现象活动过程、是均衡的、稳定的。**二、变异指标的种类及计算方法(一)全距Range :最大变量值与最小变量值之差,它说明标志值的变动范围.用R表示优点:计算简便、易懂、意义明确缺点:受极端值影响较大;不能全面反映各单 位标志值的变异情况全距平均差标准差变异系数第一组 5 5 6 4 5 平均值=5 比较集中第二组 2 3 9 7 4 平均值=5 比较分散第一组 R= 6-4 = 2,第二组 R= 9-2 = 7**(适用于未分组资料) (适用于分组资料)3、计算方法2、特点:根据总体单位所有标志值来计算差异程度以算术平均数为计算的标准对离差取绝对值简单平均差公式:加权平均差公式:(二)平 均 差Average Deviation1、涵义:是总体各单位标志值对算术平均数的离差绝对值的算术平均数。优点: 1.分析意义完整; 2.反映各标志值差异。缺点:不便于数学处理**甲乙两个班组工人日产量资料如下:甲班工人日产量(件): 25 28 30 35 42乙班工人日产量(件): 18 24 32 38 48要求:比较两个班组工人平均日产量的代表性。解:1、计算平均日产量甲班:x =n∑x=5160=5160= 32(件)32(件)甲班:= 5.2 (件)乙班:A.D.= 8.8 (件)例 题2、平 均 差∵甲班工人日产量的平均差小于乙班,∴甲班工人平均日产量的代表性大于乙班。乙班:x =n∑x=**(三)标 准 差Standard Deviation1、涵义:2、计算方法:方差(Variance)的正根简单标准差公式加权标准差公式(适用于未分组资料)(适用于分组资料)是总体中各单位标志值对算术平均数离差平方的算术平均数的平方根计算标准差的简化式或**例 单项式资料(单位:元)月工资x 员工数f Xf ∣X-X∣f (X-X) 2f x2f80010001200150020002500 51020753 4000100002400010500100007500 260032002400126034003540 1352000102400028800022680023120004177200 32000001000000028800000157500002000000018750000合计 50 66000 16400 9380000 96500000(元)**例题:根据资料计算工人的平均日产量和标准差:工人平均日产量:= 74.4 (件)工人日产量标准差:= 11 (件)日产量 (x) 工人数(f)55 1065 2475 3685 2295 8合计 100550156027001870760-19-9111213610194436266235281178030250101400202500158950722005653007440按简化式计算:σ= 11(件)**例: 组距式资料(单位:元)按工资分组(元) 工人数(人) 组中值x ∣x- ∣ ∣x- ∣fx2f600-700700 -800800 -900900 -10001000 -1100 101535128 6507508509501050 191.2591.258.75108.75208.75 1912.51368.75306.2513051670 4225000843750025287500108300008820000合计 80 - - 6562.5 57600000**3、是非(交替)标志的标准差:将总体单位划分为具有某种性质的单位和不具有某种性质的两部分,它们合并构成一个总体。能通过“是、非;有、无”的区分将总体单位划分为两部分的标志标志,称为是非(交替)标志。它在总体单位间交替出现,非此即彼。主要反映总体单位之间的性质属性上的差别。统计上是通过(1,0)变量值的处理将其数量化。即用“1”代表具有某种性质的标志值, “0”代表不具有某种性质的标志值。**P =N1Nq =N0N将总体中或数列中具有某种标志表现或某种性质的单位数N1占全部单位数N的比重(称为成数)用p表示,将不具有某种标志表现或某种性质的单位数N0占全部单位数N的比重用q表示:N1 + N0=N p + q = 1**是非标志值成数(权数)标志值x权数是 1非 0 P (N1)q (N0) P0合计 1 (N) P是非标志的平均数是非标志平均数计算表**是非标志的平均数就等于总体中或数列中具有某种性质的成数。因此,成数是一种特殊的平均数。**是非标志值成数(权数)是 1非 0 P (N1)q (N0)合计 1 (N) -是非标志的标准差是非标志标准差计算表**所以是非标志标准差为:**是非标志的方差、标准差有极值:当时取得最大值,方差最大值为0.25(或25%),标准差最大值为0.5(或50%),就是说,此时是非标志的变异程度最大。**比较下列的资料:甲地的职工平均工资和标准差 2000元, 420元。乙地的职工平均工资和标准差为1200元, 276元。比较两地平均工资的代表性及其均衡性。不能由于乙地的标准差小于甲地,就得出乙地平均工资代表性大于甲地的结论。这时要用到离散系数来计算分析。**(四) 变 异(离散)系 数Coefficient of Variance标准差系数 Vσ=σX1、涵义:用相对数形式反映各个变量值与其平均数的离差程度,其数值表现为系数或百分数。主要用于不同平均水平及不同性质的现象对比平均数代表性及其均衡性时,不能直接用全距、平均差、标准差来进行对比。2、计算方法:消除不同平均水平的影响。求全距、平均差、标准差与算术平均数的比值。离散系数包括:全距系数、平均差系数 、标准差系数。使用最多的是标准差系数。**例题:已知甲乙两个班组工人日产量资料如下:甲 班 乙 班日产量 工人数 日产量 工人数(件) (人) (件) (人)5 6 8 117 10 12 149 12 14 710 8 15 613 4 16 2合计 40 合计 40要求:比较一下哪个班组工人的平均日产量的代表性高?**解题过程如下:甲 班 乙 班日产量工人数日产量工人数5 6 8 117 10 12 149 12 14 710 8 15 613 4 16 2合 计 40 合 计 40307010880523408816898903247615049097280067630887042016137213505125954**甲班:= 8.5(件)乙班:= 11.9(件)甲班: σ = 2.22(件)乙班: σ = 2.69(件)1、计算工人平均日产量:2、计算日产量的标准差:3、计算变异系数:甲班:乙班:∵乙班变异系数小于甲班 ∴乙班工人的平均日产量代表性高。**例:两种不同水稻品种,分别在5个田块上试种,其产量如下:甲品种 乙品种田块面积 总产量 田块面积 总产量(亩) (公斤) (亩) (公斤)1.2 600 1.5 8401.1 495 1.4 7701.0 445 1.2 5400.9 540 1.0 5200.8 420 0.9 450**要求:⑴分别计算两品种的单位面积产量。⑵计算两品种亩产量的标准差和标准差系数。⑶假定生产条件相同,确定哪一品种具有较大稳定性,宜于推广。******因 V 乙 < V 甲故乙品种具有较大稳定性,宜于推广。**简单介绍:偏度和峰度指标:1、偏度:是指次数分布非对称的偏态方向程度。测定方法主要有两种:(1)比较法:偏态=算术平均数-众数数值大于零为右偏;小于零为左偏。偏斜度(偏态系数):偏态/标准差取值一般在-3到3之间,为零时表示对称分布,为-3或3表示极左偏态和极右偏态。**⑵动差法:偏斜度为: 和比较法一样,取值在-3到3之间,意义也基本相同。就是计算更为复杂,精确度高。**2、峰度:是指次数分布曲线顶峰的尖平程度。常以正态分布曲线为标准来观察分布的顶端是尖是平以及尖平程度的大小。 峰度有三种形态:以正态分布为标准峰度,比正态分布曲线更为隆起尖峭的称为尖顶分布,比正态分布曲线更为平缓的称为平顶分布。测定方法如下:** 当次数分布为正态分布曲线时,测定值为3,以此为标准,就可以比较各种次数分布曲线的尖平程度。 测定值大于3,表示为尖顶曲线,说明变量值的次数较为密集的分布在众数周围,值越大于3,分布曲线的顶端越尖峭; 测定值小于3,表示为平顶曲线,说明变量值的次数比较均匀的分散在众数两侧,值越小于3,分布曲线的顶峰就越平缓。** 另注意:当测定值接近于1 8时,分布曲线呈水平矩形分布状态,说明各组变量值的次数相同;当测定值小于1 8时,次数分布曲线呈“U”形分布状态。 进行统计分析时,通常将偏度和峰度结合起来运用以判断变量数列的分布是否接近于正态分布。当偏度接近于0而峰度接近于3时,则可判断该分布与正态分布无显著差异。**本章结束再见! 展开更多...... 收起↑ 资源预览