资源简介 (共23张PPT)管 理 统 计 学[第四版]第二章 数据的收集和整理案例导入为盘活当地农村经济,帮助农民成功脱贫,某市于2009年实施农村金融改革。该市某大学一只暑期社会实践队伍为了解此项金融改革的实施效果,决定对当地农民的融资需求变化进行调研。在商讨调研方案的实施过程中:A同学:我们应该先整理所有实施金融改革的农村名单,再进行抽样调查;B同学:我们应该对当地农民的受众比例、贷款数量、还款情况等设计问卷进行问卷调查;C同学:我们还应该找当地实施这项金融改革进行深度访谈,了解金融改革实施中遇到的困难和解决方法的成效。三位同学对于调研方案提出的意见是否科学?应如何针对调研的目的设计调研问卷?又如何对收集到的数据进行整理分析?通过本章的学习,你将对数据的收集和整理工作有初步的认识。学习目标本章学习数据的收集和汇总方法。重点要掌握统计调查的内容、数据汇总的步骤和简单统计分析的要点等2.1 数据的收集2.1.1 数据来源渠道统计的来源(1)原始数据,或称为第一手数据或直接数据,来源于直接的调查或试验(2)二手数据,或第二手数据或间接数据,来源于其他人调查或试验的数据数据来源渠道(1)专门组织的调查,是取得社会经济数据的重要渠道(2)科学试验,是取得自然科学数据的主要渠道专门组织调查常用调查方式专门调查中常用调查方式有普查、抽样调查、统计报表等。其中抽样调查是我国目前最常用的调查方式2.1 数据的收集2.1.2 普查和抽样调查普查是为某一特定目的而专门组织的一次性全面调查,如人口普查、工业普查、农业普查等。普查是适合于特定目的、特定对象的一种调查方法,它主要用于搜集处于某一时点状态上的社会经济现象的数量,目的是掌握特定社会经济现象的基本全貌,为国家制定有关政策或措施提供依据。普查的特点(1)一次性的或周期性(2)需要规定统一的标准调查时间(3)一般比较准确,规范化程度也较高(4)普查的适用的对象比较狭窄2.1 数据的收集2.1.2 普查和抽样调查抽样调查是实际中应用最广泛的一种调查方法,这里指的是概率抽样,它是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查方法抽样调查的特点(1)经济性(2)时效性高(3)适应面广(4)准确性高2.1 数据的收集2.1.3 调查方案调查方案是指导整个调查过程的纲领性文献,其内容包括调查目的、调查对象和调查单位、调查项目和调查表等内容(1)调查目的。调查目的是调查所要达到的具体目标,它所回答的是“为什么调查,要解决什么样的问题”。(2)调查对象和调查单位。调查对象就是总体,调查单位就是个体。调查对象和调查单位所解决的是“向谁调查,由谁提供所需数据的问题”。(3)调查项目和调查表调查项目就是变量,这里所要回答的是“调查什么”的问题。在大多数统计调查中,调查项目通常以表格的形式来表现,称为调查表,它是用于登记调查数据的—种表格,一般由表头(名称)、表体(项目)和表外附加(填表人等)三部分组成。(4)其他内容。调查方案中还应明确调查所采用方法、调查时间、调查组织和实施的具体细则。2.1 数据的收集2.1.4 收集数据的方法收集数据的方法(1)访问调查(2)邮寄调查(3)电话调查(4)座谈会2.1 数据的收集2.1.4 收集数据的方法尊敬的客户朋友:您好!感谢您选择长城饭店,为了向您提供更优质的就餐服务,不断提高我们的服务质量和服务水平,请您在百忙之中填写此问卷,您的意见和建议将是我们不断努力的源泉。谢谢您的支持!服务员姓名或服务号极好 好 满意 不满意食物品质 口 口 口 □服务态度 口 口 口 口服务速度 口 口 口 口清洁程度 口 口 口 口管理意见 口 口 口 口其他意见和建议请投入门口的建议箱内。谢谢!图2-1 长城饭店调查问卷2.2 数据汇总方法2.2.1 数量数据汇总方法数据汇总就是把原始数据加工为有序的分组数据的过程。对于连续变量情况下,要采用组距分组。采用组距分组需要经过分组、确定组限和次数分配等几个步骤例2-1 某公司销售人员的车辆运营费用过高,其中主要的为汽油费用。现收集到前几个月在车辆上的开销,分析汽油的成本花费后,进一步分析汽车的型号、司机及行车路线等因素。已知样本数据(单位:公里/升)如下:27、29、33、21、21、12、16、25、8、17、24、34、38、15、19、19、41首先,确定组数。先按斯特格斯(Sturges)提出的经验公式来确定组数K:K=1+lgN/lg2其中N为数据的个数。例如,对本例的数据有"K=1+lg7/lg2=5.08" ,即应分为5组。2.2 数据汇总方法2.2.1 数量数据汇总方法其次,确定组距。组距= (最大值—最小值)/组数。对于本例的数据,则组距= (41—8)/5 = 6.6。为便于计算,组距宜取5或10的倍数。如果取5,则有组数= 全距 / 组距 = (41-8)/5 = 6.6,可取7组。第三,确定组限和进行次数分配。依此分组为5~10、10~15、15~20,…,可得到组数为8的频数汇总表,见表2-2。2.2 数据汇总方法2.2.1 数量数据汇总方法表2-2 车辆运营费用频数(次数)汇总表从变量值小的一方向变量值大的一方累加频数,称为向上累积;从变量值大的一方向变量值小的一方累加频数,称为向下累积2.2 数据汇总方法2.2.1 数量数据汇总方法第四,绘制统计图。统计图用柱形图绘制,如图2-2所示。图2-2 17辆汽车单位汽车公里数柱状图第五,分析。从全距数据得知,该公司销售人员的车辆每升汽油行驶公里数最高为45(原始数据最高为41),最低为5(原始数据最高为8),全距为40(原始数据全距为33)。其中有8辆大于15和小于25,约占47%;有7辆低于20,约占41%。对低于20的7车辆(占41%)应加强管理,降低其车辆运营费用。2.2 数据汇总方法2.2.1 数量数据汇总方法为消除组距不同对频数分布的影响,需要计算频数密度,用频数密度才能准确反映频数分布的实际状况。频数密度=频数/组距此外,组距分组掩盖了各组内的数据分布状况,为反映各组数据的一般水平,通常用组中值作为该组数据的一个代表值,即:组中值:(下限值+上限值)/2以组中值作为代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组距中值两侧呈对称分布2.2 数据汇总方法2.2.2 品质数据汇总方法对品质数据分组有一定的主观性,这也是困难之处。例如,对某饭店进行了前景展望的问卷调查,所得顾客的原始资料如表2-3:表2-3 饭店前景展望的问卷调查原始资料2.2 数据汇总方法2.2.2 品质数据汇总方法根据表3作频数分布表和条形组,如下所示:表2-4 饭店前景展望频数分布表2.2 数据汇总方法2.2.2 品质数据汇总方法以上由于分组过细,不利于分析得出结论,可将组数减少为“不乐观”和“乐观”两组,结果如表2-5:图2-3 饮食业调查条形图表2-5 饭店前景展望调查表2.2 数据汇总方法2.2.2 品质数据汇总方法为进一步分析饭店业前景是否与店主风格有关,把店主类型加入表中,编制联列表2-6,绘制柱形图如图2-4:表2-6 饭店业调查图2-4 饭店调差条形图2.2 数据汇总方法2.2.3 双变量相关关系和散点图在决策中,经理们通常更关心两个变量的相互关系。表2-7给出了房屋面积和房屋售价的数据:表2-7 房屋面积和房屋售价的资料2.2 数据汇总方法2.2.3 双变量相关关系和散点图一个变量增大,另一个变量是否也增大?只从原始统计表中不太容易了解,需要绘制散点图。从散点图(见图2-5)可以得知,售价随着面积的增大而上升图2-5 房屋面积和售价的关系本章小结统计数据分为第一手数据(原始数据)和第二手数据。通过普查、抽样调查等组织方式可以搜集到第一手数据。数据之间存在某种规律,可以使用适当的汇总方法了解其分布特征,并可用图的形式表现出来,为进行深入的统计分析打下基础。谢 谢 观 看! 展开更多...... 收起↑ 资源预览