资源简介 (共49张PPT)《应用统计学》第二章统计数据的收集CONTENTS目录第一节 统计数据的计量尺度和类型第二节 统计数据的来源第三节 统计调查的方式与方法第四节 统计调查方案和问卷的设计第五节 统计调查误差与控制第一节 统计数据的计量尺度和类型应用统计学一、统计数据统计数据是统计工作活动过程中所取得的反映经济社会现象和自然现象的数字资料以及与之相联系的其他资料的总称。对客观现象进行计量的结果。不是指单个的数字,而是由多个数据构成的数据集。不仅仅是指数字,它可以是数字的,也可以是文字的。应用统计学二、统计数据的计量尺度统计数据是采用某种计量尺度对事物进行计量的结果,采用不同的计量尺度会得到不同类型的统计数据。按照对事物计量的精确程度要求,可将所采用的计量尺度由低级到高级、由粗略到精确分为四个不同的层次:应用统计学定类尺度定比尺度定距尺度定序尺度二、统计数据的计量尺度(一)定类尺度定类尺度(名义尺度):按照事物的某种属性对其进行平行的分类或分组。例如:按照性别将人口分为男性、女性;按照经济性质将全部企业分为国有企业、集体企业、私营企业、混合制企业等。特点:(1)定类尺度只是测度了事物间的类别差异,各类别间是平等并列关系,无优劣、大小及顺序之分,顺序可以改变。(2)这种尺度的主要数学特性是“=”或“≠”;可以且只能计算每一类别中各元素出现的频树。注意:采用定类尺度对事物进行分类时,须符合穷尽和互斥的要求。应用统计学二、统计数据的计量尺度(二)定序尺度定序尺度(顺序尺度):是对事物之间等级或顺序差别的一种测度。例如:对合格的产品按其质量的好坏,分为一等品、二等品、三等品等;考试的成绩可分为优、良、中、及格、不及格等。特点:(1)该尺度不仅可以将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。这就是说,它不仅可以测度类别差,还可以测度次序差。(2)该尺度的计量结果只能比较大小,具有“>”和“<”的数学特性,不能进行加、减、乘、除等运算。(3)定序尺度包括了定类尺度的特性。应用统计学二、统计数据的计量尺度(三)定距尺度定距尺度(间隔尺度):是对事物类别或次序之间间距的一种测度。例如:收入用人民币“元”度量;考试成绩用“百分制”度量;温度用“度”度量等。特点:(1)该尺度通常使用自然或物理单位作为计量尺度,计量结果表现为数值。(2)该尺度不仅能将事物区分为不同类型并进行排序,而且还可以准确地指出类别之间的差距是多少。(3)该尺度的精确程度高于定序尺度,其主要数学特性是“+”或“-”。(4)“0”是测量尺度上的一个测量点,并不代表“没有”或“不存在”。应用统计学二、统计数据的计量尺度(四) 定比尺度定比尺度(比率尺度):是能够计算两个测度值之间比值的一种计量尺度,用以反映事物的构成、比重、速度、密度等数量关系。例如:职工的收入;企业的产值;物体体积等。特点:(1)该尺度与定距尺度属于同一层,其计量结果表示为数值。现实中大多数情况下使用的都是定比尺度。(2)定比尺度除了具有前述三种计量尺度的全部特性外,还可以计算两个测度值之间的比值。(3)定比尺度的主要数学特性是“×”或“÷”,可以进行加、减、乘、除运算。(4)定比尺度有绝对零点,“0”表示“没有”或“不存在”或是理论上的极限。应用统计学二、统计数据的计量尺度定距尺度与定比尺度的差别在定距尺度中,"0”表示某一个数值,是一个有意义的数值,并不表示“没有”或“不存在”;而定比尺度中,必须有一个绝对固定的“零点”,“0” 表示“没有”或“无"。例如:一个学生的统计学课程考试成绩为0分,表示他的统计学成绩水平为0,并不表示他没有考试成绩;一个地区某时的温度为0℃,表示那时的温度水平,并不是没有温度。应用统计学二、统计数据的计量尺度四种计量尺度的区别与联系1.高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但反之不行。2.可将高层次计量尺度的计量结果转换为低层次计量尺度的计量结果,但不能反过来。问题:指出下面变量的计量尺度地铁站距学校的距离某门课期中测验成绩学生的出生地按年级分类的高校学生每周学生学习的小时数小张今年的实际年龄应用统计学三、统计数据的类型应用统计学统计数据的类型按计量尺度按时间状况按收集方法名义数据刻度数据顺序数据实验数据观测数据时序数据截面数据第二节 统计数据的来源应用统计学一、直接来源应用统计学通过直接的调查和科学实验获得数据,由这种渠道获取的数据称为第一手或直接来源统计数据。(1)专门调查(2)科学实验二、间接来源利用别人调查或实验的数据,这是统计数据的间接来源,称为第二手或间接的统计数据。(1)公开出版和公开报道的各种数据(2)权威网站发布的数据(3)未公开的数据第三节 统计调查的方式与方法应用统计学一、统计调查要求应用统计学统计调查是根据调查的目的,运用科学的调查方法,有计划、有组织地搜集数据信息资料的统计工作过程。二、统计调查方式应用统计学(一)统计报表制度统计报表是搜集统计资料的一种方式,它已成为国家和地方政府部门统计数据的主要来源。该制度是依照国家有关法规,自上而下统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级定期提供统计资料的一种调查方式。统计报表制度的主要特点:第一,报表资料来源建立在基层单位的各种原始记录基础上,基层单位也可利用其资料对生产经营活动进行监管。第二,由于统计报表是自下而上逐级上报和汇总的,各级主管部门能获得管辖范围内的报表资料,有利于了解本地区、本部门的经济和社会发展情况。第三,由于统计报表属于经常性调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。二、统计调查方式应用统计学(二)普查普查是为某一特定目的而专门组织的一次性全面调查,主要用以搜集某些采用其他调查方式难以获取的全面的统计资料。常见的普查有人口普查、经济普查,以便掌握有关国情、国力的基本情况,为国家发展制定有关政策和措施提供依据。普查的主要特点:第一,普查通常是一次性或周期性的。例如,我国的人口普查通常是10年一次。第二,普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证调查结果的准确性。例如,我国第七次人口普查的标准时点是2020年11月1日零时。第三,普查获得的数据比较准确,规范化程度较高,因此它可以为其他调查提供基本依据。第四,普查的使用范围较窄,只能用于调查一些最基本及特定的现象。二、统计调查方式应用统计学(三)重点调查重点调查是指在调查对象的全部单位中,只选择少数重点单位进行的非全面调查。所谓重点单位,是着眼于现象的量的方面而言,虽然这些单位在全部单位中只是一部分,但它们在所研究现象的标志总量中都占有较大的比重,在总体中具有举足轻重的地位。重点调查主要特点:投入少调查速度快所反映的主要情况或基本趋势比较准确二、统计调查方式应用统计学(四)典型调查典型调查是一种专门组织的非全面调查,指根据调查目的,在对全部研究对象进行初步分析的基础上,选择一个或几个具有代表性的单位进行详细深入的调查。因此,要求所选择的典型单位应具有所研究问题的本质属性或特征。典型调查主要特点:调查单位少,并且是调查者有意识选择出来的。调查内容具体细致;调查所需时间短,反映情况快。说明:典型调查是有针对性地在总体中选择少数调查单位,具有一定的主观性,因而其调查结果难以用于推断总体。二、统计调查方式应用统计学(四)抽样调查抽样调查是以数理统计和概率论为理论基础,在调查对象中按随机的原则抽取一部分单位进行调查,并据以推断总体数量特征的一种非全面调查方法。抽样调查主要特点二、统计调查方式应用统计学(四)抽样调查抽样调查是以数理统计和概率论为理论基础,在调查对象中按随机的原则抽取一部分单位进行调查,并据以推断总体数量特征的一种非全面调查方法。抽样调查的组织形式二、统计调查方式应用统计学(四)抽样调查1.简单随机抽样简单随机抽样又称纯随机抽样,它是对总体单位逐一编号,然后按随机原则直接从总体N个单位中抽取n个单位作样本。这种抽样方式能使总体中每一个单位有同等机会被抽中。简单随机抽样是抽样中最基本的方式。抽取样本单位的常用方法有抽签法、利用随机数表取数法和计算机取数法。当总体单位的标志变异程度很小,或者具有某种特征的单位均匀地分布于总体各个部分时,用这种组织形式最适合。二、统计调查方式应用统计学(四)抽样调查2.类型随机抽样类型随机抽样亦称分层抽样。它是按与调查目的有关的某个主要标志将总体单位划分为若干层(类、组),然后从各层(类、组)中按随机原则分别抽取一定数目的单位构成样本。分层抽样是分组法和抽样原理的结合,可以提高样本的代表性,抽样误差较小。在总体情况复杂、总体单位之间标志差异程度大,单位数目多的情况下,其优势更为明显。二、统计调查方式应用统计学(四)抽样调查3.机械随机抽样机械抽样又称等距抽样或系统抽样,它是将总体单位按某一标志排队,计算出抽样间隔,并在第一个抽样间隔内随机确定一个抽样起点,再按固定的顺序和间隔来抽取样本单位。机械随机抽样的最主要优点是简便易行,且当对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,能提高样本单位分布的均匀性,样本代表性较强。二、统计调查方式应用统计学(四)抽样调查4.整群随机抽样整群随机抽样是先将总体分成若干群(组),然后再从其中抽取一些群,并对抽中各群中的全部单位一一进行调查。各样本群中所包含的单位数可以相同也可以不同。整群抽样只需对各群体进行编号,可大大简化抽样的组织工作。这种抽样方法抽取的基本单位不再是总体单位而是群。整群抽样一般都采用不重复抽样。二、统计调查方式应用统计学(四)抽样调查5.阶段随机抽样阶段随机抽样又称分级抽样。当总体很大、总体单位很多时,如果直接抽选总体单位,技术上是有很大困难的,这时需采用多阶段的抽样方式。例如:对我国不同城市企业职工家庭的生活费用支出情况进行调查,以三阶段抽样而论,第一阶段先抽选调查城市;第二阶段从选择出的城市的不同类型企业中抽取调查的具体单位;第三阶段再从调查的具体单位中抽选职工,确定具体的调查户,调查每月实际生活费的支出情况。思考:阶段随机抽样抽样、分层抽样和整群抽样的区别?三、统计调查方法应用统计学统计调查方法是指搜集调查对象原始资料的方法,即调查者向被调查者搜集资料的方法。统计调查方法较多,任何一种调查都必须采用一定的调查方法去搜集原始资料,即使调查的组织形式相同,其调查方法也可以不同。第四节 统计调查方案和问卷的设计应用统计学一、统计调查方案设计应用统计学统计调查方案是统计调查前所制订的实施计划,是全部调查过程的指导性文件,是调查工作有计划、有组织、有系统进行的保证。不同调查目的的调查方案在内容和形式上会有一定差异,但大体上都包括以下内容:一、统计调查方案设计应用统计学统计调查方案是统计调查前所制订的实施计划,是全部调查过程的指导性文件,是调查工作有计划、有组织、有系统进行的保证。不同调查目的的调查方案在内容和形式上会有一定差异,但大体上都包括以下内容:1.明确调查目的2.确定调查对象和调查单位一、统计调查方案设计应用统计学统计调查方案是统计调查前所制订的实施计划,是全部调查过程的指导性文件,是调查工作有计划、有组织、有系统进行的保证。不同调查目的的调查方案在内容和形式上会有一定差异,但大体上都包括以下内容:1.明确调查目的2.确定调查对象和调查单位调查对象就是统计调查中所要研究的某种社会经济现象的总体范围,即调查总体。调查单位是构成调查对象(总体)的具体单位。一、统计调查方案设计应用统计学统计调查方案是统计调查前所制订的实施计划,是全部调查过程的指导性文件,是调查工作有计划、有组织、有系统进行的保证。不同调查目的的调查方案在内容和形式上会有一定差异,但大体上都包括以下内容:3.设计调查项目和调查表调查项目是调查的具体内容,也就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,通常由一系列品质标志和数量标志所构成。在大多数的统计调查中,调查项目按照一定顺序和格式排列成一张表格,称为调查表。调查表通常由表头、表体和表外三部分组成。调查表一般分为:一览表和单一表。一、统计调查方案设计应用统计学统计调查方案是统计调查前所制订的实施计划,是全部调查过程的指导性文件,是调查工作有计划、有组织、有系统进行的保证。不同调查目的的调查方案在内容和形式上会有一定差异,但大体上都包括以下内容:4.确定调查方式和方法查方式是指调查的组织形式,主要包括统计报表、普查、 抽样调查、 重点调查、典型调查等。调查方法是指收集调查对象原始资料的具体方法,主要包括直接观察法、报告法、采访法和通信法等。一、统计调查方案设计应用统计学统计调查方案是统计调查前所制订的实施计划,是全部调查过程的指导性文件,是调查工作有计划、有组织、有系统进行的保证。不同调查目的的调查方案在内容和形式上会有一定差异,但大体上都包括以下内容:5.确定调查时间在统计调查中,调查时间有两种涵义:调查时间和调查期限。调查时间是指统计调查资料所属的时点和时期。调查期限是指调查工作的开始到结束的时间、包括收集资料和报送资料的整个工作所需的时间。一、统计调查方案设计应用统计学统计调查方案是统计调查前所制订的实施计划,是全部调查过程的指导性文件,是调查工作有计划、有组织、有系统进行的保证。不同调查目的的调查方案在内容和形式上会有一定差异,但大体上都包括以下内容:6.制订调查的组织实施计划明确调查组织机构、参加调查的单位和人员、调查人员培训、调查步骤、调查资料回收或报送程序、调查地点、调查文件和调查表格准备、费用支出计划等。对于规模较大又缺乏经验的统计调查,在正式调查前,需要进行试点调查,此时还要明确规定试点调查的详细内容。二、统计调查问卷设计应用统计学问卷是国际上通行的调查工具和作业方式,也是我国近年来推行最快,应用最广的一种调查手段。被广泛应用于社会调查、经济调查、市场调查的各个领域。它能够将定性问题转化为定量分析。调查问卷,又称问卷、调查表(questionnaire),是调查者根据一定的调查目的和要求,按照一定的理论假设设计出来的,由一系列问题、调查项目、备选答案及说明所组成的,向被调查者收集资料的一种工具。调查问卷基本特征可概括为四易:易答、易记、易统计、易辨别。二、统计调查问卷设计应用统计学(一)问卷基本结构问卷的格式一般是由问卷的开头部分、甄别部分、主体部分和结束部分组成。1.开头部分开头部分,主要包括问候语、填表说明、问卷编号等内容。不同的问卷所包括的开头部分会有一定的差别。2.甄别部分甄别部分也称问卷的过滤部分,它是先对被调查者进行过滤,筛选掉非目标对象,然后有针对性地对特定的被调查者进行调查。二、统计调查问卷设计应用统计学(一)问卷基本结构问卷的格式一般是由问卷的开头部分、甄别部分、主体部分和结束部分组成。3.主体部分主体部分,是问卷的核心部分。它包括了所要调查的全部问题,主要由问题和答案所组成。4.结束部分该部分主要是对被调查者的合作表示感谢,同时可以征询被调查者对问卷设计和问卷调查本身的看法和感受。结束部分一般要简短明了。二、统计调查问卷设计应用统计学(二)问卷设计原则调查问卷设计的根本目的是设计出符合调研与预测需要及能获取足够、适用和准确信息资料的调查问卷。为实现这一目的,调查问卷设计必须遵循以下原则:二、统计调查问卷设计应用统计学(三)问卷设计步骤在调查问卷的设计过程中,首先要把握调查的目的和要求,同时要争取获得调查对象的充分合作,保证提供有效的信息。问卷设计具体可分为以下几个步骤:二、统计调查问卷设计应用统计学(四)问卷设计技术在调查问卷设计中,问题设计是核心。在设计问卷时,对问题的表述、问题的排列顺序和选择都必须认真反复地推敲。1.问题的表述(1)问题的用词用语要通俗、准确和简洁(2)问题的内容要具体(3)问题设计中避免使用诱导性或倾向性的用语(4)对敏感性问题的调查,要考虑问题的可行性二、统计调查问卷设计应用统计学(四)问卷设计技术在调查问卷设计中,问题设计是核心。在设计问卷时,对问题的表述、问题的排列顺序和选择都必须认真反复地推敲。2.问题类型确定技巧(1)开放型问题。特别适合于答案复杂、数量较多或各种可能答案尚属未知的问题。(2)封闭型问题。封闭型问题有利于被调查者正确理解问题,迅速作出回答。二、统计调查问卷设计应用统计学(四)问卷设计技术在调查问卷设计中,问题设计是核心。在设计问卷时,对问题的表述、问题的排列顺序和选择都必须认真反复地推敲。3.问题的排列技巧(1)按问题的复杂程度,先易后难,由浅入深进行编排(2)问题的排列要有逻辑性,同类性质的问题应安排在一起(3)开放型问题通常放在问卷的后部第五节 统计调查误差与控制应用统计学一、统计调查误差的概念和分类应用统计学统计调查误差,就是调查结果所得的统计数字与调查总体实际数量之间的差异,即调查所得的数量大于或小于调查对象的实际数量的差额。按误差产生的原因,将统计误差分为工作误差和代表性误差。按误差产生的性质,将统计误差分为:时间误差、空间误差、人为误差和方法误差。按误差产生的环节,将统计误差分为:源头误差、中间环节误差和最终误差。二、统计调查误差的产生原因应用统计学统计调查误差产生的原因是十分复杂的,只有深入剖析统计调查误差的产生原因,才能全面控制统计调查的误差。通过对统计调查误差产生原因的梳理和归类,主要包括以下三个方面:三、统计调查误差的控制措施应用统计学统计调差误差虽不可避免,但由于它的负面作用,我们必须采取有力措施,全面控制统计误差,把它缩小到最低限度。谢 谢 展开更多...... 收起↑ 资源预览