词条 | 统计分组 |
释义 | 统计分组(Statistical Grouping)是指根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称“统计分组”。总体的变异性是统计分组的客观依据。统计分组是总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体。 概述统计分组(Statistical Grouping)是统计学(statistics)的基本统计方法之一,统计工作从始至终都离不开统计分组的应用,在统计调查方案中必须对统计分组做出具体规定,才能搜集到能够满足分组需要的资料。统计资料的整理的任务是使零散资料系统化,但怎样使资料系统化,本着什么去归类,这就取决于统计分组。在取得完整、正确的统计资料前提下,统计分组的优劣是决定整个统计研究成败的关键,它直接关系到统计分析的质量。 定义例如:将一所学校的人,根据老师,学生,男性,女性,年龄,成绩,特长等标志,进行分类统计。 其目的:是保持各组内,统计资料的一致性和组间资料的差异性,便于运用各种统计方法研究现象的数量表现和数量关系,从而正确地认识事物的本质及其规律。 科学的统计分组应遵循两个原则: 1.必须符合“穷尽原则”,就是使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体的所有单位。 2.必须遵守“互斥原则“,即总体任一单位都只能归属于一组,而不能同时或可能归属于几个组。 基本资料统计分组体系统计分组后所形成的一系列互相联系、互相补充的组的整体称分组体系。分组体系有平行分组体系和复合分组体系两种。平行分组体系是选择两个或两个以上的标志对总体进行一次次简单分组后所形成的体系;复合分组体系就是复合分组后形成的体系。 分组标志的选择分组标志的选择是统计分组的关键。分组标志,即将同质总体区分为不同组的标准或依据。分组标志一旦选定,就必然突出了总体在该标志下的性质差别,其他的差别看不见了。分组标志选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质,歪曲社会经济的真实情况。 正确选择分组标志,必须根据统计研究的任务目的,抓住反映现象本质区别和内在联系的标志作为分组标志。 分组的原则统计分组必须遵循穷尽和互斥两条原则。穷尽原则就是总体中的每一个单位都有组可归,无一遗漏。互斥原则就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时归属于几个组。 分组种类任务和作用分组类型分组的目的是划分经济类型,结构分类的目的是研究同质总体的构成,分析分组的目的是研究现象总体内部诸标志间的依从和制约关系。 分组标志分组简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。 性质分组品质分组是将总体按品质标志进行分组,如企业按经济成份、地理位置分组,职工按性别、文化程度分组等;变量分组是将总体按数量标志进行分组,如企业按职工人数、劳动生产率分组,职工按工龄、工资分组等。 分组作用划分社会经济类型统计分组是确定社会经济现象各种类型的基础,例如将工业企业按所有制的不同、按轻重工业划分,居民按城镇、农村划分,从而说明不同的经济类型的特点。一般来说,社会经济类型的分组多采用品质标志来划分。 划分产业类型通过统计分组可以反映总体内部各部分之间的差别和相互关系,表明总体的内部结构。同时在各组的基础上计算各组所占总体的比重,从总体的构成上认识总体各部分的作用,并对总体作出正确的评价。业人员的分布情况,通过分组表明了从业人员在三次产业中的分布,也显示了人员在三次产业中的结构比重,说明这10年间中国的产业结构发生了很大的变化 分析现象之间的依存关系社会经济现象之间存在着相互制约、相互联系的关系,通过统计分组可以根据现象间的影响因素和结果因素的对应更好地揭示现象之间的这种依存关系。 分组方法概括统计分组根据分组标志的性质,分为按品质标志分组和按数量标志分组。 品质标志上是说明事物的性质或属性特征的,它反映的是总体单位在性质上的差异,它不能用数值来表现。数量标志是直接反映事物的数量特征的,它反映的是事物在数量上的差异。如人口的年龄、企业的产值等。统计分组方法就是指这两种标志的具体分组方法。 品质标志分组方法品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。 数量标质分组方法单项式分组和组距式分组 对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如居民家庭按儿童数或人口数分组,均可采用单项式分组。 离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。 也就是说,离散变量根据情况既可用单项式分组,也可用组距式分组。在组距式分组中,相邻组既可以有确定的上下限,也可将相邻组的组限重叠。 连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。 在相邻组组限重叠的组距式分组中,若某单位的标志值正好等于相邻两组的上下限的数值时,一般把此值归并到作为下限的那一组(适用于连续变量和离散变量)。 组距式分组使资料的真实性受到一定程度的损害。组距式分组的假定条件是:变量在各组内的分布都是均匀的(即各组标志值呈线性变化)。 通过组距式分组以后,把各组内部各单位的次要差异抽象去了,而把各组之间的主要差异突出出来,这样,各组分配的规律性可以更容易显示出来。根据这个道理,如组距太小,分组过细,容易将属于同类的单位划分到不同的组,因而显示不出现象类型的特点;但如果组距太大,组数太少,会把不同性质的单位归并到同一组中,失去区分事物的界限,达不到正确反映客观事实的目的。因此,组距的大小、组数的确定应根据研究对象的经济内容和标志值的分散程度等因素,不可强求一致。 等距分组和不等距分组等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。不等距分组即各组组距不相等的分组。 统计分组时采用等距分组还是不等距分组,取决于研究对象的性质特点。在标志值变动比较均匀的情况下宜采用等距分组。等距分组便于各组单位数和标志值直接比较,也便于计算各项综合指标。在标志值变动很不均匀的情况下宜采用不等距分组。不等距分组有时更能说明现象的本质特征。 组限和组中值组距两端的数值称组限。其中,每组的起点数值称为下限,每组的终点数值称为上限。上限和下限的差称组距,表示各组标志值变动的范围。 组中值是上下限之间的中点数值,以代表各组标志值的一般水平。组中值并不是各组标志值的平均数,各组标志数的平均数在统计分组后很难计算出来,就常以组中值近似代替。组中值仅存在于组距式分组数列中,单项式分组中不存在组中值。 组中值的计算是有假定条件的,即假定各组标志值的变化是均匀的(与组距式分组的假定条件相同)。一般情况下,组中值=(上限+下限)÷2 对于第一组是 “多少以下”,最后一组是“多少以上”的开口组,组中值的计算可参照邻组的组距来决定。即:缺下限开口组组中值=上限—1/2邻组组距,缺上限开口组组中值=下限+1/2邻组组距。 统计分组的基本类型按标志的性质不同分为品质标志和数量标志按品质标志分组是指用品质标志将总体分为若干组来表示。按品质标志分组,标志一经确定,组数和组限都非常明显。这些组在组限上、性质上都很明显,不存在组与组之间界限难以划分的问题。在统计工作中,对于比较复杂的分组则由上级统计机关或各业务主管部门统一编制标准的分类目录供大家使用。 按数量标志分组就是选择反映社会经济现象数量差异的数量标志作为分组标志,例如,职工按工资收入多少分组,工业企业按产值分组、按计划完成程度分组等 简单分组和复合分组是按照分组标志的个数多少不同划分的,简单分组是指按照一个标志进行分组,如下图 成绩(分)【不含上限】 人数(人) 60以下 60~70 70~80 80~90 90以上 合 计 复合分组是指对同一个总体在同一张分组表上,把两个或两个以上标志层叠起来进行分组,如下图 构成分类 最终消费 总 计 居民消费 政府消费 资本形成 总 计 固定资本形成 存活增加 合 计 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。