请输入您要查询的百科知识:

 

词条 数据分组
释义

简介

数据分组是根据统计研究的需要,将原始数据按照某种标准化分成不同的组别,分组后的的数据称为分组数据。数据分组的主要目的是观察数据的分布特征。数据分组后再计算出各组中数据出现的的频数就形成了一张频数分布表。

分组方法

数据分组的方法有单变量值分组和组距分组两种。

单变量值分组

单变量值分组是把一个变量值作为一组,这种分组通常值适合离散变量,而且在变量值较少的情况使用。

组距分组

在连续变量或变量值较多的情况下,通常采用组距分组。它是将全部变量值依次划分为若干区间,并将这一区间的变量值作为一组。在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限

分组原则

采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组中重复出现;不漏是指组别能够穷尽,即在所分的全部组别中每一项数据都能分在其中的某一组,不能遗漏。

分组步骤

第1步:确定组数。一组数据分多少组合适呢?一般与 数据本身的特点及数据的多少有关。由于分组的目的之一是观察数据分布的特征,因此组数的多少应适中。如果组数太少,数据的分布就会过于集中,组数太多,数据分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。一般情况下,一组数据所分的组数应不少于5组且不多于15组。实际应用时,可根据数据的多少和特点及分析要求来确定组数。

第2步:确定各组的组距。组距是一个组的上限与下限的差。组距可根据全部数据的最大值和最小值及所分的组数来确定,及组距=(最大值—最小值)/组数。

第3步:根据分组整理成频数分布表。

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/2/27 17:27:38