词条 | 数据分组 |
释义 | 简介数据分组是根据统计研究的需要,将原始数据按照某种标准化分成不同的组别,分组后的的数据称为分组数据。数据分组的主要目的是观察数据的分布特征。数据分组后再计算出各组中数据出现的的频数,就形成了一张频数分布表。 分组方法数据分组的方法有单变量值分组和组距分组两种。 单变量值分组单变量值分组是把一个变量值作为一组,这种分组通常值适合离散变量,而且在变量值较少的情况使用。 组距分组在连续变量或变量值较多的情况下,通常采用组距分组。它是将全部变量值依次划分为若干区间,并将这一区间的变量值作为一组。在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。 分组原则 采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组中重复出现;不漏是指组别能够穷尽,即在所分的全部组别中每一项数据都能分在其中的某一组,不能遗漏。 分组步骤 第1步:确定组数。一组数据分多少组合适呢?一般与 数据本身的特点及数据的多少有关。由于分组的目的之一是观察数据分布的特征,因此组数的多少应适中。如果组数太少,数据的分布就会过于集中,组数太多,数据分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。一般情况下,一组数据所分的组数应不少于5组且不多于15组。实际应用时,可根据数据的多少和特点及分析要求来确定组数。 第2步:确定各组的组距。组距是一个组的上限与下限的差。组距可根据全部数据的最大值和最小值及所分的组数来确定,及组距=(最大值—最小值)/组数。 第3步:根据分组整理成频数分布表。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。