词条 | freespan |
释义 | FreeSpan 算法FreeSpan算法思想FreeSpan ,即频繁模式投影的序列模式挖掘,其基本思想为:利用频繁项递归地将序列数据库投影到更小的投影数据库集中,在每个投影数据库中生成子序列片段.这一过程对数据和待检验的频繁模式集进行了分割,并且将每一次检验限制在与其相符合的更小的投影数据库中. FreeSpan 算法执行过程的描述:(1) 首先给定序列数据库S 及最小支持度阈值ζ. (2) 扫描序列数据库S,找到S中的频繁项集,并以降序排列生成f_list列表。 执行下面步骤: 根据生成的f_list列表把数据库分成几个不相交的子集。只包含第一个项。包含第二个项,但不包含以后的项。包含第N项,但不包含N以后的项。只包含最后一项。 b.第一遍扫描数据库S,找出每个项及其与前一项组成的项在序列数据库中的频度,删除小于最小支持度的项。 d.对生成的大于最小支持度的项递归的挖掘出更长频度的序列。直至最后的投影数据库都是最大的频繁子集。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。