“FP增长算法”的意思、由来-中文百科全书

背景

Apriori算法在产生频繁模式完全集前需要对数据库进行多次扫描，同时产生大量的候选频繁集，这就使Apriori算法时间和空间复杂度较大。但是Apriori算法中有一个很重要的性质：频繁项集的所有非空子集都必须也是频繁的。由此性质，引出了FP增长算法。

算法说明

首先介绍FP增长算法中的几个概念

a.FP-Tree：将事务数据表中的各个事务数据项按照支持度排序后，把每个事务中的数据项按降序依次插入到一棵以NULL为根结点的树中，同时在每个结点处记录该结点出现的支持度。

b.条件模式基：包含FP-Tree中与后缀模式一起出现的前缀路径的集合

c.条件树：将条件模式基按照FP-Tree的构造原则形成的一个新的FP-Tree

步骤：

挖掘频繁模式前首先要构造FP-Tree，

输入:一个事物数据库D和一个最小支持度threshold.

输出:对应的FP-tree.

算法流程

1.扫描数据库T一遍.得到频繁项的集合F和每个频繁项的支持度.把F按支持度递降排序,结果记为L.

2.创建FP-tree的根节点,记为T,并且标记为"null".然后对D中的每个事务t,

根据L中的顺序,选出并排序t中的事务项.把t中排好序的事务项列表记为[p|P],其中p是第一个元素,P是列表的剩余部分.调用insert_tree([p|P],T).

函数insert_tree([p|P],T)的运行如下.

如果T有一个子结点N,其中N.item-name=p.item-name,则将N的count阈值+1;

否则,创建一个新节点N,使它的count为1,使它的父节点为T,并且使它的node_link和那些具有相同item_name域串起来.如果P非空,则递归调用insert_tree(P,N).

对FP-Tree进行挖掘，算法如下：

输入:一棵用算法一建立的树Tree

输出:所有的频繁集

步骤:

调用FP-growth(Tree,null).

procedure FP-Growth ( Tree, x)

{

(1) if (Tree只包含单路径P) then

(2) 对路径P中节点的每个组合（记为B）

(3) 生成模式B并x，支持数＝B中所有节点的最小支持度

(4) else 对Tree头上的每个ai，do

{

(5) 生成模式B= ai 并 x，支持度＝ai.support；

(6) 构造B的条件模式库和B的条件FP树TreeB；

(7) if TreeB != 空集

(8) then call FP-Growth ( TreeB , B )

}

词条	FP增长算法
释义	背景算法说明背景 Apriori算法在产生频繁模式完全集前需要对数据库进行多次扫描，同时产生大量的候选频繁集，这就使Apriori算法时间和空间复杂度较大。但是Apriori算法中有一个很重要的性质：频繁项集的所有非空子集都必须也是频繁的。由此性质，引出了FP增长算法。算法说明首先介绍FP增长算法中的几个概念 a.FP-Tree：将事务数据表中的各个事务数据项按照支持度排序后，把每个事务中的数据项按降序依次插入到一棵以NULL为根结点的树中，同时在每个结点处记录该结点出现的支持度。 b.条件模式基：包含FP-Tree中与后缀模式一起出现的前缀路径的集合 c.条件树：将条件模式基按照FP-Tree的构造原则形成的一个新的FP-Tree 步骤：挖掘频繁模式前首先要构造FP-Tree，输入:一个事物数据库D和一个最小支持度threshold. 输出:对应的FP-tree. 算法流程 1.扫描数据库T一遍.得到频繁项的集合F和每个频繁项的支持度.把F按支持度递降排序,结果记为L. 2.创建FP-tree的根节点,记为T,并且标记为"null".然后对D中的每个事务t, 根据L中的顺序,选出并排序t中的事务项.把t中排好序的事务项列表记为[p\|P],其中p是第一个元素,P是列表的剩余部分.调用insert_tree([p\|P],T). 函数insert_tree([p\|P],T)的运行如下. 如果T有一个子结点N,其中N.item-name=p.item-name,则将N的count阈值+1; 否则,创建一个新节点N,使它的count为1,使它的父节点为T,并且使它的node_link和那些具有相同item_name域串起来.如果P非空,则递归调用insert_tree(P,N). 对FP-Tree进行挖掘，算法如下：输入:一棵用算法一建立的树Tree 输出:所有的频繁集步骤: 调用FP-growth(Tree,null). procedure FP-Growth ( Tree, x) { (1) if (Tree只包含单路径P) then (2) 对路径P中节点的每个组合（记为B） (3) 生成模式B并x，支持数＝B中所有节点的最小支持度 (4) else 对Tree头上的每个ai，do { (5) 生成模式B= ai 并 x，支持度＝ai.support； (6) 构造B的条件模式库和B的条件FP树TreeB； (7) if TreeB != 空集 (8) then call FP-Growth ( TreeB , B ) } }
随便看	益龄益灵舒益六化益隆实业有限公司益迈欧益脉康分散片益脉康软胶囊益门镇益盟操盘手免费版益民3号益民村益民多利债券型证券投资基金益民坊社区益民黑中片益民红中片益民化工益民路益民深新一号益民塑料机械厂益民团益民巷益民小红片益民小区益民小学益民新六号语言识别器语言转移语言迁移语言选项语言障碍语言障碍儿童的诊断与教育语言障碍的测评量表语言障碍的行为矫正语论语词语词标识语语语误语说语调语谶语近词冗语逆语铃语锋语际语语难语音Office2005 语音不清语音信箱