词条 | 关联式规则 |
释义 | 简介关联式规则(Association Rules, AR),又称关联规则,是数据挖掘的一个重要课题,用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则解决的常见问题如:“如果一个消费者购买了产品A,那么他有多大机会购买产品B?”以及“如果他购买了产品C和D,那么他还将购买什么产品?”正如大多数数据挖掘技术一样,关联规则的任务在于减少潜在的大量杂乱无章的数据,使之成为少量的易于观察理解的静态资料。 关联规则一个经典的实例是购物篮分析(Market Basket Analysis)。超市对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买习惯,例如,购买产品X的同时也购买产品Y,于是,超市就可以调整货架的布局,比如将X产品和Y产品放在一起,增进销量。 分类根据关联规则所处理的值的类型 如果考虑关联规则中的数据项是否出现,则这种关联规则是布尔关联规则(Boolean association rules)。例如上面的例子。 如果关联规则中的数据项是数量型的,这种关联规则是数量关联规则(quantitative association rules)。例如年龄("20-25")购买("网球拍"),年龄是一个数量型的数据项。在这种关联规则中,一般将数量离散化(discretize)为区间。 根据关联规则所涉及的数据维数 如果关联规则各项只涉及一个维,则它是单维关联规则(single-dimensional association rules),例如购买("网球拍")购买("网球")只涉及“购买”一个维度。 如果关联规则涉及两个或两个以上维度,则它是多维关联规则(multi-dimensional association rules),例如年龄("20-25")购买("网球拍")涉及“年龄”和“购买”两个维度。 根据关联规则所涉及的抽象层次 如果不涉及不同层次的数据项,得到的是单层关联规则(single-level association rules)。 在不同抽象层次中挖掘出的关联规则称为广义关联规则(generalized association rules)。例如年龄("20-25")购买("HEAD网球拍")和年龄("20-25")购买("网球拍")是广义关联规则,因为"HEAD网球拍"和"网球拍"属于不同的抽象层次。 算法Apriori 算法Apriori算法所使用的前置统计量包括了: 最大规则物件数:规则中物件组所包含的最大物件数量,在微软关联规则参数为Maximum_Itemset_Size 最小支援:规则中物件或是物件组必顸符合的最低案例数,在微软关联规则参数为Minimum_Support。 最小信心水平:计算规则所必须符合的最低信心水平门槛,在微软关联规则参数为Minimum_Probability。 F-P算法 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。