词条 | 投影聚类 |
释义 | 将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程被称为聚类。 投影聚类(Projected Clustering)是一种重要的聚类分析方法。被广泛应用于高维聚类分析上。投影聚类是将空间数据投影到某若干维上,在相关的维上再根据数据间的相似性(一般是基于距离)进行聚类。目前许多经典聚类算法如文献中提到的K-Means 和K-medoid 方法, 大部分都是针对低维数据的, 然而现实中大部分数据都是高维的, 于是引入“特征选择”来降低数据的维度, 但这样容易导致丢失数据的信息, 为了消除“降维”带来的负面影响,A grawal 等人于1999年首次提出的PROCLUS算法就是最早的采用自顶而下搜索策略的投影聚类算法。A grawal后来 对PROCLUS算法的改进ORCLUS算法也是投影聚类算法。目前投影聚类算法有:CL IQUE、PROCLUS、ORCLUS和EPCH 等。 随着技术的进步使得数据收集变得越来越容易,导致数据库规模越来越大、复杂性越来越高,如各种类型的贸易交易数据、Web 文档、基因表达数据等,它们的维度(属性)通常可以达到成百上千维,甚至更高。但是,受“维度效应”的影响,许多在低维数据空间表现良好的聚类方法运用在高维空间上往往无法获得好的聚类效果。高维聚类已成为数据挖掘中的一个重要研究方向。因此投影聚类正成为一种重要的聚类分析方法。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。