词条 | 潜在语义标引 |
释义 | M. W. Berry 和S. T. Dumais 在20世纪80年代末提出了一种新的信息检索模型:潜在语义标引(Latent Semantic Indexing,LSI),它可以看作经典向量空间模型(VSM)的一种改进。 LSI是一种建立在统计之上的学习方法:它试图发现对象之间的关联模式及其隐藏的对象间的结构关系。 LSI方法最初应用于文本信息检索领域,它可以有效地解决了同义词和多义词的问题,通过识别文本中的同义词, LSI将信息检索精度提高了10%--30%。 随着应用领域的不断拓展, LSI已在信息过滤、信息分类/聚类、交叉语言检索、信息理解、判断和预测、特征抽取(降维)、文本可视化等众多领域中得到了广泛的应用。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。