词条 | 信息过滤 |
释义 | § 信息过滤 信息过滤是根据用户的信息需求,运用一定的标准和技术,从大量的动态信息流中将与用户无关的信息滤掉,把满足用户需求的信息提供给用户,从而减轻用户的认知负担,提高用户获取信息的效率。 目前,信息过滤的类型主要有两种:基于内容的过滤和协作过滤。 (1)基于内容的过滤。基于内容的过滤也被称为认知过滤,它首先要将信息的内容和潜在用户的信息需求特征化,然后再使用这些表述,职能化地将用户需求同信息相匹配[1],按照相关度排序把与用户信息需求相匹配的信息推荐给用户,其关键技术是相似性计算。优点是简单、有效;缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。 (2)协作过滤。协作过滤也称为社会过滤,这种类型支持社会上个人间和组织间的相互关系,并将人们之间的推荐过程自动化。一个数据条款被推荐给用户,是基于它同其他有相似兴趣用户的需求相关[2]。协作过滤推荐的核心思想是用户会倾向于利用具有相似意向的用户群的产品,因此,它在预测某个用户的利用倾向时是根据一个用户群的情况而决定的。可见,协作过滤法是找出一群具有共同兴趣的使用者形成社群,也就是有某些相似特性成员的集合,透过分析社群成员共同的兴趣与喜好,再根据这些共同特性推荐相关的项目给同一社群中有需求之成员。其优点是对推荐对象没有特殊要求,能处理非结构化的复杂对象[3],并且可以为用户发现新的感兴趣的资源,这种过滤类型对那些不是很清楚自己的信息需求或者表达信息需求很困难的用户非常重要;缺点是存在两个很难解决的问题:其一是稀疏性问题,即在系统使用初期,由于系统资源还未获得足够多的评价,系统很难利用这些评价来发现相似的用户;另一是可扩展,即随着系统用户和信息资源的逐渐增长,其可行性将会降低[4]。Web2.0作为新一代互联网的总称,其典型的应用有:RSS、Blog、Wiki、社会书签等,在这些典型应用中,上述两种类型的过滤都在其中得到了很好的应用,除此之外,由于Web2.0独具的开放性、互动性和双向性等特点,其环境下的信息过滤方式又具有自己的特色。 § 相关条目 |
随便看 |
百科全书收录594082条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。