“全文检索”的意思、由来-中文百科全书

全文检索

全文检索是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章、节、段、句、词等信息，也可以进行各种统计和分析。例如，它可以回答“《红楼梦》一书中“林黛玉”一共出现多少次？”的问题。

全文索引的相关议题

语根处理 (stemming)

符素解析器 (token parser) 1-gram, 2-gram , n-gram

断词/分词 word segmentation

反向索引 inverted index

算法、搜寻策略之模型

布林式 boolean

统计模型 Probabilistic model

向量空间模型 vector base model

隐性语义模型 Latent semantic model

评量之准则

判断检索效果的两个指标：

查全率=被检出相关信息量/相关信息总量（%）

查准率=被检出相关信息量/被检出信息总量（%）

开放源代码之全文检索系统

Apache Solr

BaseX

Clusterpoint Server(freeware licence for a single-server)

DataparkSearch

Ferret

Ht-//Dig

Hyper Estraier

KinoSearch

Lemur/Indri

Lucene

mnoGoSearch

Sphinx

Swish-e

Xapian

和中文有关的议题

断词（分词）

语法解析

古籍议题

多语言混合

优化

剔除字(Stopwords)

词性标注

权威档(authority file)

知识体系，本体论(ontology)

超链接分析(page rank)技术

历史及未来之趋势

自由语句搜寻

词条	全文检索
释义	全文检索是一种将文件中所有文本与检索项匹配的文字资料检索方法。全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。全文检索全文索引的相关议题算法、搜寻策略之模型评量之准则开放源代码之全文检索系统和中文有关的议题优化历史及未来之趋势全文检索全文检索是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章、节、段、句、词等信息，也可以进行各种统计和分析。例如，它可以回答“《红楼梦》一书中“林黛玉”一共出现多少次？”的问题。全文索引的相关议题语根处理 (stemming) 符素解析器 (token parser) 1-gram, 2-gram , n-gram 断词/分词 word segmentation 反向索引 inverted index 算法、搜寻策略之模型布林式 boolean 统计模型 Probabilistic model 向量空间模型 vector base model 隐性语义模型 Latent semantic model 评量之准则判断检索效果的两个指标：查全率=被检出相关信息量/相关信息总量（%）查准率=被检出相关信息量/被检出信息总量（%）开放源代码之全文检索系统 Apache Solr BaseX Clusterpoint Server(freeware licence for a single-server) DataparkSearch Ferret Ht-//Dig Hyper Estraier KinoSearch Lemur/Indri Lucene mnoGoSearch Sphinx Swish-e Xapian 和中文有关的议题断词（分词）语法解析古籍议题多语言混合优化剔除字(Stopwords) 词性标注权威档(authority file) 知识体系，本体论(ontology) 超链接分析(page rank)技术历史及未来之趋势自由语句搜寻
随便看	古椅古已有之古艺术时期古易筋经新注汇粹古邑学堂古逸古逸丛书古逸壶古逸华古意古意·夫戍萧关妾在吴古意·君为女萝草古意·连晓寝衣冷古意·卢家少妇古意·卢家少妇郁金堂古意·男儿事长征古意呈补阙乔知之古意二首·玉笼薰绣裳古意六首古意诗古意赠今人古义古议会谷古议会旧址古谊路障路雨路面机械路面管理系统路面质量评定路风琴路黎明跲跳三跳三弦跳下黄河洗不清跳不完爱不完唱不完跳乐跳伞塔跳伞服跳伞次数最多的人跳出我天地跳到黄河洗不清跳剑跳剪跳加官跳动点跳匿象车象邸