词条 | 搜索引擎开发权威经典 |
释义 | 这《搜索引擎开发权威经典》引基于Lucene的当前最新版本(2.1)精解了Lucene搜索引擎的相关知识,从基础知识到应用开发,精练简洁,恰到好处 目录(第1章 Lucene简介 第2章 创建索引 第3章 执行搜索 第4章 中文分词 第5章 Lucene搜索引擎开发基础实例 第6章 常用的数据解新组件 第7章 Lucene自身的数据解新方 第8章 Lius类库) 搜索引擎作者:于天恩 出版社:中国铁道出版社 页码:629 页 出版日期:2008年 ISBN:9787113092511 条形码:9787113092511 版本:1版 装帧:平装 开本:16 中文:中文 附带品描述:附光盘一张 内容简介这《搜索引擎开发权威经典》基于Lucene的当前最新版本(2.1)精解了Lucene搜索引擎的相关知识,从基础知识到应用开发,精练简洁,恰到好处 《搜索引擎开发权威经典》共包括16章,分为6部分。第1部分Lucene基础。介绍了Lucene的基础知识,包括Lucene的历史和发展情况、使用Lucene创建索引和执行搜索的基本方法以及中文分词的应用,最后做了两个应用项目。第2部分:数据解析。介绍解析不同格式数据(如Word、PDF等)的方法,包括常用的数据解析组件、Lucene自身的数据解析机制和Lius类库。第3部分:索引的高级知识。介绍了 Lucene建立索引的过程,索引的查看和删除,索引的同步,索引的合并和优化等内容。第4部分:搜索的高级知识。介绍使用不同的Query对象构建搜索请求,使用QueryParser解析用户的搜索请求,搜索结果的过滤和排序等内容。第5部分:Lucene应用实例。应用本节介绍的所有知识构建一个桌面搜索引擎和一个Web搜索引擎。这部分作为对前面所有内容的总结。第6部分:Nutch搜索引擎框架。介绍了基于Lucene的完整搜索引擎Nutch。 《搜索引擎开发权威经典》适合从Lucene初学者到高级开发人员之间的一切Lucene爱好者。 作者简介于天恩,现任某大型软件开发公司技术总监,高级软件工程师,精通主流软件编程技术(100多种),具有大量软件项目开发经验。主持开发过大中型企业网站,短信服务系统,办公自动化系统(OA),CRM系统等。 已经出版的作品:《PHP精解案例教程》、《做自己的搜索引擎——搜索引擎精解案例教程》、《迅速搭建全文搜索平台——开源搜索引擎实战教程》。 目录第1章 Lucene简介1.1 认识Lucene 1.1.1 Lucene是什么 1.1.2 Lucene的作者 1.1.3 Lucene的历史 1.1.4 Lucene的现在 1.2 Lucene体验实例 1.2.1 下载Lucene 1.2.2 编写辅助类 1.2.3 最简单的搜索引擎 1.2.4 索引器的开发 1.2.5 索引器的运行 1.2.6 搜索器的开发 1.2.7 搜索器的运行 小结 第2章 创建索引2.1 创建索引的基本方式 2.1.1 理解创建索引的过程 2.1.2 创建Field 2.1.3 创建Document 2.1.4 创建IndexWriter 2.2 创建索引实例 2.2.1 简单索引 2.2.2 复杂一点的索引 2.2.3 为文件创建索引 2.2.4 为某一目录下的所有文件创建索引 小结 第3章 执行搜索3.1 执行搜索的基本方式 3.1.1 创建搜索器对象:Indexsearcher 3.1.2 封装搜索条件:使用Tem和Query对象 3.1.3 执行搜索 3.1.4 提取搜索结果:了解Hits对象 3.1.5 提取搜索结果:了解Document对象 3.1.6 提取搜索结果:了解Field对象 3.2 执行搜索实例 3.2.1 简单搜索 3.2.2 分词问题 小结 第4章 中文分词4.1 说说分词 4.1.1 分词的方法 4.1.2 做分词器 4.2 Lucene的分词器 4.2.1 二分法分词器 4.2.2 Lucene自带的中文分词器 4.2.3 NGram分词器的原理和用法 4.2.4 JE分词器的原理和用法 4.2.5 IK分词器的原理和用法 4.2.6 其他分词器 小结 第5章 Lucene搜索引擎开发基础实例5.1 概述 5.2 桌面搜索引擎:索引器 5.2.1 索引器简介 5.2.2 索引器设计 5.2.3 索引器实现 5.2.4 实例效果 5.3 桌面搜索引擎:搜索器 5.3.1 搜索器简介 5.3.2 搜索器设计 5.3.3 搜索器实现 5.3.4 实例效果 5.4 web搜索引擎:搜索器 5.4.1 搜索器简介 5.4.2 搜索器界面 5.4.3 搜索器实现 5.4.4 搜索器部署 5.4.5 实例效果 小结 第6章 常用的数据解新组件6.1 常见二进制文档的解析 6.1.1 解析PDF文档 6.1.2 解析Word文档 6.1.3 解析Excel文档 6.2 XML文档的解析 6.2.1 使用DOM4J解析XML文档 6.2.2 XML文档标准解析器 6.3 HTML文档的解析 6.3.1 下载HTMLParser组件 6.3.2 网页编码问题 6.3.3 网页解析的一般方法 6.3.4 常见的解析要求 6.4 集成的数据解析器 6.4.1 文本文件解析器 6.4.2 集成解析器 6.5 改良的搜索引擎 6.5.1 改良的索引器 6.5.2 测试搜索器 小结 第7章 Lucene自身的数据解新方法 7.1 处理PDF文档——LucenePDFDocument 7.2 处理纯文本文件——TextDocument 7.3 综述 小结 第8章 Lius类库8.1 初识Lius 8.1.1 Lius简介 8.1.2 Lius的功能 8.1.3 下载Lius 8.1.4 Lius的目录结构 8.1.5 一个简单的例子 8.2 借助Lius解析普通数据 8.2.1 取我所需,为我所用 8.2.2 解析Word 8.2.3 解析Excel 8.2.4 解析PDF 8.2.5 解析PowerPoint 8.2.6 解析RTF 8.2.7 解析TXT 8.2.8 解析XMI 8.3 借助Lius解析HTML数据 …… 第3部分 索引的高级知识(第9~10章) 第4部分 搜索的高级知识(第11~12章) 第5部分 Lucene应用实例(第13~14章) 第6部分 Nutch搜索引擎框架(第15~16章) …… 序言说说搜索引擎 搜索引擎这几年热起来了。 作为世界上最大、最出名的搜索引擎,Google在很多地方发挥了重要的作用,下面是笔者的一点总结。 第一,搜索。Google给人上网浏览资源提供了方便。 第二,营销。利用Google做广告,针对Google的搜索算法去开发网站,就可以赚取眼球经济。 第三,小软件的开发。利用Google提供的搜索接口,可以开发许多商用的客户端搜索软件。如GoogleEanh地图软件等。 第四,Google为长尾理论提供了实验数据,奠定了互联网经济的理论基础,引发了“管理学界”的变革。 第五,看到了Google搜索的好处之后,人们更重视搜索。找人做网站的人总是会提出加个搜索功能。提供搜索服务的公司也越来越多,因为他们发现这里有利可图。甚至,连苦读圣贤书多年的大学毕业生(包括一些博士)也认为应聘搞搜索的公司是一件光彩的事情。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。