词条 | 基于遗传算法的文本分类及聚类研究 |
释义 | 基本相信作 者:戴文华著 丛 书 名:出 版 社:科学出版社 ISBN:9787030227416 出版时间:2008-08-01 版 次:1 页 数:222 装 帧:平装 开 本:大32开 所属分类:图书 > 社会科学 > 人类学 内容简介文本分类和聚类技术是应信息检索和查询需要而出现的自然语言处理领域的重要研究课题。文本分类和聚类问题中的特征选择和抽取技术、文本特征表示、聚类方法的选择和实现以及分类方法的选择和实现,都将对文本分类和聚类结果产生极大影响。针对文本分类和聚类中的文本数据的高维性和稀疏性、同义词和近义词问题、效率与精确度之间的搭配问题以及参数优化问题,本书提出了使用遗传算法与传统分类和聚类方法相结合的思路来进行处理,充分利用了遗传算法的全局优化能力和传统分类及聚类算法的专业知识,有效地提高了文本分类和聚类的效率与精度。 目录序 前言 第1章 绪论 1.1 研究的目的和意义 1.2 国内外研究现状 1.3 文本分类和聚类存在的问题 1.4 本书研究内容和目标 参考文献 第2章 文本分类和聚类的基本理论及方法 2.1 文本分类和聚类的概念 2.2 文本的表示 2.3 文本预处理 2.4 文本特征选择和抽取 2.5 文本分类方法 2.6 文本聚类方法 2.7 本章小结 参考文献 第3章 遗传算法基础知识 3.1 遗传算法概述 3.2 标准遗传算法 3.3 遗传算法染色体编码 3.4 适应度函数 3.5 遗传算子 3.6 遗传算法的改进 3.7 本章小结 参考文献 第4章 混合并行遗传算法及其在文本聚类中的应用 4.1 k-means算法初始聚类中心的选择 4.2 混合并行遗传算法 4.3 基于并行遗传算法的文本特征词提取 4.4 基于混合并行遗传算法的文本聚类 4.5 实验设置及结果分析 4.6 本章小结 参考文献 第5章 混合并行遗传算法在文本分类中的应用 5.1 基于混合并行遗传算法的潜在语义挖掘 5.2 基于混合并行遗传聚类的KNN改进算法(HPGA-KNN) 5.3 SMO-SVM算法 5.4 SMO-SVM算法核函数参数优化 5.5 改进的KNN SVM文本分类方法 5.6 实验设置及分析 5.7 本搴小结 参考文献 第6章 总结和研究展望 6.1 总结 6.2 后续研究工作展望 附录A k-means聚类算法关键代码 附录B 遗传算法聚类关键代码 附录C 混合遗传聚类关键代码 前言戴文华同志无论学习、研究还是工作,都非常勤奋、踏实、执著,研究能力和钻研精神都非常强。四年前,他进入华中师范大学计算机科学系攻读硕士研究生时,已经作为高校教师工作了多年,并已取得了较多的成果;然而他在自然语言处理这个研究方向上,还是一个新兵。但是,经过短短的4年,他已经在该方向做出了突出的研究成果,在文本分类和聚类的理论和方法上,做了系统深入的研究,发表了论文10多篇。现在他硕士期间的主要研究成果即将出版专著,实在是可喜可贺。文本自动分类和聚类是自然语言处理领域里重要的研究课题,有广泛的应用前景。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。