词条 | 规则抽取 |
释义 | 规则抽取是数据挖掘中的最重要和最关键的一步,它是指从经过处理的决策表中抽取出以规则形式表式的知识。IF...THEN.... 目前,用于分类问题的方法可以分为两类:符号方法和连接主义方法。符号方法基于决策树、粗集理论等技术,得到的分类知识以分类规则的形式出现;而连接主义方法则以神经网络为代表,其知识蕴含在其结构中,不易为人所理解,因而一度被认为不适合于进行数据挖掘。然而由于神经网络在分类问题中具有分类精度高、鲁棒性好等优点,很多的研究者致力于从神经网络中抽取分类规则。其基本思路都是基于搜索的算法,对于任一给定的隐结点或输出结点,先提取符号规则,然后对生成的规则按网络的传导途径进行连接和整理。有文献提出了一种从训练后的三层前馈网络中抽取分类规则的方法。首先对每个隐层结点的输出值进行离散化;然后分别导出隐层结点与输出层结点之间的规则(规则集1)和输入层结点与隐层结点之间的规则(规则集2);最后将两部分规则进行合并得到最终的分类规则。总的说来,从神经网络中抽取规则是一个复杂的过程,这其中隐结点的离散化过程不仅繁琐,而且会丢失信息。另外,当数据量增多,网络规模变大时,网络训练和规则抽取的时间代价将会非常大。 |
随便看 |
|
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。