词条 | 基于文献的知识发现 |
释义 | 基于文献的知识发现 基于文献的知识发现含义 基于文献的知识发现,更确切的术语是基于非相关文献的知识发现,它是1986年由Swanson教授首先提出,该术语目前尚无完整的定义,根据Swanson历次发表的论文,可将基于文献的知识发现含义归纳为:“从公开发表的非相关文献中发现某些知识片段间的隐含联系,并在此基础上提出科学假设或猜想,一道科研人员进行攻关或实验,从而发现新知识。”这里,发表的非相关文献是指两篇或多篇公开发表的文献不彼此引用或不共引其他文献。所谓知识片段是指知识单元或知识单元集合。最后提出的科学假设只是一种推测,尚需实验佐证,方能生成新知识,为科学界所认可。 Swanson提出的知识发现方法首先在生物医学中得到应用。1986年,他发现,雷诺氏病是一种病因和治疗方法均未知的血液循环紊乱疾病。有的文献记载了部分雷诺氏病患者血液中有些异常(如血液黏度偏高),又有一些文献记载了食用鱼油能纠正这些异常(如它可降低血液黏度)。Swanson将34篇论述血液变化可导致雷诺氏病的生物医学文献分为一组(A),而降25篇论述食用鱼油可引起血液某种变化的生物医学文献分为另一组(C),通过雷诺氏病主题词(B)将两组文献类型在一起。在此基础上,Swanson提出科学假设:“食用鱼油会对雷诺氏病患者有益。”当时,这一假设并未以任何形式公开发表过,学术界尚未发现食用鱼油与雷诺氏病之间的联系。两年后,这个科学假设被临床实验所证实。后来,Swanson通过文献研究又发现了偏头痛与镁的11条被忽略掉的联系。他在1998年发表的文章中提出了“镁的缺乏可能引起偏头痛”的假设,后来也被临床实验和脑中镁含量的检测报告所证实。 美国为嗯州立大学Cort教授讲Swanson方法成功应用于发现Wilson人文数据库中文献间的隐含关系。他发现可以前未被人们发觉的诗人Robert Forst(1874-1963)和希腊哲学家Carneades(公元前214~公元前129年)间的联系。为此证实在人文科学文献中同样存在着许多未被挖掘的隐含联系。 2001年F.Morrissery博士在美国第九届图书馆、保健图书馆和法律图书馆会议上发表了题为“科学技术与医学数据库中知识发现的理论与实践”一文。他以工程索引数据库Compendex为基础,采用Swanson的方法发现两人以前未被热发觉的聚合物中产生带状扭结的原因,从而证实了工程技术文献中也存在着大量未被发觉得隐含联系。 基于文献的知识发现产生背景 第一,记录性知识(文献)总量与人类吸收知识能力之间的鸿沟不仅是巨大的,而且是不断扩展和加深的,人的智力水平和有限的生命严重地影响新知识的产生,极大地延缓知识的演化过程。 第二,知识分裂现象日趋严重。知识分裂又称知识分化。由于跨学科、跨专业的知识交流,各个学科不断产生新的分支和专业。知识裂化的加剧导致文献中隐含的关系不易被发觉,人们识别文献之间意义联系及其关联网越感困难。 第三,文献之间意义联系呈“大爆炸”之势。一个专业领域的信息可能对另一个专业领域是有价值的,而这一事实却无人知晓。跨学科之间存在着许许多多未被人发现的联系,而这种联系未能通过文献之间的相互引用或其他交流方式进行沟通。另人惊讶的是,意想不到的这种隐性意义联系的数量远远超过显性(相互引用和交流)联系的数量,各种信息或知识单元在意义上的结合(潜在联系)数量要比信息或知识单元本身多的多。文献意义关联的数量爆炸令人担忧,后果更为严重。 基于文献的知识发现基本原理 Swanson提出的基于文献的知识发现方法最初是根据阿里斯托得的三段论。三段论一般由两个前提和一个结论构成,即是说,从两个因果关系中可以推导出第三个因果关系。例如,A→B(A引起B),B→C(B引起C),则A→C(A引起C)。知识的发现是以因果的演绎推理为基础的。然而,这种三段论有其局限性,必须遵循一定的规则。 美国密歇根大学商学院Gordon教授发展了Swanson的逻辑递推的理念,提出了中介文献概念。其基本原理为:“若某一篇文献中的A与另一篇文献中的Bi有关,而每一个Bi又与其他文献中的Cj有关,将这种递推关系一直进行下去,直至发现预定目标的内容T。而A与T没有在文献中共引或相互引用,也没有一篇文献同时论述A与T。” Gordon教授逻辑递推知识发现的原理,增加了中介文献,而这比Swanson教授简单演绎推理更进一步。 美国布拉斯加大学数学与计算机系的Chen创建了“文献相互交谈”的计算机模型,其基本原理可描述为:“若在文献dj中实体或对象Ok同Ol有关,而另一文献dj中实体或对象Oi与Om有关,则Ok与Om通过Ol被联系起来。” Chen的模型也是建立在三段论基础之上的。 计算机实现方法——Arrowsmith系统 Swanson教授根据其思想开发的Arrowsmith系统目前已经推出了3.0版本。由过去的数据库记录的标题检索模式过渡到主题词和文摘检索模式。该系统的网址为http//:kiwi.Uchicago.edu或http//:Arrowsmit.Psych.Uic.edu。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。