请输入您要查询的百科知识:

 

词条 语言指纹
释义

语言指纹是指作家的一种创作习惯。由于不同的作家具有不完全相同的语言文化背景、性格、生活经历、日常惯用语的缘故,同一作家之手的不同作品,往往包含许多类似的行文习惯和句式,而不同作者的作品则缺少或不完全具备这种特征,就像作者在作品中留下“指纹”一样。语言指纹分析可用于分辨文章的原作者。

语言指纹基本原理

瑞典研究人员设计出一种分析作家“语言指纹”的公式,通过分析作品中较少出现的单词数与作品长度间的关系来研究作家的写作习惯。这项研究成果发表在2009年12月10日出版的《新物理学杂志》。

“母本”理论

研究人员说,一位作家的某一部作品其实只是从其“母本”中抽取的一部分。

所谓“母本”,可以大致理解为某位作家的语言习惯和词汇量构成的“框架”。作家的每一部作品都从这一“框架”中来。

美国哈佛大学语言学家乔治·齐普夫于1935年发现一部作品中某一单词出现的频率与这一频率高低次序之间的关系。他指出,最高频单词比第二高频单词出现频率高一倍,比第三高频单词出现频率高两倍,以此类推。

齐普夫揭示的这一规律为后来许多语言学中的定量研究奠定了基础。不少学者把它当作英语甚至所有语言中普遍适用的原则。

语言指纹研究进展

瑞典于默奥大学研究人员在齐普夫的这一理论基础上进一步研究指出,该理论并非放之四海皆准。一部作品中单词出现的频率高低与作家本人语言水平有关,不能一概而论。

研究人员经过分析托马斯·哈代、赫尔曼·梅尔维尔和戴·赫·劳伦斯三位作家的全部作品后发现,随着作品篇幅加长,文中出现生僻单词的几率呈现下降趋势。

他们还发现,这三位作家的“生僻单词出现几率下降曲线”各不相同。更重要的是,这种下降趋势在每位作家的全部作品中都有所体现。

研究人员认为,今后在研究作者不详的作品时,可以用这种方法将其与已知的前人作品相比较,对比这种“语言指纹”的相似性。

语言指纹研究展望

“母本”这一概念不仅包含某位作者掌握的词汇,还包含他自创的新词汇。不论是写《战争与和平》这样的名著,还是平时随便写写电子邮件,人们都有可能创造出新词汇。

研究小组将继续对更多使用英语和其他语言的作家展开研究。随着他们的“语言指纹”库不断扩充,研究人员期望未来能够利用这种方法鉴定出作者不详的作品“身世”之谜。

语言指纹对比分析实例

一部名为《爱德华三世》的英国着名历史剧自1596年问世以来一直作者不详。有人认为它是文艺复兴时期英国剧作家威廉莎士比亚所作,因而称它为“莎士比亚疑剧”。

英国伦敦大学英语研究学院教授布莱恩维克斯爵士认为,出自同一作家之手的不同作品,往往包含许多类似的行文习惯和句式,就像作者在作品中留下“指纹”一样。因此他利用一款软件对《爱德华三世》剧本和同时期莎士比其他作品进行对比研究。

维克斯利用一款名为“剽窃”的软件对《爱德华三世》剧本和同时期莎士比亚其他作品进行对比研究。分析后发现,这部剧本与1596年前的莎士比亚作品出现相同短语200处,当发现200处短语与莎士比亚剧作相符时,几乎可以肯定这部剧本也出自莎士比亚之手。但这些匹配情况只出现在4场,即40%的剧本中。

这款名为“剽窃”的软件由荷兰马斯特里赫特大学开发,其初衷是为了检查学生是否有抄袭行为。软件会从已知作者的作品中“学习”三个单词以上的短语,然后在另一作品中搜索这些短语。

他说,当发现200处短语与莎士比亚剧作相符时,几乎可以肯定这部剧本也出自莎士比亚之手,但是无人能说出为什么剧本其他部分里却包含明显不是莎士比亚风格的诗句。

他经过进一步研究发现,剩余部分剧本的写作风格与当时另一位剧作家托马斯基德相同,因为其中包含约200处与基德作品中相同的短语。他认为,这表明该剧有60%是基德所作。综合分析认为,这部戏剧由莎士比亚和基德共同完成。

基德的代表作《西班牙悲剧》被认为开创了英国复仇悲剧先河,对莎士比亚戏剧有重要影响。

维克斯的最新研究成果并未使争议结束,反而引发了更多人的怀疑。莎翁故居信托管理机构负责人斯坦利韦尔斯说:“仅凭一款电脑软件就确定剧本作者的方法难以令人信服。没有亲自深入研究,就不能轻易得出结论”。也有人认为莎士比亚的地位如此之高,没有必要与别人合写一部剧本。但英国沃里克大学教授乔纳森贝特说,与往常人们心中那个“孤独才子”相比,这一研究成果反映了更为真实的莎士比亚。韦尔斯也说,把莎士比亚请下神坛很好。“他不是高人一等的圣人,而是能与任何人合作的剧作家;他不是孤傲的神灵,而是我们中间一个普通人”。

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2024/12/23 13:21:52