请输入您要查询的百科知识:

 

词条 网络链接分析法
释义

Mc Kiernan于1996年首先提出了sitation这一新术语,用以研究网页之间的引用关系。Roussea认为对网页链接关系的研究与对发表文章的引文研究相似,但又不尽相同。他对网址的分布模式和进入网页的链接作了分析,发现在他所研究的343个网址中最高层域名服从洛特卡分布,而且对这些网址的引用也符合洛特卡分布,自引比例约为30 % 。

网络链接分析法

目前网络链接分析法的开展,都或多或少跟网络影响因子的测定联系着。如邱均平教授在《中国大学网站链接分析及网络影响因子探讨》这篇文章中所得出的关于现阶段中国大学影响力这方面的结论,就是在收集了相应指标数据的基础上,运用网络影响因子对国内各主要大学(广东管理科学研究院2002年最新排名前100名的大学)网站的网络影响因子和各大学排名之间的关系进行了研究。杨涛在《网络信息计量学实证研究:对国内20个大学网站的分析》这篇文章中也应用了相类似的方法进行网络链接分析,并得出了一些结论。除这两位学者之外,还有其他一些学者就此领域作了大量的研究,如段宇锋博士在其博士论文中提及的网站链接数量特征(网站链接总数、指向内部的链接数、指向外部的链接数、被链接网站数)、网站链接分布特征(链接密度、网页平均链接数)和网站影响力指标(网站被链接次数、网站影响因子、扩散系数),这些均可以从不同的侧面来说明网络链接分析法。

网络影响因子

(Web impact factor)是Ingwersen受了期刊影响因子的概念影响后于1998年提出的用于评价网站在网络上影响力的一个指标。网络影响因子是Ingwersen在1998年所发表的一篇题为《关于网络影响因子的计算》(The calculation of web impact factors)的文章中提出的,在文章中,Ingwersen对计算网络影响因子的可行性和可靠性作了研究,同时他还给出了网络影响因子的定义:假设某一时刻链接到网络上某一特定网站或区域的网页数为a,而这一网站或区域本身所包含的网页数为b,那么其网络影响因子的数值可以表示为WIF= a/b。

这里需要引起注意的是,在定义中所提到的网页数目之和并不是指链接次数的和,而是所链接的页数目之和。

通过对7个国家(挪威、英国、法国、丹麦瑞典、芬兰和日本)网址和4个主要域名(gov,org,co m,edu)的研究,

Ingwersen得出了3个有趣的结论

1、由于用作搜索引擎的Alta Vista只能统计链接到某个网页的网页数目而不是链接的次数,因此自链接不会影响网络影响因子的结果。4个主要域名的自链接Web-IF值平均为0.55,“com”的自链接Web-IF值为0.59,平均来自外部的链接页的Web-IF为0.39

2、对于非主要域名的个人网址,其Web-IF的可信度要小得多。在作Web-IF计算时可以利用计算结果发生的变化作为评价网络引擎性能的一个测度。

对于第2个结论,Smith和Thelwall也分别作了研究,但遗憾的是他们几人的研究使用的均是不稳定版的Alta Vista,因而,他们均对引擎的覆盖范围和检索性能产生了怀疑。Thelwall认为,现存的网络影响因子的概念在实际应用中还只是一个相对粗浅的提法,因而所得出的结论也存在很多问题。由于Thelwall对网络影响因子也颇有研究,故他也有自己的定义。他认为,网络影响因子的大小是链接到某网站或特定区域的网页数与该网站或区域的大小之比。该网站或区域的大小并不一定局限于该网站的网页数,也可以用其它指标来衡量,如对学术机构的网站进行研究时也可以是该机构的研究人员数、该机构的研究经费或全日制学生数等等。

比较这两位学者的观点,在这两种提法中,Ingwersen的提法要容易理解一些,但Thelwall的提法则严谨一些,它还考虑到了网络链接的特殊性。为了研究易于进行,我们可提倡Ingwersen使用的研究方法,他使用了Alta Vista搜索引擎中的指令来测量链接网页的数目。

相关名词

Link:指链接到一个Web空间的网页。例如“Link :*.nz ”指到新西兰域的链接,星号 “*”确指一带有到nz域的链接的网页被找到,而不是带有nz文件名的网页链接。在Alta Vista帮助页面里没有注明星号的使用,但是搜索到的文献样本表明“Link :*.nz”这种格式给链接到顶级域名的网页数做了最好的估计。

Domain:指在顶级域名里的网页。例如“Domain:au”指那些在澳大利亚范围内的网页。

Host:指在子域的网页,例如“ 我们可使用Alta Vista去计算网络影响因子(WIF),Alta Vista提供布尔逻辑操作,这些操作使复杂的搜索被执行。以New Zealand (新西兰)Web空间为例,我们可进行如下操作:

D Domain : * .nz 这是对此空间里整个网页数的估计。

L Link :* .nz 这是到空间里网页的所有链接。

L1 Link : *.nz/ and Domain : nz或Domain : nz and link : *.nz/ 这是自我链接数目。

L2 Link : *.nz /and not Link : nz and或Link:*.nz and not( domain: nz and link:.nz)或Link: .nz and not (link : .nz/ and domain:nz)这是指外部链接数目。

WIF

这样我们可以计算出Web空间三个WIF:

 自我链接Web影响因子,测量所测Web空间自身页面之间的链接,其值为L1/D。

 外部Web影响因子,测量外部链接到所测Web空间的链接,其值为L2/D。

 整体Web影响因子,测量到Web空间的所有链接,其值为L/D。

外部WIF是Web空间以外站点链接到Web空间内站点的程度,外部WIF是Web空间的影响的最好反映,整个WIF的趋势似乎紧随外部WIF的趋势。事实上,域里网页数与它的外部影响因子一般成反比关系。

由于WIF是测量每个页面平均链接数,它们既受链接程度的影响,又受Web空间页面数目的影响。在研究的某一个域里,页面数越多,外部WIF越小,有很少页面的域有很大的外部WIF。因此应该谨慎对待某一个域外部WIF,外部WIF仅仅用于比较具有相似特征的域。

链接分析法仍然存在很多问题

但是链接分析法仍然存在很多问题。随着研究的深入,人们越来越发现文献之间的引用与网络信息之间的链接存在着显著的差异。譬如,Stephen P.Harter和Charlotte E.Ford的研究发现,在指向电子期刊的网络链接中,有近半数是结构性自我链接,对于评价文献的学术价值和研究学术交流行为没有意义;具有指向电子期刊的链接的网页,只有不到8%的网页是学术性的;Thelwall通过对英国大学网站中被链接次数最多的100个网页进行分析,其结果也表明网页被链接次数并不能反映其学术价值。这使得研究者们开始重新反思网络链接分析研究领域最基本的问题

网络链接的本质

目前已经达成的共识是网络链接与引文在本质上完全不同,虽然引文分析对我们开展网络链接研究具有一定的启发作用,但在借鉴时应当充分考虑到两者之间所存在的差异,对运用该方法取得的结果应进行相应的处理。

有些学者指出,通过区分不同类型的链接,给予不同的权值,严格限定其使用范围和改进搜索引擎的性能或研制专业链接分析的工具等方法,可以改进链接分析法的效果和排名。

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/3/25 8:41:58