请输入您要查询的百科知识:

 

词条 补充材料
释义

补充材料(Supplemental Result), 是Google辅助索引的一部分。对辅助索引进行抓取的限制少于主要索引。例如,一个网址的参量可能使该网站无法被抓取到主要索引中,但仍可能被抓取到Google 的补充索引里。

简介

根据Google 的说法,作为补充材料的网页,只是一种辅助、补充的索引,并不作为主要索引。也就是说,这些网页并非在Google 的主数据库中,而是在辅助数据库中。一般情况下,当我们在Google 上进行搜索时,它展现给我们的结果是主数据库中的网页,并非辅助数据库中的网页。由此可以得出结论,作为补充材料的网页,在Google 的表现会非常差。

根据一些搜索引擎关注者的观察,作为补充材料的网页,被Google 爬虫爬行的间隔时间非常长,很多时候几个月、甚至半年都不会被Google 爬虫造访,严重影响网页在Google 数据库中的更新。同时,这些网页的排名非常差,只有在搜索结果很少的时候,才会被Google 列出来。

一般情况下,根本无法在搜索结果里看见这些网页。如果网页被Google 列为补充材料,这对于网站来说是一件不幸的事情。被列为补充材料的网页,在搜索结果中的排名,都会表现非常差。如果网站本身的PR 值较高,情况会稍好一些。

被当做补充材料的原因

是什么原因造成了网页被Google 认为补充材料呢?从Google 自己提供的信息中,我们看不到任何有价值的资料。主要原因可能是网页的Head 部分的Description 书写不规范造成的和网页内容是复制的。

某位搜索引擎关注者曾经有6 个相同主题的网站,这些网站都是用同一个数据库生成的,其中有100 多个网页的内容几乎完全一样,而且都是用XHTML+CSS 技术制作。在这些网站中,只有一个网站的所有网页不是补充材料,其他的网站的页面,除了首页之外全部都是补充材料。因此怀疑补充材料是由于复制网页造成的。

在复制网页的情况下,补充材料是某一个特定的URL,而不是一个网页或者一个文件。一般来说是同一个文件,但是是两个不同的URL。这两个URL 有可能其中一个是正常网页,另外一个却是补充材料。

补充材料是针对特定的日期所抓取的网页快照,也就是说即使是相同的URL,在Google 数据库中也可能存在多个版本,其中一个版本是日期A 所抓取的新的内容,这个URL+这个特定的日期和网页快照,可能是在正常的数据库中。而另外一个日期B 所抓取的内容(同一个URL,比较老的内容),却可能是在补充材料数据库中。

在分析了不是补充材料的网站的网页后,还发现只有这个网站的Description 书写规范,Description 内容由成段的句子组成,与网页的内容吻合; 而被作为补充材料的网页,Description 内容书写得都很不规范,都是将关键词堆砌几遍。发现这个问题后,搜索引擎关注者将其中某些网站网页的Description 修改为规范的写法,以期观察。但是由于Google 几个月都不更新这些页面,无法观察到结果。于是,搜索引擎关注者又用同样的数据库,做了两个网站,这两个网站的内容与以前的网站几乎完全相同,但是Description 采用规范的写法。这两个网站被Google 收录后,所有网页都不是补充材料。

由此,得出结论,Google 补充材料形成的原因是: 网页的Description 写法不规范。

补充材料对排名的影响

这个问题就比较复杂,要具体情况具体分析。像前面讲的,同一个URL 可能出现在不同的数据库中,新版本的URL 可能会出现在正常的主要关键词的搜索中。但是在其他关键词搜索中,它也可能出现在补充材料中。

如果你的网站有很多补充材料,有可能影响排名。但是如果这些补充材料都有一个相应的新的URL+日期+网页快照版本,对排名的影响就不大。如果这些补充材料没有新的版本,影响就比较大。

怎样避免出现补充材料?

1. 网页的Description 写法不规范

解决网页被Google 列为补充材料的主要方法,就是规范书写Description 。不要在Description 里堆砌关键词,Description 的内容要与页面的内容吻合; 保持合理的网站结构,确保每个页面都有连接指向,并且连接不被埋藏得很深。

2. 有网址规范化问题。也就是带有www 和没有www 的两个网址版本都在数据库中,其中一个就有可能被标为补充材料。目前可以通过Google 提供的管理员工具来统一www 和无www 域名的网站。

3. 有时候已经被删除的网页,也就是实际上应该返回404 错误的URL,会被列为补充材料; 或者域名已经过期了,也有时会被标成补充材料。

4. 有时候站长在改动网页之后,新旧内容的两个版本的网页都会出现在Google 索引中; 糟糕的是,其中一个会被标为补充材料。

5. 复制内容网页。很多转载或抄袭的内容会被标为补充材料。因为Google 也没办法判断哪一个是原创的,所以有时候原创者也会遭殃。

6. 网页上相同或相似的内容太多。比如导航系统占网页内容比例比较大,而正文部分比较小。

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2024/11/15 17:32:30