本来来自宁缺SEO博客

作者宁缺

原文地址:网站收录与索引的秘密

前段时间在与同事一起吃晚餐的时候,在微信朋友圈看到同样在 做SEO的一个朋友提了这样一个问题:收录跟索引到底是什么关 系,为什么有时候收录大于索引,有时候索引又大于收录?

当时由于时间上的关系,便在朋友圈简要的回复了一下前半个问 题,大致内容如下:

网页被spider抓取之后,如果网页里的信息spider认为是有价值 的,便会进行收录。而被收录的网页spider会进行分类,分别放 入不同的资料库。不同资料库里的网页会被spider进行相应的排 名,所以当网民进行相关信息的搜索时,搜索结果页展现的便是 资料库里网页的相关排名位置。总之,有收录才会有索引。

今天在这里意在对后半个问题表达一下个人看法,也有对前半个 问题的补充与完善。

所谓的收录其实指的就是网站收录,更直白的说是网站页面被 spider发现、分析后认为有意义然后被搜索引擎所收录。

索引指的是被搜索引擎收录的网页进行建库处理,并等待网民索 引,而在索引过程中会有一个筛选的过程,也就是有效索引与无 效索引。

上面的解释连贯起来大致就是这样的一个流程:抓取-收录-筛选 -索引(这也是百度站长平台官方给出的流程)。也就是网页先被收录,然后搜索引擎将已收录的网页库进行筛选把有价值的页 面索引出来呈现给网民。

既然收录与索引是这样一个关系,理论上收录的数量应该大于索 引数的。然而不少seo的朋友和个人站长却会发现索引大于收录 的相反的情况,下面就让我们来看看收录量与索引量的区别。

1.收录大于索引

理论上收录是大于索引的。在网站收录良好的情况下,索引量略 低于或者与收录量大致持平是一个比较健康的状态。

而如果收录量高于索引量太多,那我们就应该去看看这种情况是 一直存在还是近期出现。如果是近期才出现这样的情况,就要去 分析近期网站因何种变动让网页的索引量出现了如此大的波动; 如果一直如此,就要去认真考虑网站的结整体构、质量、权重等 等是否存在较大问题且处于同行业的较低水平。

2.索引大于收录

这个其实就有点矛盾了,毕竟有了收录才会有索引,那么充其量 索引也只会跟收录量持平而已,又怎么会大于收录呢?原因可能 如下:网站存在一定数量的重复页面,在这些页面启用了301跳 转之后,因为过滤所以我们查询到的收录量是比索引小的;索引 量数据查询结果存在大概6小时的时差性,收录量的数据是实时 的,期间链接可能因为一些不正当的操作等原因造成收录量的下 降,因此可能会出现索引大于收录。

当然,关于收录与索引的关系还有另一种相反的说法,感兴趣的 朋友可以去了解一下。这里只是博主在参考官方给出的关于收录 与索引的流程而产生的一些个人猜想。如果大家有更好的见解, 希望在文后留言,以供大家一同学习、进步。


推荐阅读:
相关文章