本來來自寧缺SEO博客

作者寧缺

原文地址:網站收錄與索引的祕密

前段時間在與同事一起喫晚餐的時候,在微信朋友圈看到同樣在 做SEO的一個朋友提了這樣一個問題:收錄跟索引到底是什麼關 系,為什麼有時候收錄大於索引,有時候索引又大於收錄?

當時由於時間上的關係,便在朋友圈簡要的回復了一下前半個問 題,大致內容如下:

網頁被spider抓取之後,如果網頁裏的信息spider認為是有價值 的,便會進行收錄。而被收錄的網頁spider會進行分類,分別放 入不同的資料庫。不同資料庫裏的網頁會被spider進行相應的排 名,所以當網民進行相關信息的搜索時,搜索結果頁展現的便是 資料庫裏網頁的相關排名位置。總之,有收錄才會有索引。

今天在這裡意在對後半個問題表達一下個人看法,也有對前半個 問題的補充與完善。

所謂的收錄其實指的就是網站收錄,更直白的說是網站頁面被 spider發現、分析後認為有意義然後被搜索引擎所收錄。

索引指的是被搜索引擎收錄的網頁進行建庫處理,並等待網民索 引,而在索引過程中會有一個篩選的過程,也就是有效索引與無 效索引。

上面的解釋連貫起來大致就是這樣的一個流程:抓取-收錄-篩選 -索引(這也是百度站長平臺官方給出的流程)。也就是網頁先被收錄,然後搜索引擎將已收錄的網頁庫進行篩選把有價值的頁 面索引出來呈現給網民。

既然收錄與索引是這樣一個關係,理論上收錄的數量應該大於索 引數的。然而不少seo的朋友和個人站長卻會發現索引大於收錄 的相反的情況,下面就讓我們來看看收錄量與索引量的區別。

1.收錄大於索引

理論上收錄是大於索引的。在網站收錄良好的情況下,索引量略 低於或者與收錄量大致持平是一個比較健康的狀態。

而如果收錄量高於索引量太多,那我們就應該去看看這種情況是 一直存在還是近期出現。如果是近期纔出現這樣的情況,就要去 分析近期網站因何種變動讓網頁的索引量出現瞭如此大的波動; 如果一直如此,就要去認真考慮網站的結整體構、質量、權重等 等是否存在較大問題且處於同行業的較低水平。

2.索引大於收錄

這個其實就有點矛盾了,畢竟有了收錄才會有索引,那麼充其量 索引也只會跟收錄量持平而已,又怎麼會大於收錄呢?原因可能 如下:網站存在一定數量的重複頁面,在這些頁面啟用了301跳 轉之後,因為過濾所以我們查詢到的收錄量是比索引小的;索引 量數據查詢結果存在大概6小時的時差性,收錄量的數據是實時 的,期間鏈接可能因為一些不正當的操作等原因造成收錄量的下 降,因此可能會出現索引大於收錄。

當然,關於收錄與索引的關係還有另一種相反的說法,感興趣的 朋友可以去了解一下。這裡只是博主在參考官方給出的關於收錄 與索引的流程而產生的一些個人猜想。如果大家有更好的見解, 希望在文後留言,以供大家一同學習、進步。


推薦閱讀:
相關文章