如果我們假設搜索質量好的搜索引擎會在未來的一段時間中增加市場份額,用這些研究成果來預測搜索引擎的市場發展規律的話,幾乎全部的預測都是錯誤的。那麼評價一個搜索引擎好壞的標準是什麼?

誰能回答李彥宏給武大信息管理學院出的研究生課題?

武大聘我做兼職教授,並且要求要帶研究生。我想了想,目前決定給那些申請我研究生的同學出一個課題,看看大家的反應。

當今世界搜索引擎風起雲湧,就搜索技術而言,工業界一直領先學術界。每個主流IT公司都在搜索技術上有很大的投入,競爭頗為激烈。但搜索引擎的評價標準,業界一直沒有一個統一的看法。大學、研究機構、媒體、投資領域都曾多次嘗試對商業搜索引擎進行評測,發表了研究成果。但如果我們假設搜索質量好的搜索引擎會在未來的一段時間中增加市場份額,用這些研究成果來預測搜索引擎的市場發展規律的話,幾乎全部的預測都是錯誤的。那麼評價一個搜索引擎好壞的標準到底是什麼,我認為這是一個極其有意義的研究課題。

請據此列一個研究計劃,一週內提交給我。我將決定誰會成為我的「研究生」。


關鍵看分析日誌。

搜索引擎的目標是幫助(自動補全)用戶以最快的速度(響應時間)找到其最滿意的結果(結果點擊分析)。但是這個講講很簡單,真正的評判標準是什麼??還是看日誌。

一、對某一個關鍵字的某一次搜索結果,分析日誌,看看用戶對結果的點擊情況(點擊了第幾條結果,是否點擊分頁),點擊了幾個(零個或多個)結果後更改了關鍵詞,每次搜索結果帶來了持續點擊量有多少?

二、還有就是關鍵字自動補全,用戶使用這個功能的比例是多少,使用這個功能後,對點擊結果的分析,同一。

三、搜索引擎的糾錯功能,關鍵字糾錯。出現率、點擊率、後續點擊分析,同一。

四、響應時間。不同響應時間下,上面三種分析的不同結果。

以上是對類似百度、谷歌這種搜索引擎來說,還有一類是淘寶這種的電商搜索引擎。

那麼好壞就更加直接了,pv的提升量,商品點擊率提升量,訂單轉換率提升。還有上面提到的一些漢指標


能不能實際的將網頁與查詢詞兩者,自動分類,分別匹配到各式的搜索需求裡面,並對應著以此給出排名。

這是一個能與不能的二分問題,所以不能說一個搜索引擎究竟有「多好」,但至少能說明一個搜索引擎是「好」的,至少遠好於目前的百度。

比如一個最簡單的例子,「SEO是什麼意思」,用這個詞到Google搜索,沒問題,會看到一堆頁面確實解釋了SEO是什麼。信息類直接型的查詢詞,匹配到信息類的網頁,很合理。

到百度去搜索,完蛋了。可以發現只要網頁在標題裡面出現過「SEO是什麼意思」,排名就可能上去,不管網頁實質上是屬於哪類的。因為百度逃避了真正的搜索需求問題,而偷懶的通過分析搜索行為等方式,將其簡化成了最原始的詞項分析。

而搜索量小的詞沒有多少搜索行為可分析,所以。。。搜索質量就那什麼了點。此時百度只是全文檢索引擎的升級版,除了詞項權重外,僅加入了鏈接權重、與查詢詞無關的文檔權重,但將最重要的用戶需求置之不顧。

百度也不是完全沒有處理用戶需求問題,只是方法特別囧,比較遭人罵。

比如上例中,「SEO是什麼意思」,百度看到查詢詞裡面有「什麼」,知道了百度知道(好繞口)能符合這些信息類需求,就優先把百度知道列上去;看到了「什麼意思」,又知道了百度翻譯能符合用戶的胃口。這就是百度偉大的阿拉丁計劃中的蛋疼一環。。。
對通用搜索引擎來說,傳統的標準:查準率,召回率,索引量,查詢速度,去重,索引更新速度等對垂直搜索引擎來說,行業內信息量,信息展示模塊的用戶體驗

現在比較新的要求:準確理解用戶查詢意圖,包括前些年很熱的」個性化搜索「都可以歸結到這裡面來。前一陣聽了一期主題為智能演算法探討的TUP報告,裡面有邀請搜狗的一位研究員分享搜索意圖方面的內容。其中有提到一個例子:搜索搜狗輸入法。有的用戶的輸入是」搜狗拼音輸入法「,有的輸入的是」搜狗的 最新的 輸入法 拼音的 下載「。如何讓計算機更好理解用戶的意圖是未來做好搜索的關鍵


每個人網路的接觸範圍是有限的,如果我們摸透了一個人的脾氣,將他經常接觸到的放到他的面前。或許他就不用去搜索。 百度新首頁和目前形形色色的導航,貌似可以解決這個問題。但是並不完美。

搜索引擎或許可以通過大量的收集數據,來判斷一個人在網上瀏覽的信息【接觸範圍】。另外在適當推薦可能感興趣的信息。

之前看過兩篇文章,

訪客如果能很方便的找到自己想要的東西,他就不會去搜索,這個說法好像還是來自淘寶碳酸志。

另外一個是說百度已經開始沒落了。 例如,我們想娛樂的時候不是搜索「小遊戲」而是搜索4399. 某人秤這種現象為定址搜索。

定址搜索現象越嚴重,越說明百度的搜索結果當中提供給我們的信息無用,百度的用戶體驗越差。所以大家需要記網站名稱和網址來搜索,才能到達目標網站。

寫的有點亂七八糟,希望對樓主能有所幫助。
搜索引擎的好壞主要是對用戶而言的吧,而用戶主要需求是:一,反應速度要快,能夠在最快的時間內返回搜索結果二,搜索結果要準,能夠返回最貼近用戶想要的答案最後個人小建議,貌似現在百度搜出來的網站會有一些是帶病毒的,希望能把安全因素考慮進去
推薦閱讀:
相關文章