一、初識檢索
什麼是檢索呢?檢索是一種用戶和龐大的資料庫之間的互動行為。
檢索行為的發生是為了在龐大的信息羣中高效的篩選出關的信息。檢索行為的完成從宏觀上來看一般通過兩種方式,一種是搜索引擎,另一種是垂直搜索。搜索引擎有 Google、百度、搜狗等。而垂直搜索則是在大多數產品內置的對內容的檢索功能,淘寶中檢索各種商品,滴滴的出行場景起終點檢索都屬於垂直搜索。
我們從5W原則(when-where-what-why-how)來拆解檢索行為。
when-人們希望在海量信息中尋找到相關的信息;
where-於是他們打開了自己的手機應用或者電腦連接網路;
why-網路上的信息繁雜他們沒有辦法立馬找到自己想要的相關信息;
what-於是點開了搜索引擎,在檢索框內輸入了關鍵字;
how-隨後搜索引擎在海量的各類信息中迅速呈現給用戶相關的信息。
信息和信息量的哲學態 —— 信息是減少不確定性的東西,信息也是增加確定性的東西;信息量是一個信息能減少不確定性的度量,信息量也是一個信息能增加確定性的度量。
二、完成一次檢索的邏輯
檢索需求:滿足用戶在海量信息中迅速篩選出自己感興趣的內容
檢索外部流程:用戶檢索意圖 → 輸入的內容(關鍵詞/圖片/語音/二維碼等)→ 搜索結果(屏蔽部分結果)→ 搜索結果展現(默認排序和選擇排序)
檢索內部流程:用戶輸入query → query分析 → 索引&詞庫 → 內容篩選 → 結果召回→ 結果排序及展示
三、檢索策略框架