準確地說這個時代,不能稱之為推薦系統的時代,這一個時代未能給每個用戶構建屬於他的推薦結果,沒有很好地解決個性化長尾問題,所以這個可以叫「前推薦時代」

這一階段推薦系統特點:

1). 推薦「功能簡單」「全局推薦」「沒有個性化」

2). 召回 & 排序邏輯都集中在離線,「推薦服務邏輯較輕」,只負責一些數據「去重」和數據「渲染」等功能。

3). 推薦召回 & 排序策略主要由「人工或人工制定策略」來定,當然也開始有「機器學習」介入其中。

1.1人工選品排序及運營

1.1.1人工排序

「早期」的推薦產品,主要靠平台「運營人員」依靠業務知識進行「手工配置」,策略投放也是基於場景相關性的「固定位置展示」; 這一階段主要出現在產品或場景構建初期,這時候條目量較小,主要是運營進行條目的篩選與選取。根據這些商品的點擊、轉化、訂單數據進行排序,這時候往往此場景只有一份條目排序,用戶訪問此場景時,將會「「千人一面」」地展示這些商品;當然也會從業務角度選取「重要且區分性較大」的維度,窮舉並構建若干列表;舉個例子,比如不同地區,不同性別需求會有差異,比如「印度人和中國人」「男性和女性」對於商品、資訊等條目的需求都會有很大的差異。

人工排序,由運營手動調整商品的排序,當「SKU少」的時候,小百個的情況下,人工運營不算繁重,但是一旦商品量起來,有幾萬商品時候,「工作量」可想而知。

1.1.2實時熱點

當然人工推薦和干預也不是一定存在弊端,在未來的很長時間都會繼續存在,因為某些「突發性」的事件和「時事熱點」在沒有好的輿情監控體系下(如果有,可以藉助此來做推薦),還是需要人工干預,因為熱點帶來的推薦效果也是很高的;比如「世界盃、奧運會、時政要點」「黑天鵝事件」,需要人工加入推薦列表。

1.2自然排名

1.2.1熱快全

自然排名最主要依賴三點:「熱、快、全」,「先做熱、後做快、再做全」。其中熱指的是通過某幾個維度選取並排序,快主要是考慮時間因子,全指的是個性化,這裡主要著重介紹熱。

那如何做「熱門推薦」呢?就熱門推薦簡單的方式,可生成多維度的熱門數據,熱門數據有各種排行榜,比如點擊的排行榜,購買排行榜等。當客戶需要熱門推薦的場景時可把熱門推薦生成的結果直接返回給客戶。另一方面,熱門推薦也可以捕捉一些場景,比如處理冷啟動。熱門推薦的結果通常有一定理論依據,比如按購買、銷量排序其實也是很多人容易接受的方式,在這部分也可以夾雜人工編輯的分析。

1.2.2舉個例子

比如B2C電商,先根據「用戶點擊率、頁面停留時間、購買次數」綜合考慮排序,要讓大部分用戶喜歡的產品排在前,但是「"一千個讀者心中有一千個哈姆雷特"」,不可能有一個讓每個人滿意的排序。大部分品類默認最佳的排序,應該是一個考慮了銷量、庫存深寬度、新品、價格區間等若干個因素的權重,最後進行綜合演算法的排序。當然也有電商會將多種常見商品排序枚舉給用戶,把選擇權交給用戶,比如「銷量、新品、價格、人工」等。

「按銷量」:對某個時間窗口內(近一個月、近一周等)賣得好的商品,這裡會讓新品幾乎沒有任何機會得到展示,馬太效應較強。

「按新品」:按商品上新的時間排序(按上架時間)。

「按價格」:用戶的購買力差異大,所以每個人對價格有不同的訴求,按價格排序。

「其他維度」(評論,收藏等):其它相關產品訴求。

▏1.2.3時間

前期產品冷啟動,沒有足夠的數據積累,熱門排序以「時間+人工運營」結合排序,即新上架的排在前,隨著中期數據積累及產品健全,再考慮其它因子影響排序。

▏1.2.4綜合指數

人氣排序(按綜合指數)則多維度考慮影響因子,「前期按時間順序積累一定數據後」「中期用戶喜歡的產品」(即轉化率高的產品排在前面,轉化率高相當於詳情頁內評論、商品屬性等信息對用戶有吸引力), 後期在物料(如商品)數量積累到一定程度,在「兼顧用戶體驗」的基礎上,可以考慮「毛利率」,用戶在信任該平台的時候,就可以推出「轉化率+毛利率高」的產品,默認排序是轉化好及毛利率高的商品排在前面,。

繼續以電商為例,下面介紹相關的排序因子,未來也會在個性化推薦中發揮重要的作用。影響商品綜合排序的因素有:單位時間的轉化率、點擊率、成交量、好評率、收藏量、退貨率、上下架、單位時間的銷量排名、復購率、頁面停留時間、瀏覽量、SKU的齊全率、收藏排名、活動類型(滿減/滿返/折扣)、庫存等,根據結合自己的平台列出影響商品排序的因素,前期可以酌情選擇部分;也會給所有因子的影響權重比例給他一個係數,並將上述若干因子按照權重比例係數進行融合

比如單位時間的轉化率為a,復購率為b,好評率為c,點擊率為d,SKU的齊全率為e、加購率為f,排序公式可能為「a(1-b)(0.5c+0.1d+0.03e+0.2f)」,這裡只是舉例,可能會有指數的權重影響排序,關鍵是每個排序因子的影響力,不同的影響力體現在排序公式中就是權重及計算方式(乘法、指數使重要的因子權重變高),針對「人群去制定不同的排序規則,可以針對不同群里的排序不一樣」。將所有排序因子分成兩類:升權項和降權項,升降權除了要考慮質量優劣的維度,也要考慮馬太效應。

其中會對權重的大小如何更合適,一般在「線上或測試環境」(真實數據)中跑一跑,並且有運營團隊+採購團隊參與「評測、賦予權值」,並不斷調整,如果條件允許(有埋點及數據收集)也會看看真實的用戶反饋數據,看看排序結果是否符合,不符合的話通過調整係數,也就是權重來進行優化。

1.3機器學習預估條目轉化排序

這一階段主要是通過「打點數據」,收集每個條目的曝光、點擊、加購、購買等,設定點擊率、轉化率等目標,通過「構建特徵」「訓練模型」,產出一份條目排序列表,並且訓練過程也通常通過「單機」完成。特徵往往也包括了我們上面介紹的若干排序因子,比如商品近7天的曝光數、點擊數、平均點擊率、轉化率、退貨率等。

誕生之初的推薦系統雖然非常簡陋,但是在設計之初,就預留好人工調整商品特徵權重的功能,產品同學可以快速的調整推薦排序策略來達到「人工智慧」的效果,前期也能較好的滿足業務需求。

▎對推薦、搜索、廣告和用戶感興趣的小夥伴可以閱讀下面的文章匯總

姚凱飛:推薦&搜索&廣告&用戶畫像&深度學習整理?

zhuanlan.zhihu.com
圖標

下一篇文章,敬請期待:

【四.推薦石器時代-2】自然排序與馬太效應


推薦閱讀:
相关文章