推薦系統簡介
這個時代背景下,「信息爆炸」與「長尾問題」的其中一個主要解決方案是「個性化推薦」、「搜索技術」,前期我們先探討個性化推薦技術。那具體什麼是個性化推薦,怎麼去實現這一過程呢?這一章讓我們一起探尋個性化推薦的整個流程與技術概覽,後續章節我們會逐一展開。這一章讀者朋友需要做到的是讀完以後,對個性化推薦技術有一個「全局宏觀的認識」,對於「細節不用過多地苛求」。
? 1.1 一個例子
在日常生活中,你在打開淘寶購物可能會遇到以下若干情形: ????
1).和好友同時打開app後發現,為什麼兩個人首頁各個頻道「入口的圖片」以及「文字不同」? ?
2).為什麼同樣搜索可愛小背心,你和好友竟然出現不一樣的商品列表? ????
3).為什麼我剛剛瀏覽了褲子以後,首頁各個頻道的展現變了? ????
4).為什麼在對比好友的以上界面,我更喜歡我自己的界面?
【注】: 這裡頻道的概念是指「淘搶購」/「有好貨」/「必買清單」等電商頻道概念,不理解的讀者可以打開APP 以上情形背後的答案就是個性化推薦技術,當然也包含了相關的搜索技術。那淘寶是如何做到的呢,其實這背後就是涉及了數據的收集,挖掘計算,以及個性化呈現。
所以基於上面的問題我們又會問: ????
1).淘寶是「如何知道」我喜歡什麼並且可能「想要買」什麼的? ????
2).「為什麼」它能做到「每個人都不一樣」? ????
3).「為什麼」它要「這麼做」? 我們一個個來回答
? 1.2 淘寶是如何知道的
回答這個問題,其實背後是一套機器學習的方法在支撐,所以我們先要弄清楚「什麼是機器學習」。
▏1.2.1 機器學習概述
討論機器學習前,我們先看看什麼是人的學習,這裡主題是人。學習,是指通過「閱讀、聽講、思考、研究、實踐」等途徑獲得知識或技能的過程。學習分為「狹義」與「廣義」兩種,狹義:通過閱讀、聽講、研究、觀察、理解、探索、實驗、實踐等手段獲得知識或技能的過程,是一種使個體可以得到持續變化(知識和技能,方法與過程,情感與價值的改善和升華)的行為方式。廣義:是人在生活過程中,通過獲得經驗而產生的行為或行為潛能的相對持久的行為方式。學習後的主體「在未來」的生活中可以「將過去」學習到的「知識,技能」「應用」於生產生活,「來開展工作」。 ?
那從字面上來理解,機器學習就是將主體換為機器,並且它通過某種途徑來獲取知識或者技能的過程,並應用於未來的生活工作。人獲取知識的「外化載體」是書本,音頻,視頻等,「傳輸通道」是人的感官,處理中心是大腦,而對應於機器外化載體也同樣可以有以上各類信息源,並且使用各類「外放設備」收集信息,處理中心是「CPU與存儲」共同維護。 ????
人的學習有兩個基本方法,一個是「演繹法」,一個是「歸納法」,這兩種方法分別對應人工智慧中的兩種系統:「專家系統」和「機器學習系統」。所謂演繹法,是從已知的規則和事實出發,推導新的規則、新的事實,這對應於專家系統。專家系統也是早期的人工智慧系統,它也稱為規則系統,找一組某個領域的專家,如醫學領域的專家,他們會將自己的知識或經驗總結成某一條條規則、事實,例如某個人體溫超過37度、流鼻涕、流眼淚,那麼他就是感冒,這是一條規則。當這些專家將自己的知識、經驗輸入到系統中,這個系統便開始運行,每遇到一些新情況,會將之變為一條條事實。當將事實輸入到專家系統時,專家會根據規則或事實進行推導、梳理,並得到最終結論,這便是專家系統。而歸納法是「從現有樣本數據中不斷地觀察、歸納、總結出規律和事實,對應機器學習系統或統計學習系統,側重於統計學習,從大量的樣本中統計、挖掘、發現潛在的規律和事實」。