大數據帶來了「機器學習的原料」,個性化在此基礎上進行挖掘,但是也就帶來了問題,「大數據帶來了大計算」,想要獲取較優的結果,需要構建更加大的數據集,更好的模型去建模,由於「用戶決策的複雜性」,必然導致模型會往複雜方向發展(或者說往更「細粒度」的「多決策模型發展」)。
機器學習的核心就是「基於過去的事實和數據」,用來「發現趨勢和模式」;這裡體現的兩過程就是從「學習過程到決策過程」(配圖);傳統數據分析旨在回答關於過去的事實,機器學習模型提供了「對於結果的洞察力」,機器學習幫助揭示未來的一個結果的概率而不僅僅是過去發生的事情,回答關於未來事件的可能性的問題。在推薦領域的核心問題就是如何構建一個用戶對商品的評價模型。推薦系統通過收集用戶和商品數據,利用機器學習演算法構建用戶模型,最終影響推薦結果。形象地來說,我們通過機器學習構建了模型f(也可稱之為映射),然後我就可以用這個模型預測出人對商品的感興趣程度,即「f(人,商品)=人對商品的感興趣程度」。