黑客能通過頭條這類聚合應用給你定向推特定的內容嗎?
比如你從不看軍事,但不定期的在一個時間段內,每一刷都有軍事方面的內容。
肯定可以,劫持頭條的後臺就可以,改變推送內定的演算法,變為批量給軍事就行;你在頭條經常看軍事,它都會不停推軍事,這個對象是你,你說的對象是全體用戶,肯定可以的。
但是沒必要。意義不大。
簡單給你說說頭條的推薦原理吧
今日頭條演算法推薦系統,主要輸入三個維度的變數。
一是內容特徵,圖文、視頻、UGC小視頻、問答、微頭條等,每種內容有很多自己的特徵,需要分別提取;
二是用戶特徵,包括興趣標籤、職業、年齡、性別、機型等,以及很多模型刻畫出的用戶隱藏興趣。
三是環境特徵,不同的時間不同的地點不同的場景(工作/通勤/旅遊等),用戶對信息的偏好有所不同。
結合這三方面緯度,今日頭條的推薦模型做預估,這個內容在這個場景下對這個用戶是否合適。
如何理解呢?
1、內容特徵,好理解,既是對各類文章、視頻提取關鍵要素,比如可以通過對文本進行語義識別,識別出文章的主要關鍵字,視頻標題關鍵字如何,這個工作主要目的是對文章進行畫像,方便以後對客戶推薦。至於能否做到視頻內容的關鍵字提取,比如雖然標題是周杰倫相關視頻,但視頻內容全部是方文山的帥氣身影,能否將視頻中方文山這個關鍵字提取出來,則暫不可知,這個工作需要耗費巨大伺服器資源,估計頭條暫時還沒有做吧。
2、用戶特徵,同上面內容特徵一樣,提取你的有效數據,比如經常瀏覽哪種類型文字、你經常搜索的關鍵字、你註冊時登記信息的內容、還有原文提到的用什麼手機之類你是iphone我便顯示這個遊戲只能iphone玩,你是安卓我便顯示這個遊戲只能安卓玩、甚至精細的話可以將每個人的留言呀、評論呀等進行關鍵字提取
比如你經常評論歷史內容文章,即使你瀏覽此類文章比較少,但是也可以作為一個關鍵指標進行使用,通過以上各類方式最終形成用戶畫像,方便後面對你進行文章視頻推送。
舉個例子,比如在通信行業,我們經常會受到簡訊,推薦什麼什麼套餐、購買流量包之類,這就是通信公司通過客戶分羣、客戶畫像來實現的定向推送
以保證推送效果、節省推送成本,通信行業對一個人的畫像會多達上千個關鍵指標,用戶特徵的提取對推薦的準確度、有效度會起到相當大的作用;
註:畫像是指對一篇文章或一個人的關鍵點分析,通過這些關鍵點則可大體瞭解一篇文章或者一個人的具體形象。(3)環境特徵,比如獲取你當前所在位置是否在旅遊區,這個可以通過獲取你實時位置來實現然後與你之前經常出現的所在地進行對比等方式確認當前狀態,是在家還是在旅遊。
如果系統檢測到你在泰山遊玩,則可能會相應推送泰山的類似文章資料等等
再說說演算法原理層面!
推薦模型中,點擊率、閱讀時間、點贊、評論、轉發包括點贊都是可以量化的目標,能夠用模型直接擬合做預估,看線上提升情況可以知道做的好不好。但一個大體量的推薦系統,服務用戶眾多,不能完全由指標評估,引入數據指標以外的要素也很重要。
比如廣告和特型內容頻控。像問答卡片就是比較特殊的內容形式,其推薦的目標不完全是讓用戶瀏覽,還要考慮吸引用戶回答為社區貢獻內容。這些內容和普通內容如何混排,怎樣控制頻控都需要考慮。
此外,平臺出於內容生態和社會責任的考量,像低俗內容的打壓,標題黨、低質內容的打壓,重要新聞的置頂、加權、強插,低級別賬號內容降權都是演算法本身無法完成,需要進一步對內容進行幹預。
下面我將簡單介紹在上述演算法目標的基礎上如何對其實現。