寫在前面的話

10月份一直在出差,先是去溫哥華參加推薦系統大會,之後再去舊金山公司總部,一直沒有時間在專欄寫文章,這篇文章用來回顧一下今年10月份在溫哥華參加2018推薦系統大會(RecSys 2018),來八卦推薦系統的各種人和事情還有自己的一些想法。這雖然不是技術文章,沒有講機器學習當中方法的由來和背後的數學,但是希望在機器學習之推薦系統整體把握上對各位有所幫助,並獲取到一些有用的資料。

為什麼要參加RecSys

RecSys是一個學術會議,中文全稱是推薦系統大會,2018年已經是第12屆了,也是工業界非常關注的一個會議,今年長短論文一共有70篇左右,除開主會之外,主會之前還有Tutorial,主會後有Workshop。作用機器學習工程師,為什麼要參加學術會議?很多人不禁會有這樣的疑問,實話說我第一次聽到同事問我要不要參加RecSys的時候,我也覺得有些驚訝。在會議上碰到一些國內過來的同行,問一下他們過來的原因,大多都是工作年限比較長,希望在這裡學到更多新的內容的工程師,在大方向上為公司把關,沒有出現過像我這樣工作第一年就來參會的情況。我們公司鼓勵並支持大家參加各種會議,不管是偏學術還是偏工業,希望大家通過這些活動不斷提升自己,為公司創造更多的價值。如果你想加入這樣AWESOME的公司,Tubi 剛好在找AWESOME的機器學習工程師。

機器學習工程師?

chinateam.tubi.tv
圖標

RecSys的那些人

做推薦系統的話,大家可能都知道Cousera來自明尼蘇達大學上面的推薦系統課程,其主講人Joseph A.Konstan,也是GroupLens的主要力量之一,大家聽說過的MovieLens資料庫,也是這個組的貢獻之一,Joseph在一個Workshop也被邀請作為特別嘉賓作演講。Joseph作為最後一作者的論文有Interpreting User Inaction in Recommender Systems,其作的分析蠻有意思,一作是Qian Zhao,我還向他要了slides,文章分析了用戶為什麼對被推薦的內容沒有點擊,收藏,播放等行為。

和明尼蘇達大學有關的論文還有另外三篇,其中特別想提到的是Categorical-Attributes-Based Item Classification for Recommender Systems,其作者之一是來自Google Brain的Minmin Chen,她被邀請作為第一位嘉賓在Workshop on Offline Evaluation for Recommender Systems作題為Off-Policy Correction for a REINFORCE Recommender System的演講,展現了強化學習在Google工業級的應用達到了效果上的顯著提升。在這篇論文的另外一位也是來自於Google Brian作者Ed Chi,在明尼蘇達大學完成本科,碩士,博士的學習,現在是在Google的Title是Principal Scientist and Research Lead。

還有遇到有華為諾亞方舟過來的一些同行,他們有做華為應用市場App推薦之類的。在大會最後一天有幸與其中一位在溫哥華的Granville Island巧遇,瞭解了更多明尼蘇達大學的事情,他也有在GroupLens交流過,每年都參加recsys,希望下次recsys可以再見。

還有有幸見到

  • 在Google做Youtube作首頁推薦的朋友
  • 在Apple London辦化室研究核心音樂推薦問題的年輕人
  • 在Zillow做房子推薦系統的朋友
  • 阿里巴巴做推薦的朋友,還有阿里巴巴加州辦公室的朋友
  • 在London創業的朋友,專門提供文章的推薦服務
  • 從Hulu跳到Facebook的做機器學習平臺的朋友
  • 百度元老級別人物
  • Spotify以及Pandora的朋友

還有歡迎鼓勵大家也參加2019年的recsys的下次工業界聯合主席Tao Wang。

幾乎全世界和推薦系統有關的朋友都出現在這個大會上面,當然Tubi TV也不會缺席,??。

RecSys的那些事

看Minmin Chen的Linkedin發現其也有在Criteo工作的經歷,有意思的是此次大會的Best long paper也是來自於Criteo,是Stephen Bonner,論文題目是Causal Embeddings for Recommendation,研究了基於推薦效果,或者說推薦指標的Embedding,與之前利用矩陣分解之類等非監督學習的方法計算Embedding相比有顯著的不同,這個論文我還在研究當中。

另外還有特別有趣的是此次大會的Best short paper第二名,是來自臺北,HOP-Rec: High-Order Proximity for Implicit Recommendation,這個工作將協同過濾和矩陣分解兩個技術結合起來在各個資料庫上都達到了更優的推薦效果,作者還將代碼開源,cnclabs/proNet-core,代碼可讀性非常好,同時還提供一其它一些論文的實現代碼,包括很有名的DeepWalk: online learning of social representations等。

說到代碼,這次大會主會前的Tutorial,有介紹基於Tensorflow的推薦系統的開源框架openrec。如果你在尋找基於Tensorflow的推薦系統框架,這個項目是個不錯的選擇,同時還從參會的人當中瞭解到還有基於pytorch的推薦系統的框架Spotlight,大家有興趣的話也可以看看Spotlight,總體來講Spotlight相對來說在Github社區更流行。

還有一個比較乾貨的Tutorial是Sequence-aware Recommendation Tutorial,兩個主講人都來自Pandora義大利辦公室,這個Tutorial提供了非常詳細的Python Notebook代碼,比較了各種模型的效果,包括Most Popular, Frequent Sequence Mining, Markov Chain, FPMC1, Prod2Vec, Session based RNN和Personalized RNN。對於初學者非常友好。

還有一篇乾貨滿滿的是Deep neural network marketplace recommenders in online experiments, 作者來自挪威的一家電子商務的公司,文章介紹了他們對商品的混合表示,包括商品自有的一些特徵,包括圖片,類別,標題等等,還有利用用戶在商品上面的行為生成幫助協同過濾的特徵。還介紹了線上的bandits系統,可以通過在線學習,來調整對新增加的推薦模型的喜好。

結束的話

參加推薦系統大會,對整個生態系統還是會有一個比較全面的認識,研究推薦系統的機構有哪些,整個推薦系統的最新進展如何,未來的發展趨勢怎麼樣,工業界又有什麼新的應用等等。不管在學術界,還是工業界,如果有條件,都可以儘早去參加類似的大會,對你在這個領域的開始,或者提升都非常有幫助。

Tubi 非常關注工程師的發展,鼓勵並支持大家去參加各種大會。北京辦公室,舊金山辦公室都有職位開放。

比如Tubi 北京辦公室找

機器學習工程師?

chinateam.tubi.tv
圖標

RecSys2019,哥本哈根見。

參考資料

  1. Rendle, S., Freudenthaler, C., & Schmidt-Thieme, L. (2010). Factorizing personalized Markov chains for next-basket recommendation. Proceedings of the 19th International Conference on World Wide Web - WWW 』10, 811

說明:

文章當中提到的人名,如果你本人有看到,並覺得不合適之類的,請告知我,非常抱歉,我會及時刪除。

推薦閱讀:

相關文章