以馬上閱讀到推薦給他的來自己於互聯網最新最好的又與他最感興趣的信息(或視頻,或音樂,或文章,或圖片),在一個創業公司里,要推薦給用戶最好的信息,除了有好的推薦演算法,用戶流量也是一個很大的瓶頸,要不如何獲取用戶的行為呢?


1、對於信息過濾器,我作為技術出身,本能地不喜歡人工編輯和少數人人肉過濾器(如果你喜歡少數人看門人模式,那請你買雜誌和報紙即可),而更強調機器智能和群體性智慧佔80%、人工干預佔20%。2、請參考我很久以前寫的文章:《個性化閱讀的過去、現在和未來(一)·概述

》和《個性化閱讀的過去、現在和未來(二)·實作

》。3、我同意毛世傑的說法。演算法多如牛毛,真實奏效的也很多。但是不同領域的信息過濾器肯定要用不同演算法的組合。
難點在於信息的篩選、編輯、推薦。

互聯網的那點事 做的就是這個。


不久之前,只有少數精英人物才能發表和出版他們的學術著作或其他形式的創造性作品。起碼在人類文明的早期階段,情況是這樣的。然而,即便是那些富豪、權貴和才子,也無法確保自己的作品可以面世。傳媒公司和出版商對預期銷量不大的作品都不太感興趣,畢竟他們也得賺錢謀生。


但是,近年來的確出現了一些不同尋常的變化。只要能上網,誰都可以和世界各地的人們分享自己的故事、文章、視頻、照片與哲學思考,幾乎毫無障礙,不費成本。結果,互聯網已經演變成一個彙集人類經驗和知識的日益廣闊的天地。雖然這種信息民主化讓我們對整個世界有了更加豐富的了解,不過還是存在一個小問題。


無論哪一天,都會有大量的信息內容期待著我們的關註:電子郵件、文本信息、即時消息、博客文章、微博發言、網站更新、維基百科、視頻短片,如此等等。當然,這些是在常規的圖書、報紙、雜誌、廣播、電視及其他形式的大眾傳媒之外的信息內容。所有這些信息都觸手可及,從很多方面來說,這是一件極好的事情。可是,我們如何吸收這些傳媒信息呢?


雖然信息看起來是無限的,但是我們的時間和精力肯定不是無限的。無論一個人的記性有多好,面對這些無窮信息,哪怕只是其中的一小部分,我們誰也不可能完全記住。我知道,假如我知難而上,力圖記住那麼多信息,那麼我的大腦很快就會像一台不堪重負的汽車發動機一樣,呼呼地冒出黑煙。

幸運的是,我們接收的絕大部分信息都沒有必要記住。實際上,大部分信息都不值得我們記憶。譬如,如果不是為了準備地理考試,我為什麼要記住石鐘乳和石筍的區別呢?假如我發現自己需要了解這一事實,在維基百科或 Google 搜索上查查就行呀。在網上信息無所不有的今天,由於無線上網服務無處不在,並且諸如 iPhone(蘋果公司研發的智能手機)之類的移動終端設備集成了互聯網服務功能,無論我身處何方,都可以提出任何問題,而且在網上基本都能找到答案。


在日常生活中每次需要了解一條信息的時候,都登錄 Google 搜索,這不是真正的高效,甚至也不現實。一方面,我們不需要把所有信息都滴水不漏地記住;另一方面,在上班工作中,在日常生活中,在組織安排中,我們需要方便地獲得信息。很多信息對我們這個世界來說具有特殊意義,但是沒有必要銘記在心。對於所有這些信息而言,準備好某種組織方法是至關重要的。


我來舉個例子。比如說我們兩個初次見面,你遞給我一張名片。我相信你是一個好人,可是我何苦要記住你的電話號碼呢?在我早已不堪重負的大腦中,根本沒有必要再讓一個電話號碼去佔據記憶空間。況且,即使我願意盡量記住你的電話號碼,在沒有深入了解,也沒有與此相關的故事的情況下,大概怎麼樣都記不住,因此我乾脆就不去記了。這可沒有對你不敬的意思。然而,不記你的號碼,可不意味著需要找你的時候,我不會給你打電話。我會直接把你的號碼存在電腦和 iPhone 手機中,這些工具在數據存儲方面可是比我的記性好多了,而且隨手可查。


我們最終面臨的挑戰是:面對每天洶湧而來的各種信息,我們怎麼知道什麼信息應該置之不理,什麼信息需要在電子設備或者紙質載體上保存下來,以備今後需用,而什麼信息又該在大腦當中記住呢?這還只是第一步。一旦我們確定什麼信息需要常備手頭,我們又如何知道存儲和組織信息的最新方法是什麼呢?至於要在大腦當中記住信息的時候,怎樣幫助自己成功地記住那些信息呢?這是本章所要討論的中心議題。

最低 0.3 元/天開通會員,查看完整內容

購買該電子書查看完整內容

電子書

Google 工作整理術

道格拉斯·梅里爾 等

中信出版社

¥27.00 會員免費


其實,在這裡面,演算法算個屁啊。真正難以把握的是用戶個性化的屬性和需求。


我本人感覺這個很有前景,有這個信息推薦的話,我們可以節省很多時間,但難點是怎麼準確的推薦個人感興趣的東西。
最有價值的信息?這本身就是個相對的概念,每個人的想法不同,主觀意念不同,所感興趣的,對於自己最有價值的都是針對不同的個體來說的,所以在信息爆炸的時代(ˇ?ˇ) 向受眾推送符合各自興趣的內容以滿足受眾的需要是有一定難度的。
個人感覺個性化推薦現在最大的瓶頸就是無法得到足夠多、足夠準確、足夠詳細的用戶信息和行為日誌,當然這些問題在不同的應用場景下會有不同程度的影響。歷史記錄準確性問題在一些任意性強的內容瀏覽等場景下較突出,而信息詳細性問題指諸如無法從不過量的簡單日誌中判斷興趣程度等。中間的推薦演算法的問題在於複雜度和效果需要折中,但目前來說應該不算最主要的短板。
同意樓上,剛看了一個數學系博士做協同過濾的論文,真多演算法

已經有人在做了:

關於面向個人/家庭的信息管理庫(側重信息過濾與內容篩選)關於面向個人/家庭的信息管理分享(側重信息過濾與內容篩選)


同意樓上,如果能夠積累更多的用戶屬性和用戶行為,那麼對於演算法的依賴就變得不再那麼重要。
可以參考下《搜索引擎-信息檢索實踐》這本書中第十章 社會化搜索 這章,裡面介紹了相關的方法模型。http://book.douban.com/subject/4861766/
推薦閱讀:
相关文章