比如豆瓣的電影,影人等,可能翻譯就不一樣,如何保證大家添加的內容符合權威性呢?

之前有做UGC類的東西,可是發覺用戶自行填寫的內容非常紊亂,光拿美國一個詞舉例,就有 USA,U.S,美國等,後來不得不還是採取用戶選擇的方式來規避,請問這種現象如何來進行統一呢?


用戶的自由度和UGC的權威性顯然是一個權衡過程。這種權衡需要考慮用戶構成/內容性質/交互設計相匹配,從某方面約束用戶行為產生相似性,進而形成社區。沒有行為約束,沒有共性,沒有聚集,就沒有社區。例如,
  • 維基百科產品的內容高度聚焦,且參與門檻高,擁有骨幹羣體,用牢固的社區文化代替了產品設計上對用戶行為的約束;
  • Pinterest用戶背景、內容高度發散,所以需要輔助工具加強行為約束,這工具就是像內容分類、知乎的tag實時搜索/建議等等


用戶提交的內容有大量雜訊是不可避免的。但是用戶提交的內容也有一個好處:多。所以解決方法就是各種統計、排序演算法。
羣體的力量,人數足夠多的話,每個個體的選擇,最終會將問題引導到一個正確,符合主流的方向上去。我想豆瓣,WIKIPEDIA都是這樣走向成功的。靠的並不是演算法,或者什麼引導上的牛逼,是提供了一個平臺,又有一大羣願意貢獻知識的用戶。
就我個人經歷來看,內容處於一個從不被重視到再度提起的階段。

由於互聯網環境中可供選擇的產品越來越多,用戶遷移越來越容易,用戶習慣也會被從一個功能帶到另一個功能,功能的區別已經無法形成門檻,換句話說,技術的優勢已經有所降低。

用戶在互聯網中使用各個產品,瀏覽大量信息,本質上是要尋找對自己有用的信息。如何將有用的信息推送給用戶是接下來整個國內互聯網市場要迎接的挑戰。技術方面,通過演算法來記錄用戶習慣,更精準地推送用戶需要的內容是必然的。但並不是僅僅依靠技術就能完成這一項艱巨的任務。通過運營、內容維護、市場推送等手段來選擇優勢的內容資源已經顯得越來越重要。
如果想做到統一和有條理,可以預先提供固定標籤讓用戶點擊選擇而不是手動填寫;如果手動填寫可以用演算法預先推測用戶想添加的標籤,引導用戶選擇表達同一個意思的詞,比如「美國」和「美利堅」所代表的意思差不多,用「美國」比較普遍,當用戶輸入一個「美」字時,自動彈出「美國」讓用戶點擊選擇,減少分歧;另外也可以像知乎一樣編輯有幫忙修改的許可權,讓編輯對這些標籤進行整理。 不過話說回來不同人對同一個意思的東西會用不同詞語表達,多樣化也有多樣化的好處。


分類的方式、以及基本的語義識別。這些能稍稍改善條理性問題。當然,還是在創建的過程中去建立審核和識別機制,使用系統過濾、人工過濾雙重過濾的方式去對內容做一些整理工作,再由權重、用戶使用狀況等建立演算法識別。不過這裡面的技術和方法,基本是各大公司的一級商業機密了。
編輯人工合併,修改或者像知乎這樣,大家都可以編輯條目(可改為有一定級別用戶有相應許可權)


用戶提供的內容,肯定存在良莠不齊的問題,而怎麼聚合、怎麼呈現則體現在平臺的運營和數據處理能力了。
用技術手段來聚合這些信息,比如現在的比價網站。
推薦閱讀:
相關文章