對於馬蜂窩來說,上個週末無疑焦頭爛額。

10月20號,「小聲比比」發表了一篇名為《獨家|估值175億的旅遊獨角獸,是一座殭屍和水軍構成的鬼城》的文章,直接把槍口對向了馬蜂窩:評論抄襲、內容、抽獎涉嫌造假!

同一用戶12次中獎

7454個抄襲賬號,貢獻了85%的點評

每條遊記下面千篇一律的機器人口吻灌水

一條條數據擺出來,作者彷彿提著98k大槍,入了無人之境,哐哐哐地一頓幹!操作一流,膽量超一流!

爽過了週末。從週一開始屠(si)殺(bi)場(zhan)……

10月22號,馬蜂窩一紙告了深圳市乎睿數據有限公司、丁子荃;

緊隨其後,「小聲比比」三度公眾號發聲,再度數據打臉馬蜂窩;10月23號,有媒體報道,馬蜂窩創始人兼CEO陳罡回應稱,在餐飲等點評數據方面確實存在部分問題,但遠沒有外界表述的那麼誇大。10月23號,馬蜂窩的百度搜索指數達到半年來最高。

數據造假這一指控對於馬蜂窩來說,太重。

作為主打UGC的旅遊平臺,早在2014年的5月,陳罡曾在微博上公開炮轟去哪兒評論造假, 指責刷點評行為已經動搖到了行業誠信的根基。

如今,是成也UGC,敗也UGC。

一頓外賣引出的造假案

馬蜂窩倒了黴!

縱觀這場造假案,可以說是來得突然又有節奏感。馬蜂窩在微博上稱之為:有組織攻擊行為。

作為「被定義」的一方,小聲比比說起捅馬蜂窩的緣由,則有點曲折。

據說:乎睿數據的團隊幾個同學,回國沒多久,參加創業大賽,沒想到喫外賣拉了肚子,一怒之下去平臺差評,反而被污衊詆毀。碰巧這幾位同學在美國藤校學的都是數據挖掘、語義分析。

因此決定訓練一個模型,用於篩選餐飲點評中的水軍,當時恰逢馬蜂窩鋪天蓋地地打廣告,就決定拿他們練練手,誰知道越爬越奇怪。「這點評怎麼還帶『簡明英漢詞典』的」,這才發現馬蜂窩的點評抄襲嚴重。 於是決定尋根究底,這一挖,就是四個月。

認真追究起來,馬蜂窩是被「外賣」拖累的。算得上人在家中坐,禍從天上來,但是,也不算冤枉,只是沒想到遇上了這麼一羣較真又堅持的人……

網路平臺數據造假難道不是常態嗎?

是的。

有人問過場主:網路平臺數據造假難道不是常態嗎?是的。

在《獨家|估值175億的旅遊……》一文中,指出馬蜂窩2100萬條「真實點評」中,有1800萬條都是通過機器人從競品網站抄襲過來的。

這是如何做到的?數據挖掘。

程序員們對此並不陌生,爬取數據,從海量數據中分析信息,從而把信息轉化為產品需求去推進,那麼結果是產品的升級。

爬取數據,從海量數據中搬運數據,那麼結果就是100體量的東西在互相抄襲來抄襲去之後變成虛假的10000體量的東西,僅僅是為受眾增加了有效信息篩選的難度。

造假的成本更低了,那為什麼不能用數據堆砌一個海市蜃樓,盛世太平?這就是常態,是行業裏公開的祕密。刷單、刷粉、刷好評、甚至還有被調侃的「五毛錢水軍」……

但正因為這個時候有1個人先反應過來並且羣而告知:常態並不代表正確!誰給的臉讓造假如此堂而皇之?

於是,文章一出,振聾發聵,羣起而捅之(馬蜂窩)。

並不是針對馬蜂窩

誰不是在裡面狂歡呢?

回到馬蜂窩被捅事件,馬蜂窩這個平臺有錯嗎?有的,但不應該以偏概全地把它一棒子打死,用最大的惡意去揣測它。

場主早年的時候也用過幾次馬蜂窩,只能說,那幾次的體驗都還可以。

刷了下全網的態度,其實支持與抨擊還是一半一半的,有人看到的是真實,以UGC起步的馬蜂窩上確實有一批用戶在真誠地分享,他們感受了平臺「有溫度」的一面,也有人看到的是欺騙,被大量機器水軍刷出來的評論傷害。

而我們所針對的,不是這一個旅遊平臺,而是這些肆虐、泛濫的黑灰產,是馬蜂窩方面對虛假評論的態度,而非簡單的一紙訴訟的老套路!

就像楚門的世界,你看到的是真實,那麼安然無恙,你發現了虛構,就一心想逃離、打破。

如同我們所在的大數據時代,怎麼看清真實虛假,怎麼堅守本心,明辨是非,一定是持久的考驗。

希望數據構建的是一個更智能利民的社會,而不是一個個失去誠信和真話的評價市場——送給場主自己,也送給所有程序員!

誰還在這座「殭屍和水軍構成的鬼城」裏?

我們一直都在。


推薦閱讀:
查看原文 >>
相關文章