2017年12月12日,成立11年的老牌旅遊網站馬蜂窩宣布獲得D輪巨額融資,淡馬錫、今日資本等合計投資1.33億美元。

彼時投資界雖有「過冬」的聲音,但仍然經常有幾千萬美元融資的案例出現。

9個月之後,馬蜂窩再次傳出需要下一輪融資的消息,他們希望以20-25億美元的估值來獲得3億美元。

D輪之後,一般來說股票比例(利益分配)已經相對固定,出讓13%的股票換取現金,這個出讓比例近乎砍手斷腳,背後的潛台詞是:馬蜂窩需要更多的錢來燒,否則可能有崩潰的危險。

可惜,現在的2018,再不是嘴上喊過冬,而是所有人都沒錢了。

(馬蜂窩創始人呂剛)

在這種環境之下,爆文《估值175億的馬蜂窩 竟是一座殭屍和水軍構成的鬼城》在周末刷爆朋友圈,就顯得特別的意味深長。

是誰捅了馬蜂窩,是誰在有計劃有目的的打壓一個獨角獸的估值……在其尋求下一輪巨額融資的當口?

黑奇士(id hqssima)將抽絲剝繭,帶你分析整個事件。

旅遊網站抄襲餐飲點評?

眾所周知的是,馬蜂窩以旅遊攻略見長。

2006年1月上線,2010年3月正式投入公司化運營。4年時間裡,馬蜂窩攢了15萬活躍用戶。

以這種「慢公司」的勁頭,如果馬蜂窩要抄襲,應該是抄襲給他帶來最大利益的部分。

在乎睿數據提供的材料中,7000多個有抄襲嫌疑的賬號,搬運的卻是餐飲類內容點評。在自媒體「小聲比比」和其數據提供團隊「乎睿數據」共同製作的爆文中,並未提出合理解釋。

(圖片來自小聲比比)

餐飲類點評有助於馬蜂窩來鞏固自己的「旅遊攻略之王」地位嗎,這種抄襲的目的何在?當然,這種抄襲有另外的暗黑解釋,我先把他放在這裡,後文會揭開這種抄襲可能存在的原因。

揭黑背後的融資暗戰

自2017年開始,廣大吃瓜群眾看到,財大氣粗的投資人、外表光鮮的創業者和縱橫捭闔的巨頭之間,因為利益而爆出的一幕幕黑暗融資戰鬥:

在被美團收購表決會議上,摩拜的投資人、創始人同床異夢心懷鬼胎;

OFO一波三折的賣身投票,阿里、滴滴和戴威之間的爾虞我詐,在這些過程當中,不斷有媒體爆出「黑幕」,甚至有人拿出OFO的財務數據去打壓其估值和現金流,迫使其賣身求存;

鎚子科技不斷爆出的「現金流枯竭」、「裁員」等,彷彿一直掙扎在死亡邊緣;

……

這些技倆之後,有的投資人用揭黑來打壓企業估值,以求在下一輪融資中用更少的金錢來佔據更多份額;

有的是創業者想獨立運營,不想投入巨頭懷抱,巨頭以揭黑來脅迫其出售股份;

還有的是巨頭A用揭黑來打壓企業現金流,避免讓巨頭B在收購戰中佔據先機;

如此種種,但凡創業者對其江湖黑暗有一點點幻想,就會被嚴酷的現實來打臉。

只是不知道,這次馬蜂窩遇到的,是黑暗套路的哪一種。

爬蟲之戰

網路爬蟲,又被稱為網頁蜘蛛、網路機器人,是按照一定的規則,自動地抓取網路信息的程序或者腳本。

比如,創業公司想做個旅遊網站,自己一窮二白毫無內容可言,怎麼辦呢?爬蟲這個大殺器就被拿出來。

只要普通網民能看到的內容,爬蟲就可以「看到」,可以複製和黏貼,從各大網站抓來內容填充自己的網站。只要抓取幾天,一個像模像樣的網站就可以製作完成,真實用戶來以後,也不會發現破綻。

不少創業公司的基礎內容(或者巨頭的創業項目),都是網路爬蟲來完成。

從乎睿數據爆出的證據來看,有兩個合理猜測:要麼是馬蜂窩在啟動餐飲點評項目的時候,抓取了其餘友商的數據來填充;

但是乎睿數據沒提供內容時間對比,兩個網站內容相同,可能是A抄襲B,也可能是B抄襲A,或者是第三方同時在兩個網站建立賬號,就像黑奇士在新浪搜狐等十多個網站發文,拿我的賬號說新浪抄襲搜狐,那不就不對了。

去年11月,黑奇士寫過一篇揭露旅遊網站流量黑幕的文章:《機票暗黑江湖:訂票網只有10%真流量 低價票根本買不著》,專家揭露說,旅遊網站的低價機票有不少被代理商爬蟲搶走,普通用戶根本訂不到。

爬蟲的用途之廣泛,是普通網民無法想像的。

五毛黨江湖

除了爬蟲之外,另外的一個合理猜測,是有不法團隊在做惡意內容,企圖在馬蜂窩「養號」,也就是所謂的「五毛黨」。

這個是互聯網上灰色產業一種,比如在微博初起時,有人建立幾百個賬號,專門從youtube上搬運內容,把自己養成微博大V,紅了之後可以獲取每年幾百萬、上千萬的廣告收入。

(網路炒作始祖,策劃人「立二拆四」在法庭受審)

黑奇士了解到,凡是依靠用戶產生內容的平台,都會有這種「五毛黨養號團隊」出現,無論新浪微博、微信公眾號這樣的綜合平台,還是汽車之家、大眾點評這樣的垂直網站,都有養號團隊出沒。

即使養的號沒成大V,用來做「五毛黨」也是很好的生意,通常來說,活躍賬號都有更高權重,用來貼有利於商家的評論、或者打壓對手,這些賬號都是最好的載體。

「養號」,可以解釋為什麼一個賬號即可以在廣州陪老公吃飯,又在天津訂了豪華酒店,因為這些飯店、酒店,就是他們的金主,每一個評論可以賺取最低5元、高則幾百元的費用。

同理,抽獎抽中殭屍用戶,實在是非常非常正常的事。公司做一次轉發抽獎,參與的真實用戶僅有幾百個,殭屍用戶幾萬幾十萬,結果獎品被殭屍用戶背後的操縱者領走。

(我自己就曾在新浪微博被殭屍用戶煩死:拿出幾萬元抽獎,使用微博官方抽獎平台,轉發四十萬,漲了二十多萬粉絲。結果微博官方把我管理的賬號進行了封禁,理由是「購買殭屍粉絲」。

自此之後,微博一生黑。

括弧里這段話是我的親身經歷,無法遵守新聞平衡原則,望讀者周知。)

這隻能說,馬蜂窩封禁殭屍用戶不利,不能證明這些殭屍用戶是馬蜂窩官方養的。

防範暗箭明槍,還需武功更強

當然,本次馬蜂窩殭屍用戶事件,上述分析並不能完美解釋所有疑點。

比如,為什麼普通網友很難搶到的低價產品,自家員工卻可以輕易買到,這其中是否有內部腐敗?

因此,希望馬蜂窩自身進行嚴格核查,對乎睿數據指出的7000多個賬號進行檢查,最簡單的就是:公布這些賬號的登陸IP和內容操作軌跡,看他們是從哪裡登陸的,必要時要提起法律訴訟。

黑奇士採訪了相關專家,對於UGC網站如何防範爬蟲和惡意內容:

頂象技術專家田際雲指出,「爬蟲」不僅能夠抓取旅遊用戶評價和賬戶信息,更可以爬取商品或服務的類目、圖片、價格等關鍵數據。數據是互聯網平台的重要資產。這些「爬蟲」的非法操作不僅竊取了平台的數據資產,消耗了網站和平台的服務和帶寬資源。

頂象數據反爬解決方案能夠有效防止各類非法爬取行為和惡意爬蟲。該方案在登錄端部署頂象的智能無感驗證,直接攔截爬蟲對重點數據的爬取。同時,結合頂象設備指紋和實時風險決策系統,實現對於爬蟲的總體攔截。再基於對抗過程中的數據積累,利用智能分析平台對數據進行分析,建立基於符合業務場景和需求的風控策略,實時優化風控效果,良好防範數據遭惡意爬取的風險。

除了技術對抗之外,遭到爬蟲抄襲的公司還可以拿起法律武器來維護自己的利益:

2017年10月,今日頭條前員工宋某和侯某,因為使用爬蟲技術爬取今日頭條的視頻內容,被北京市海淀區人民法院判處9個月至1年不等的有期徒刑。

該判決使宋某和侯某創立的公司直接進入死亡狀態。

(宋某因使用爬蟲爬取今日頭條視頻內容而被判刑)

黑奇士採訪的法律界人士表示,隨著《網路安全法》的嚴格實施,以往看起來只是技術對抗的爬蟲和反爬,很容易觸犯刑法,受到刑事制裁。例如有的用戶賬戶包含住址信息、發布的內容包括電話、住址等敏感信息,這些信息被爬取之後,就可能觸犯刑律。

(如果您的公司遇到爬蟲困擾,或者遇到「五毛黨」,可以來找我聊聊。搜索「黑奇士」,就可以找到我)


推薦閱讀:
查看原文 >>
相关文章