【馬蜂窩醜聞】估值175億的旅遊獨角獸,是一座殭屍和水軍構成的鬼城?(附官方回應)

本文來源:小聲比比

微信id:ziquanM

作者:梓泉&乎睿數據

(乎睿數據團隊自介:一支致力於通過技術改善生活的年輕團隊,精通人工智能、自然語言處理、大數據分析等技術。)

提起馬蜂窩,大家應該並不陌生

世界杯期間

“為什麼要去馬蜂窩”的洗腦廣告,一度登上熱搜

最近看馬蜂窩又要融資了,要融3億美元。

估值已經達到了25億美元,也就是175億人民幣

一個百億體量的巨頭,稱之為獨角獸毫不為過

而今日資本、啟明創投、高瓴資本、GA等機構的投資,

也說明了他們對這家獨角獸的殷切期待。

但這個獨角獸的成色到底怎麼樣呢?

作為一家主打用戶生產內容的旅遊網站

馬蜂窩的2100萬條「真實點評」接近於核心資產

但如果我告訴你

馬蜂窩這2100萬“真實點評“

裡面有1800萬條

是他們通過機器人

從點評和攜程等競爭對手那裡抄襲過來的

你又會作何感想?

說實話我一開始也很難相信

畢竟是世界杯花了2億砸廣告的大獨角獸

然而當乎睿數據團隊的報告出爐後

任何一個有眼睛的人,不信也得信了

接下來,請不要眨眼

發現馬蜂窩的數據異常

源於一次巧合

我們偶然注意到

馬蜂窩點評增長趨勢非常詭異

點評的數量,在特定時間節點指數級上升

隨後斷崖式回落

我們懷疑,這幾個節點和融資有關係。

然後我們去翻點評,發現了很多自相矛盾的奇怪現象

因此我們決定抓取大眾點評、藝龍、攜程等競品網站內容,並進行對比

結論讓我們震驚

馬蜂窩的抄襲,超出了我們的想像

就拿餐飲來說

我們抓取了馬蜂窩上116萬家餐廳

並抽取了三分之一的樣本

然後定了一個非常嚴格的“抄襲“標準

一字不差的抄襲,才算抄襲

十句話有一句不同,就不算抄襲

以這個為抄襲標準

同時,以抄襲150個不同的大眾點評賬戶為” 抄襲賬號 “標準

好了,請你深吸一口氣

然後看接下來的內容

儘管我們已經把標準定的如此嚴格。

我們還是在馬蜂窩上,

發現了7454個抄襲賬號

平均每個人從攜程、藝龍、美團、Agoda、Yelp上

抄襲搬運了數千條點評

合計抄襲572萬條餐飲點評

1221萬條酒店點評

占到他們官網聲稱總點評數的85%

這還是我們把抄襲定義的非常嚴格的情況下

統計出來的結果

如果把抄襲定義的更加寬泛

馬蜂窩還能剩下幾條原創點評,我都說不準

而且這些賬號很多都有官方背書

抄襲實錘一:

這些抄襲賬號

出現了很多自相矛盾的靈異現象

比如這個性別是“女”的問答小班長二號

先是去桐鄉找女朋友

在同一天,給老公在上海定了全季酒店

而且和女友在南京漢庭睡得很好

忽男忽女,忽南忽北,男女皆可

堪稱薛定諤的女裝大佬

抄襲實錘二:

因為Yelp上的評論是英文的

他們抄的時候直接調用Google翻譯接口

回答狗屁不通不說

還把”簡明英漢詞典“給搬運了過來

在馬蜂窩上搜“簡明英漢詞典”

可以看到大量機翻點評

抄襲實錘三:

不慎把不該抓取的內容抓了進來

不僅如此,這些抄襲賬號

除了貢獻內容和活躍度

也活躍在各種官方的抽獎之中

並且屢次成為各種自由航行

特等獎等大獎的“幸運得主”

比如這次抽獎

價值一萬塊的自由行獲獎者

連帶三個索尼微單獲獎者

全是抄襲賬號

四個賬號合計貢獻了11521條抄襲點評

還有這種更誇張的

一個節選式抄襲賬號

連續中獎12次

真是天選之子了

一個馬蜂窩福利性質的搶購

很多人都說沒有搶到

然後有一個人發帖炫耀說搶到了兩次

願意傳授秘籍

在知乎上一搜ID

原來是內部員工啊

那有人說,OK這些被你抓了

但是你不能說馬蜂窩點評全是騙人的啊?

還有很多正常用戶啊~

好,第二波錘來了

你不是說其它用戶正常嗎?

我們刨!除!了!7554個作弊賬號

餘下的所有賬號中

選擇了1萬5千個最活躍的賬號

這些人算是馬蜂窩的大V了吧?

大家看這1萬5個大V的點評熱力圖

有沒有感覺很奇怪?

就像商量好了一樣

在2015年中旬

這1萬5千人突然同時活躍

然後到2016年初,同時沉寂了

這尼瑪左右橫跳都不帶剎車的?

這是人類嗎?

這是殭屍還差不多

如果你覺得錘的還不夠狠的話

那麼看這張圖

這是馬蜂窩和大眾點評的餐飲點評趨勢圖

馬蜂窩的部分刨除了抄襲賬號

大眾點評是

用戶週末點評比較活躍,周中比較冷寂

馬蜂窩的大部分用戶

集中在周中寫點評

一到週末,斷崖式下跌

酒店點評也是一樣詭異

攜程是周末比周中明顯要多

馬蜂窩用戶,酒店點評周中比周末多

一到週末,斷崖式下跌

這不是很奇怪麼?

馬蜂窩的用戶都在夜場上班的嗎?

周中才有空出去玩?

再看一張圖,每日餐飲點評數量趨勢

大眾點評是在午飯和晚飯活躍

對吧,人之常情嘛,吃完飯抒發一下

馬蜂窩相反,午飯和晚飯時點評少

工作時間(10點-12點)、(2點-5點)更活躍

OK,現在我們得到了馬蜂窩的主流用戶畫像:

他們是一群每天朝九晚五吃喝玩樂

在午晚飯以及週末幹正事的人

他們是一群能夠同時在地球不同地方同時出現

並且反覆切換性取向的人

對不起我實在編不下去了

我只能理解為

或許這就是馬蜂窩官網那句

的真實含義吧。。。

對了,馬蜂窩的UGC內容,除了點評之外,還有遊記和問答。

針對遊記和問答的分析,我將在明天放出,更為精彩。

同時,我也會在明天推送的結尾

附上乎睿數據的75頁完整馬蜂窩起底報告,極其精彩!

記得關注以及置頂”小聲比比“,明天我們不見不散!

最後,感謝為本文貢獻核心數據的乎睿數據團隊!

乎睿數據是一支致力於通過技術改善生活的年輕團隊。成員畢業或就讀於賓大、康奈爾、伊利諾伊香檳分校等高等院校,精通人工智能、自然語言處理、大數據分析等技術,曾在谷歌、臉書等一線企業任職,擁有豐富的研發與領導經驗及多項專利,並曾於AAAI、NAACL、ACL等頂級學術會議發表論文,聯繫郵箱:[email protected]

閱讀原文

10月21日,發布本文的自媒體小聲比比追加發文,指原列為證據的那些帳號,都已遭馬蜂窩官方清除,稱之為「毀滅證據」。

以下截圖為互聯網評論紅人向小田:

10月22日,馬蜂窩發表官方回應:

來源:網易新聞

10月22日消息,馬蜂窩今日回應自媒體質疑,公司表示對全站數據進行了檢查,點評內容在馬蜂窩整體數據量中僅佔比2.91%,涉嫌虛假點評的帳號數量在整體用戶中的佔比更是微乎其微,馬蜂窩已對這部分帳號進行清理。

自媒體文章所述的馬蜂窩用戶數量,與事實和第三方機構數據都嚴重不符。

馬蜂窩表示,餐飲點評不是馬蜂窩的內容核心,且部分點評來自於遊記,問答等內容的提取,上述自媒體將馬蜂窩用戶內容生產的活躍週期,與餐飲等本地生活服務類APP相對比,並解讀為馬蜂窩員工有組織地抄襲,存在明顯的誤導傾向。

馬蜂窩還稱,自媒體將不法商家的違規行為歸結於馬蜂窩,與事實嚴重不符。

馬蜂窩最後表示,不容許任何個人或機構將每位熱情且真誠的馬蜂窩用戶稱為“殭屍”和“水軍”,將千萬用戶共同構建的社區描述為一座“鬼城”,並企圖摧毀它。

針對該文中歪曲事實的言論,和已被查證的有組織攻擊行為,馬蜂窩將採取法律手段維護自身權益。

10月22日晚間最新消息,馬蜂窩已向一戰成名的自媒體《小聲比比》提告。

閱讀原文

阿里和騰訊雙雙跌出了全球十大市值公司

xxx

狂飆十年的中國互聯網光環不再(穩),我想去國企

xxx

讓騰訊蒸發3800億人民幣的那篇官媒文章已經刪了

xxx

除了罵裁判,中國互聯網八大平台都是怎麽看奧運會的?

xxx

在中國互聯網行業,戴字節跳動(抖音)的工牌能光宗耀祖嗎?

xxx

中國的B站正在日本走紅,但走紅的路子和我們想像的不一樣

xxx