【馬雲真有錢,我和王健林加起來還沒有他多】我們是如何被事實和數字欺騙的?

本文來源:衛夕指北

微信id:weixizhibei

作者:衛夕

謊言能欺騙人,但你知道不說謊也能欺騙人麽?

今天我就來聊一類「真實的謊言」。

這類謊言它說的每一個事實都是真的,每一個數字都是正確的,但它卻能成功地欺騙我們。

如今,赤裸裸的謊言,媒體和企業都已經不敢再明目張膽地使用。

但今天所說的這類狡猾的「真實謊言」卻大量地充斥著每個人的生活。

先來幾個例子大家感受一下:

1.我的公眾號「衛夕指北」曾經有一篇文章讓我的粉絲數增長了兩倍,你會不會覺得這篇文章的確不錯?

事實上那是我第一篇文章,發文章之前我的粉絲數是60,發文章之後我轉到朋友圈粉絲增長到了180,而那篇文章是如此的平庸,以至於我後來都把它刪掉了!

2.假如一個球探並不認識丁俊暉,這時候我剪輯一個視頻——裏邊30%的片段是丁俊暉表現好的鏡頭,另剩下70%是丁俊暉失誤的鏡頭,那麽,這個球探一定會對丁俊暉球技評價非常一般。

3.一位員工向老板匯報:「因為貿易戰,我們的鞋子的銷量下降了兩成」,另一位員工向老板匯報:「儘管有貿易戰,我們鞋子的銷量依然保住了八成」,神馬是真相?

4.一位自媒體作者的簡介裏寫道:2006《時代周刊》年度人物、2008感動中國組委會特別大獎,你會不會覺得他已經到了自媒體金字塔的頂端?

事實上2006時代周刊年度人物是「You」,即所有網民;而2018感動中國組委會特別大獎是——「全體中國人」

5.美國每100個人就有89支槍,看到這個數據,你會不會覺得美國槍枝泛濫極其嚴重,簡直是人間地獄,沒救了。

但你看另一個數據可能就沒那麽擔心了——美國只有31%的家庭有槍。

6.新醫學統計證明,一個人的壽命和這個人成人後手掌大小關係密切,具體表現為——手掌大通常壽命短,而手掌小壽命則長。

太奇怪了!事實是,男性壽命通常比女性短,而男性的手掌則通常比女性大;

7.如果我給你一個組數據——市一中的升學率為46.4%,市二中的升學率為40%,你會把你的孩子送到哪個學校讀書?

當然是市一中!對不起,你選錯了!

看一看下面一張表,不管是文科升學率還是理科升學率,市一中都沒有市二中高,但它的總體升學率卻高於二中,你沒看錯,數據就是這麽神奇!

8.在美國全部市長的平均工資為6.2萬美元,而副市長卻高達8.3萬美元,這個數很奇怪對不對?

而事實上是在美國很多小的市並沒有設置副市長,只有一個薪水並不高的市長,而設置副市長的市都是較大、較富裕的市。

9.這個圖,你是否覺著這個指標有漲有跌,總體表現較為平穩?

但事實上,真實的表現是2020年比2019年增長了一倍!

以上案例就是衛夕總結的「真實的謊言」的九種類型——

1.公眾號2倍增長——「小樣本謊言」

2.丁俊暉視頻——「選擇性展示謊言」

3.貿易戰匯報——「描述傾向謊言」

4.時代周刊自媒體——「偷換概念謊言」

5.美國槍枝數——「平均數謊言」

6.手掌大小與壽命——「相關當因果謊言」

7.升學率選擇——「辛普森悖論謊言」;

8.正副市長工資——「不恰當對比謊言」;

9.指標走勢——「視覺誤導性謊言」

下面,魔術師衛夕就帶你一起來揭開這些狡猾謊言背後的真面目——

一、小樣本謊言

「我在過去9年裏只收到過2張交通罰單」,你會不會認為我是一個極其遵守交通規則的司機?

然而事實是我上周三才拿到駕照開始開車。

小樣本謊言是指用並不能代表整體的極小樣本試圖描述整體狀況,這是一種基於真實數據說謊的典型方式,常見於多種實際場合:

公司財報:

我們經常會看到某互聯網公司財報公關稿裏會說自己某項創新業務上季度收入增長300%,但它不會告訴你具體數。

因為這個具體的數字可能是收入從1萬增長到4萬;

求職簡歷:

我收到很多簡歷上寫「負責XX項目期間,成功讓某個功能使用人數翻番」的描述,我通常會繼續問「那麽這個功能具體的使用人數是多少呢?

求職者往往會回答:「抱歉,由於和公司簽了保密協議,具體數據不方便透露」。

政府宣傳:

摩納哥政府日前宣稱他們是世界上第一個完成5G100%覆蓋的國家,你會不會這個國家真的走在通訊科技的最前沿?

而事實上,摩納哥坐落在法國的中間,面積只有1.98平方公里

注意:小樣本謊言並不局限於用小樣本來誇張倍數,也存在用小樣本擴大整體範圍。

下面三句話大家感受一下:

1.自2002年韓日世界杯失利後,中國隊在世界杯賽場上不敗紀錄已經延續17年

2.縱觀漫長的世界杯史,中國隊總共也僅輸過三次

3.即使是巴西隊這樣的世界強隊在世界杯比賽中也僅戰勝過中國隊一次

二、選擇性展示謊言

選擇性展示是最為常見的用事實欺騙人的方法,甚至沒有之一。

因為它實在是太常見了。

英文中有一個詞叫「Half-truth」,即給你看的部分是真的,但它只是事實的一部分。

下面這張圖很好地闡釋了選擇性展示:

我通常不看圖書扉頁上來自類似《紐約時報》的書評,為什麼呢?

因為我知道書商的一個常見操作是——把《紐約時報》書評中好的部分挑出來,即便整個書評對這本書持否定態度:

比如書評寫的是「這是一本在情節上引人入勝的小說,但它惡俗的價值觀和對女性的蔑視只能讓其成為三流作品……」

書商只會在封面上印上「這是一本在情節上引人入勝的小說」——《紐約時報》。

所以大家要警惕來自外媒的書評,尤其是那些只有一句話的書評。

2007年,高露潔被英國廣告標準管理局(ASA)下令禁止使用「超過80%的牙醫推薦高露潔」這句宣傳語,原因是因為它存在明顯的誤導。

這個數據本身是獨立而準確的,但它給消費者的感覺是——「剩下20%的牙醫推薦其他品牌」,而事實上可能是——「90%的牙醫推薦田七」

(我隨便說的,那份報告的確是牙醫不止推薦一個品牌)

再看另一個例子,一些制藥廠商在宣傳時可能會說「我們這款胃藥和其他同類型的胃藥相比,長期服用也不會對胃造成副作用。」

它宣稱確實屬實,但它沒有告訴你的是——對胃是沒有負作用,但是對肝有。

為什麼很多人說:百度的財報新聞要去騰訊看,而騰訊的財報要去百度看。

就是因為發在自家網站的新聞,通常只會選擇性展示財報中的利好。

現在,我終於理解我那經常看《參X消息》的高中地理老師為什麼天天那麽激動了!

三、描述傾向謊言

語言天然有著神奇的魔力,當我們的敘述方式發生微妙變化的時候,意思也就完全不同了。

而這一點經常被很多語言大師所運用:

曾國藩率領湘軍與太平天國作戰,曾多次吃敗仗,於是曾國藩上書朝廷,奏折提到「屢戰屢敗」,但被他的幕僚李元度看到之後將「屢戰屢敗」改為「屢敗屢戰」。

這次改動被傳為佳話,因為它顯示其奮勇無畏的作戰精神,然而現實中卻被大量的人和企業用於刻意地欺騙。

胡適先生說「歷史是任人打扮的小姑娘」,而事實又何嘗不是呢,比如:

「三陪女白天去大學上課」,「女大學生晚上去當三陪女」。

這其實描述的是同一件事,但從不同的角度敘述則含義完全不一致了。

當年羅永浩之所以要和做測評的王自如約戰優酷,就是因為老羅認為王自如在測評T1的時候,用了大量不易察覺的傾向性的表述將錘子T1描述成一款不合格的產品。

「我能在祈禱的時候抽煙嗎?」、「不能!」;

「那我能在抽煙的時候祈禱嗎?」、「可以」。

四、偷換概念謊言

偷換概念謊言,其實源於我們對於書面表達的迷信。

不同於我們日常使用的口頭表達,書面表達體系長期用於嚴肅場合,因而形成了一種天然的可信度。

於是它就常被用來編織真實的謊言:

公眾號「嚇腦濕」舉過一個例子——有人這樣描述自己的互聯網運營工作:

「他開始打造自己的私域流量,建立了一個龐大的私域流量池,並轉化成社群,在著重提升社群活躍度的同時,用心做好社群運營。」

而實際上是——

「他用微信加好友,加了很多好友之後把他們拉進一個微信群,平時沒事就在群裏發些段子和沙雕圖,偶爾發發廣告」

如果我這麽說——「我一個表妹是一個極其優秀和突出的女生,她大學畢業就成功進入一家世界五百強工作,而作為新人的她在第一年就成功化解了該公司的一個分支機構兩次公關危機」

你會不會想了解一下這個優秀的年輕女生到底是如何做到的?甚至想讓她給你即將畢業的弟弟傳授一下經驗……

而事實是,我表妹畢業後只是在麥當勞找到了一份收銀的工作,而她的確成功調解過兩次就餐顧客的投訴和糾紛。

下次碰到類似的謊言,你只需要對他說——「說人話!」

五、平均數謊言

馬克吐溫說過一句名言——「有三種謊言:謊言,該死的謊言和統計數據」,平均數也是統計數據中極具迷惑性的常用術語。

平均數謊言常見於各類不專業的媒體。

比如騰訊2019年Q1發財報,顯示員工人數5.46萬,而騰訊的薪酬支出為116億。

由此媒體計算並製造出「騰訊員工平均月薪7萬」的新聞,不僅大眾炸鍋,很多騰訊員工也直呼自己被平均了。

平均數只是描述一個總體的一個指標,當這個總體分布相對均勻的時候,平均數是有意義的。

當其分布及其不均勻時,用平均數試圖描述每個人狀況就不適合了。

這時候中位數和眾數在某種意義上更能體現分布,中位數指整體有一半比這個數高,另一半比這個數低,眾數是指整體中分布最多的數。

我們看一個實際例子:

假如你們宿舍5個人,畢業十年後,一個人失業,月工資0;

一個人當老板,一個月100萬;

另外三人一人月入6萬,另外兩個人月入2萬;

所有人月薪為0、2、6、2、100萬,這時候平均數為22萬、中位數為6萬,眾數為2萬。

顯然,中位數6萬和眾數2萬這兩個數,更能描述你們宿舍的實際情況。

嗯,馬雲可真有錢,我和王健林加起來還沒有他多。

六、把相關當因果的謊言

在很多媒體在報導數據的時候,經常一個誤導讀者的方式就是把相關關係錯當成因果關係,的確這兩個關係在現實中特別容易混淆。

觀察到經常看電視的孩子最暴力,就直接下結論說電視使孩子們變得更加暴力,而可能存在的另一個原因是暴力的孩子更喜歡看電視。

中世紀歐洲一直認為虱子能預防風傷感冒,因為觀察到感冒的人身上通常沒有虱子。

而事實上是虱子對體溫特別敏感,如果人發燒了,虱子就離開了。

在醫學界一個典型的案例:

醫學觀察發現,使用激素替代療法的治療冠心病的女性復發率,明顯低於平均水平,於是很多醫生認為這個療法肯定比其他療法更好。

但之後的隨機醫學試驗證實恰恰相反,這個療法效果甚至還不如普通療法,那麽這是為什呢?

原來是因為該療法前沿且價格高昂,而接受這一療法的女性通常社會地位和財富地位相對較高。

而她們的飲食習慣的健康程度和運動量也高於普通人,因而復發率低於普通人。

為了講清楚因果和相關這個問題,我舉一個栗子:

比如某個地方車禍次數和黑熊襲擊從數據表現上極其相關,大家可能第一時間想到的是黑熊襲擊導致了車禍的發生。

但事實上他們可能有四種關係:

  • 黑熊襲擊導致車禍發生
  • 車禍發生導致黑熊襲擊
  • 車禍和黑熊襲擊都由第三方因素(如火山爆發)引起
  • 車禍發生和黑熊襲擊完全沒有關係

所以之後不要看到相關的數據,就認為他們之間一定是因果關係。

我們要認真分析背後可能的具體原因和邏輯關係。

國外有一個神奇的網站(https://tylervigen.com/)專門收集那種不可能有聯繫的虛假相關關係。

比如這個:

「世界非商用太空發射次數和美國社會學博士授予量呈高度關係」

不要看到「劉姥姥一進榮國府,賈寶玉初試雲雨情」,就瞎想賈寶玉的口味可真重!

七、辛普森悖論謊言

回到開頭的升學率的例子。

一中在文科理科升學率都低於二中的情況下,總升學率卻高於二中,很多人不理解,這其實是統計學上一個經典的悖論——辛普森悖論。

它是英國統計學家E.H.辛普森於1951年提出的一個經典統計學現象,即總體結論和部分結論恰好相反。

那麽這是為什麼呢?

是因為總體和部分在結構上呈現了大的差異,而這個差異有時候也會被人來製造謊言。

1991年,科羅拉多大學的統計學家 Michael L. Radelet統計了1976-1987年美國佛羅里達州的謀殺案的數據,總體結果如下:

從結果上看,白人的死刑率為11%,黑人的死刑率為7.9%,看起來在審判上並沒有種族歧視,然而真相並沒有這麽簡單。

我們如果按兇手和被害人的種族進行細分,結論就完全不一樣了,具體如下:

不管被害人是白人還是黑人,只要兇手是黑人,死刑率就明顯高於兇手是白人的情況;

更讓人發指的是,當被害者為黑人而兇手為白人的死刑率居然為0,即這種情況一個都沒有判。

那麽如何避免陷入辛普森悖論呢?

答案是警惕總體結論,通過科學合理的分組來查看具體細致的數據。

八、不恰當的對比

不恰當的對比也是用事實和數據說謊的一個常見方式。

即把兩個看起來差不多而事實上有重要差異的數據進行比較,從而得出它想要的結果——

統計學家經常舉的例子:在美國對西班牙的美西戰爭中,美國海軍的死亡率為0.9%,而同期紐約市民的死亡率為1.6%,因此這個數據被美國海軍引用作為徵兵廣告,以此證明去當美國海軍甚至比坐在家裏還安全。

聰明的讀者一定猜到了這個對比極具誤導性的,能入伍的都是身體健康的成年男性,而紐約市的全體居民則包含老幼病殘。

華為在宣傳它的手機P30 Pro的時候,把手機的ISO和佳能的兩款單反進行了對比,於是網友在知乎上發布「單車在擁堵時候的速度是蘭博基尼的N倍」進行反諷。

三星也好不到哪裡去,當華為的P30 Pro的主攝像頭在專業影像網站DXOMark上的評分超越三星S10 時,三星無恥地發了一張下面的圖,把後置攝像頭和前置攝像頭的評分加起來,以顯示依然超過華為——

再看一個例子——2019年7月20日,周傑倫在一眾粉絲的努力下登上了微博超級話題榜首,但微博CEO來總卻發了一條帖子來說明這個事件對微博的流量並沒有提升,而且來總有證據——

事實上,來總說的降低的0.2%的這個對比其實就並不恰當,因為來總說的下降對比的是周六和周五的數據,而微博的流量特徵是周末本來比平時低。

因此更科學的對比方式是對比這周六和上周六的流量,來總可能無意說謊,但直接對比是不恰當的。

所以,如果哪天的你上司跟你說:「我昨天連續贏了柯潔三局!」,你不要驚嘆於他的棋藝,他或許是和柯潔打了三盤王者榮耀。

九、視覺誤導謊言

視覺誤導是指把數據變成圖表過程中玩的貓膩。

圖表嚴格意義上都沒有錯,但它呈現給你的方式會誤導你得出錯誤的結論,我們來看幾種典型的視覺欺騙——

1.並不從0開始的Y軸

這是圖片欺騙最低級最容易識別的手段,但現實中卻被使用的最為廣泛,目的是為了讓圖片走勢更突出——

為顯示履約費用率持續走低,京東2019年Q2財報的宣傳圖裏的Y軸是從5%而不是從0開始的:


▲履約費用率下降很明顯有木有,其實只有1%

小米在小米9的發布會上的這張圖,乍一看小米9跑分遙遙領先,但仔細一看,Y軸還是被截斷了:

▲看起來小米9跑分是Mate20跑分的兩倍多

2.刻意伸縮的Y軸

刻意拉長縮短,為的是突出或者縮小數據變化,我們來看一個典型的案例,一些反對氣候變化的人士繪制了一張一百年來全球平均溫度的圖——

乍一看全球氣溫貌似一直是一條直線,並沒有神馬明顯的變化,但一些環保人士則繪制了另一個條平均氣溫的圖表,在下面這個圖表中我們可以明顯看到平均氣溫的上升,哪一個是真相?

3.意味深長的餅圖

餅圖原本是讓我們清楚地看到各個部分的比例,但如果把餅圖放倒,就會發生意想不到的效果。

下面這張圖來自愛奇藝的官方微博,直觀看愛奇藝占據了圖片的半壁江山:

如果我們把圖片還原,愛奇藝的領先效果就沒那麽明顯了——

這個技巧是如此普遍,以至於喬幫主曾經也在發布會上也使用過——

有沒有發現蘋果的份額19.5%比「其他」21.2%還要大

4.並不恰當的示意圖

這張圖片來自微軟Edge瀏覽器官網,它把它的速度和Chrome和Firefox進行了對比,Edge的瀏覽速度的確領先,但在圖上的領先比例被明顯誇大了。

好了,以上就是衛夕總結的基於事實和數據的九種謊言。

這些謊言是如此狡猾,以至於不仔細分辨普通人甚至難以察覺。

而在組織這篇文章過程中,衛夕其實還積累了很多十分騷氣的案例,由於篇幅原因沒能逐一呈現。

衛夕在這裡立一個Flag——如果本篇文章分享和「好看」雙雙超過1000,我就把這篇文章擴充成一本書,書名就叫《狡猾的謊言》。

為讀者專門揭示那些基於事實和數據的「真實謊言」和伎倆,讓這種高級的說謊者露出原型!

閱讀原文