【科技向善,只為利人】如何再造一個維基百科?百度百科是怎麼做的?

本文來源:航通社

微信id:lifeissohappy

作者:書航

在我們熟悉的中國互聯網,有不少互聯網服務在發展過程中占用了大量的社會資源,需要全體人民為他們付出管理成本。

共享單車就是最典型的例子。

另一些則是在發展初期沒有顧慮到社會成本問題,最後不得不通過「補課」的方式,彌補自己以前虧欠的社會管理支出。

例如字節跳動和 Facebook 都不得不加強了人工審核力量,以治理對產品的濫用行為。

這些都可以稱為技術發展中的「負外部性」:原本你情我願的雙方互利的交易過程,對第三方造成了額外影響。

具有負外部性的交易會減少全社會擁有的福利。

但是,像維基百科(Wikipedia)以及互聯網檔案館(Internet Archive)這樣的公益服務,則是在為互聯網貢獻著公共服務,而自身則因為理念的因素而不計成本地付出。

都在說「科技向善」,維基這樣「毫不利己,專門利人」的產品看來是這一目標的頂點,比任何「不作惡」的口號都更有說服力。

如何讓這樣造福社會的「正外部性」產品多一點,再多一點?

  2000億條!中國國家圖書館將保存所有微博公開貼文:互聯網時代的國家記憶

橘生淮南則為橘

維基百科是一本「自由的百科全書」,由全球各地無私的編輯者,在一個基本嚴謹的組織架構下,付出義務勞動貢獻而成。

其服務器、開發、運維等成本則通過網上捐助覆蓋。

據官方介紹 [1] ,維基百科是全球第五大網站,每月為 4.5 億用戶提供服務,頁面瀏覽數以十億計。

不過該網站只有 350 名全職員工,它們通過強調運營的高效率和非營利性向捐助者證明其付出物有所值。

毫不利己,專門利人:如何再造一個維基百科?

但除了這些員工之外,全球 70000 多名志願者才是編輯網站內容的主力。

每個月,全球用戶通過 10 多億個終端來登陸維基百科獲取信息,每分鐘維基百科上的內容會被修改 350 次。(2016 年數據 [2])

谷歌在眾多搜索結果的右側,放上了維基百科的解說鏈接,幫助人們快速了解查詢詞的含義。

作為未來世界的流量入口之一,谷歌語音搜索產品「谷歌助手」(Google Assistant)也大量引用維基百科回答人們「什麼是……」之類的問題。

谷歌還在 YouTube 的某些視頻下,放上引到維基百科的鏈接,告知視頻是關於某個正進行的新聞動態、歷史事件(比如 9/11 恐怖襲擊)或來自某國的官方媒體,或得到政府資助等。[3]

毫不利己,專門利人:如何再造一個維基百科?

這樣看來,維基百科在谷歌產品中,起到了百度百科在百度搜索產品中一樣的作用。

互聯網檔案館保存的內容多種多樣,除了 90 年代中期開始的眾多全球網站的網頁內容之外,也有專門保存 CD-ROM 光盤鏡像、舊版主機遊戲、電視新聞節目等內容的分區。

站內還有一個專門的分區 [4] 存儲了 2001 年 9 月 11-17 日一周內美國境內能接收到的主要電視台,包括世界各國的國家電視台的新聞節目內容,可以帶人們重回襲擊現場,堪稱美國版「愛國主義教育基地」。

毫不利己,專門利人:如何再造一個維基百科?

不過,互聯網檔案館最為人稱道的,還是對已經或即將逝去的內容的保存工作。

它們在去年 6 月 500px 網站決定刪除採取「知識共享」(CC)免費協議的照片時趕著備份了一部分 [5],在去年底 Tumblr 要刪除所有色情內容之前也備份了一些 [6]。

毫不利己,專門利人:如何再造一個維基百科?

曾有媒體質疑,維基百科被谷歌大量使用,但谷歌並沒為此充分付費。

不過,谷歌以每年 100 萬美元左右的捐贈額度,已經成為對維基媒體基金會貢獻最大的捐贈者之一。

吉米•威爾士(Jimmy Wales)在接受採訪時也表示,它們與谷歌的關係是所有矽谷大公司之中相對最好的。[7]

比這更值錢的是維基百科內容在谷歌搜索結果中的高曝光率。

它們基本不需要花錢宣傳推廣自己,成為保持維基低成本的一個至關重要的因素。

與此類似,互聯網檔案館也不必以一己之力負擔所有運營費用。

2014 年 8 月,該檔案館部分數百萬張歷史圖片遷移到曾在雅虎旗下的圖片存儲網站 Flickr 保管。[8]

就這樣,完全公益性質的互聯網服務和手握流量資源的商業巨擘合作,實現了共贏和循環生態。

維基媒體基金會有百科之外的多個項目,其中 WikiData 提供計算機能識別的,結構化的人類知識圖譜。[9]

因為目前機器學習還不能按照人類基於邏輯的方法來「思考」,這些知識譜系對於 Alexa 等語音助手產品將非常有用。

可見,下一代互聯網入口同樣少不了維基的貢獻,和與巨頭間的互利合作。

  【百度貼吧衰亡史】百度貼吧清空2017年以前內容,中國網民15年的歷史一夜消失

 生於淮北則為枳

在國內,維基百科的對應產品——百度百科並不能做成一個只需由網友自發維護和捐助,就可以正常運行的環境。

事實上,百度為維持百科的正常運轉付出了大量的人力物力,同時也因為是最終責任人,而一直承擔著「虛假信息」等監管漏洞的批評。

百度百科的審核員確實由一般網友擔任,其中也包括一些從中文維基百科的編輯戰中逃離出來的專業編輯。

但是,百度必須憑空為這些網友的義務勞動,建設出一套足夠強的激勵機制。

因為,反過來利用平台破壞整個環境的濫用行為,更為屢禁不止。

除了大家都知道的為營利目的修改詞條之外,還有一種是先把鏈接放上百科,在通過修訂之後再修改外部鏈接的網頁,使得某些詞條的外部鏈接可以導向色情網站。[10]

百度不得不額外將詞條的外部鏈接,由原先的直鏈轉為網頁快照,而由於互聯網檔案館在中國不能直接訪問,百度也需要自己建設快照庫。

說白了,就是什麼都要自己從頭再做一遍,造成了巨大的浪費。

百度還邀請了一些權威機構來為專業詞條做把關。

然而,即便是在打上了「本詞條由‘科普中國’科學百科詞條編寫與應用工作項目審核」字樣的詞條當中,仍然可能會出現紕漏。

毫不利己,專門利人:如何再造一個維基百科?

例如,在百度百科的「希格斯玻色子」詞條當中,有一個數值的數據單位發生了錯誤,但是這個錯誤始終沒有被改正。[11]

毫不利己,專門利人:如何再造一個維基百科?

毫不利己,專門利人:如何再造一個維基百科?

同時,百度為了進一步豐富百科的信息,又引用了一些外部內容創作者的短視頻,推出了「秒懂百科」欄目。

而這些視頻的匹配以及版權歸屬等等,對百度來說又是一個額外的支出。

另一個體現「中國特色」的地方是製作百科類產品的必需資質。

由於內容審核的問題突出,另外辦下資質和牌照相當困難,使得維基百科上也許可以暫時擱置的一些爭議,對百度百科則是不得不面對的,需要付出更大的審核成本才能消除運營風險。

即使如此,百度百科的官方審核力量,與其數量龐大,各懷心思的「貢獻者」,以及更廣大範圍的用戶相比,仍是只占很小比例,無法阻止一些低質量內容的留存。

而這些內容就像埋藏的地雷一樣,不定期會被搜索到的網民發現,並在微博、知乎等地曬出來,順帶加上對百度「作惡」的嚴厲批評。

我們基本可以將百度百科看作是平行世界里的維基百科,它清晰地證明了假如維基百科是一個商業項目,它實際將付出的成本有多大。

而百度百科的靠山是百度,令它不至於被迫在燒錢中過度扭曲,甚至淪落到徹底關閉,是它更值得慶幸的地方。

國內創投行業長期持續的燒錢,使得大量項目畸形發展,只能先不顧一切的擴張,再回頭改錯,尋找政策認同。

如《中歐商業評論》提到的:[12]

「這種‘先污染、後治理’的發展路線甚至會影響到其他‘中規中矩型’企業的決策。曾經堅持‘小而美’的易到,就是這種競爭環境的‘遺憾品’。」

共同的挑戰

即使一個產品在設計之初有著高尚的動機,也應該考慮到使用它的人是千奇百怪,多種多樣的,他們可能會懷著各種各樣的心思,做出意料之外的舉動。

漢堡王「黑入」谷歌助手的故事就成為一個經典案例。

2017 年 4 月,漢堡王播放了一則廣告,並沒有介紹任何產品信息,只是讓店員說了一段話:

「你正在看一則 15 秒的漢堡王廣告。只不過,在這短短 15 秒內,我們沒法向你全面介紹皇堡里所有的食材。但是,我有個辦法。OK,Google:什麼是皇堡?」

毫不利己,專門利人:如何再造一個維基百科?

▲圖片截取自 YouTube

一旦你家里有了一台谷歌智能音箱 Google Home,那接下來你將會聽到它為你朗誦從維基百科「皇堡」詞條截取的介紹內容。

重點是,為了讓 Google Home 的介紹聽起來更像廣告,漢堡王還偷偷更改了維基百科詞條的開頭部分。

這條「隔山打牛」的 15 秒廣告在被稱為 「廣告界奧斯卡」 的戛納廣告節上獲得評審團大獎,僅次於最高獎金棕櫚獎。[13]

這當然不是濫用維基百科對自由編輯的信任的唯一例子。

最新的一起似乎更為惡劣。

為了在谷歌圖像搜索結果中占據最熱門的位置,戶外服裝公司 The North Face(北面)在維基百科的文章中偷偷植入了廣告照片。

如果不是它們大張旗鼓地自我宣傳,事件可能一直不會被曝光。

The North Face 與李奧貝納合作,派出攝影師前往世界各地的著名戶外地標,拍攝穿著 The North Face 沖鋒衣的人們站在地標的照片,並替換到這些地標的維基百科頁面。

「一個品牌如何不花錢就在谷歌上出現在第一位呢?」 The North Face 自賣自誇,「我們到達了最難企及的地方之一:世界最大搜索引擎的‘頂端’。僅僅通過和維基百科合作,完全不需要支付任何費用。」

毫不利己,專門利人:如何再造一個維基百科?

事件引發維基媒體基金會和網民的一致譴責,以公司道歉並撤下照片告終。[14]

這種投機取巧的做法與所謂 SEO(搜索引擎優化)非常類似。

SEO 的出現,原本是為了讓原本做得很好,但苦於難以被發現的網站獲得更大的展示機會,但是實際卻經常被濫用,使得質量低下的內容呈現在搜索引擎的前列。

類似的事情幾乎對每一個心懷純真善念,把人性想的很美好的創始人都產生過衝擊,包括曾開發《風之旅人》(Journey)等傳奇遊戲的製作人「禪師」陳星漢。

在他凝聚七年心血製作的遊戲《Sky光•遇》當中,陳星漢第一次嘗試應用內購方式盈利,但大多數內購是為了作弊然後炫耀,不符合他遊戲輕鬆積極的基調。

陳星漢定下的機制是,內購是為了積累禮物並把禮物送給他人,收到的人會獲得愛心,再用愛心解鎖隱藏服裝和道具。

結果,很多機制的漏洞被玩家發掘出來。

有人開小號給自己贈送禮物;有人打扮成可愛的小個子,賣萌向陌生人乞討愛心;還有人坐在聊天椅上,向每個坐下的人兜售愛心交換計劃……團隊不斷調整才控制住了比較健康的生態。[15]

人性的弱點決定了用戶與平台之間相互利用,互鑽空子的關係不可避免。

平台如果有意利用人性,則可能獻上讓人欲罷不能的推薦算法,用區區小利牢牢拴住用戶,那麼用戶一方幾乎沒有「勝算」。

但反過來,對於一心向善的平台來說,其它「受過鍛煉」的用戶反而成了能量更大的破壞者。

這一點不分中外皆然,是個世界性的問題。

只是,出自中文互聯網土壤的產品,還需要經受一些額外的考驗。

 難過語言文化關

中文互聯網是一個比英文小得多,又嚴重被割裂的盤子。

當然,這里說中文互聯網「小」,只是相對的。

一些小語種,甚至是北歐發達國家如冰島等的母語,在可以用英語的互聯網環境減少了使用的機會,都要陷入半消亡的境地了 [16]。

但相對的問題,畢竟也是問題。

最大的中文使用地區是中國大陸,擁有一套「自我循環」的系統。

而中國大陸以外的其他中文使用地區,則都傾向於為中文維基百科直接作出貢獻。

也就是說,全世界可能有,且只有一個維基百科,能受到如此大量且長時期的維護。

至於英語,由於使用遍及全世界幾乎所有地區,要從全球一百多個地區「掐尖」找到有錢有閒的頂尖人才,無疑容易得多。

在英語非母語的國家當中,能熟練掌握英語的人,一般都擁有比較好的家境和教育條件。

他們不太可能為了生計所迫,或者是完全出於惡作劇目的,而去專門做一些破壞社區生態的事情。

眾所周知,在國內卻有為數不少的人,意圖通過破壞一個本來清淨的網絡環境,目的僅僅是創造自己一點可憐的虛擬存在感和成就感。

雪上加霜的是,中文使用地區之間的教育、文化乃至意識形態區隔,也讓中文使用者相對其他語言,都更不容易傾力合作。

維基百科同樣面臨著編輯戰和「巨怪」(troll)的問題,但是這些戰爭的規模相對有限,在英文版只是集中於少數幾個議題,如特朗普和右翼詞條。

然而,中文維基百科的編輯戰自從 2002 年中文版開通以來就沒停過。

經歷了 2003 年簡繁體中文版合併,2004 年推出習慣用詞自動轉換軟件(如把「軟件」和「軟體」、「互聯網」和「網際網路」相互轉換,這是早期引發編輯戰的重要導火索之一)之後,基於意識形態的編輯戰仍不間斷,甚至根據維基人自己的記載,吉米•威爾士曾考慮過暫時關閉中文維基百科以促成強制停火。[17]

最終,戰況的基本平息還要倚靠中國大陸地區加大了直接訪問維基百科的難度。

這也讓人難以想像,萬一國內被攔住的千軍萬馬有了前去「戰鬥」的機會會怎樣……那恐怕會是一場史詩級的全面戰爭。

百科類產品的例子似乎證明,純粹「正外部性」的產品確實是存在的,但它的存在可能是偶然的,成功可能是不可復制的,對於「險惡」的中文互聯網環境來說,可能尤其缺少借鑒意義。

 結論

一個自始至終都實現「正外部性」,創造正向社會價值的公司,首先應該從一開始就聚集著擁有足夠多理想主義情懷,發跡之後又不忘初心的人。

吉米•威爾士如此,其它成功案例也如此。

其實有理想主義的人,在中國並不缺少,甚至於這些人不用必須出國,才能實現純正的理想主義。

在 GQ 最近一篇寫後廠村的報道 [18] 中,提到在百度 7 年的員工陳曉琪。

幾年前,同為互聯網高管的朋友賣掉北京的房和車,跑去麗江開客棧。

她動了心,也去體驗。

但過了一周她就待不住了,覺得還是每天看著無人車測試的日子帶勁兒,又回到後廠村。

在國內極端殘酷的「黑暗森林」中,像她一樣仍然能找到價值寄托的人,很少,但真不是沒有。

但要想讓國內也出現一些不至於過早夭折的公益型互聯網產品,至少還需要達到以下幾項:

1、應該是一個可以自循環,收支平衡,或者是維護成本極低,在可控範圍內的項目。

2、項目實施的過程當中,必然會產生用戶不正常使用帶來的干擾,這些干擾源於產品設計未曾考慮的缺陷,可能會帶來額外的運營成本。因此在估算成本的時候,要留出足夠多的提前量。

3、確定自己做的產品是針對中文(或中國大陸)市場還是針對全球市場。中文互聯網因為種種特色,比英文互聯網更難獲取成規模的、合適的用戶群,來維持一個公益性產品的運轉。

不論如何,產品適用的範圍還是要足夠廣泛,大到可以產生規模效應。畢竟「讓幾千萬人每人掏幾塊錢」比「讓幾千人每人掏幾萬塊錢」容易得多。

除了上文提到的部分,還有一些零散的要點,例如盡可能少涉及硬件或實體物品的生產。

產出大量固體垃圾的「創新」不僅是共享單車。

《紐約時報》也曾指國內外賣網站的興起連帶產生了大量白色垃圾。不論責任在於平台還是入駐商家,其造成的環境污染的負外部性在所難免。[19]

中國人辯論吵架,一句「你行你上啊」很容易把人說跳。

評論食物好壞不用自己做廚子,評論冰箱性能也不需要自己身體能制冷。

但對於一個產品如何在成長壯大過程中,避免產生太大的「負外部性」,這還真是確實屬於一個「你不上就不行」的范疇。

人人都知道這樣做哪里不對,但設身處地之下,不一定會想到更好的解決辦法,還有待後來人繼續嘗試。

  2000億條!中國國家圖書館將保存所有微博公開貼文:互聯網時代的國家記憶
  【百度貼吧衰亡史】百度貼吧清空2017年以前內容,中國網民15年的歷史一夜消失
  不知道就問度娘,現在的【百度知道】怎麼樣了?

參考資料:

[1] https://donate.wikimedia.org/

[2] https://annual.wikimedia.org/2016/

[3] https://www.cnbc.com/2018/03/13/youtube-wikipedia-links-debunk-conspiracy.html

[4] https://archive.org/details/911

[5] https://www.archiveteam.org/index.php?title=500px

[6] https://www.fastcompany.com/90279321/the-frantic-unprecedented-race-to-save-700000-nsfw-tumblr-for-posterity

[7] https://techcrunch.com/2018/03/24/are-corporations-that-use-wikipedia-giving-back/

[8] http://blog.flickr.net/en/2014/08/29/welcome-the-internet-archive-to-the-commons/

[9] https://www.wired.com/story/inside-the-alexa-friendly-world-of-wikidata/

[10] https://www.cnbeta.com/articles/tech/822909

[11] https://m.huxiu.com/moment/52647.html

[12] https://mp.weixin.qq.com/s/rHVra2qfZFUhuAyowadJDQ

[13] https://www.ifanr.com/859962

[14] https://www.cnbeta.com/articles/tech/852609

[15] https://mp.weixin.qq.com/s/aXJ8asx70hLetdDJyukcSg

[16] https://mp.weixin.qq.com/s/u2eYPP18NzxUnxFZQEb0_Q

[17] https://zh.wikipedia.org/wiki/Wikipedia:%E5%9D%8F%E7%AC%91%E8%AF%9D%E5%92%8C%E5%88%A0%E9%99%A4%E7%9A%84%E8%83%A1%E8%AF%9D/%E4%B8%AD%E6%96%87%E7%BB%B4%E5%9F%BA%E6%94%BF%E6%B2%BB%E7%BC%96%E8%BE%91%E6%88%98

[18] https://mp.weixin.qq.com/s/-FrcU0-jb7TqXIzNSlC50w

[19] https://www.weibo.com/ttarticle/p/show?id=2309404377330276557608

閱讀原文