靠一張十年前的照片,騰訊AI技術找回了被拐十年的孩子

本文來源:騰訊文化

微信id:TencentMonthly

2019年5月3日,CCTV-1《等著我》一期特別節目播出現場,桂宏正緊握住妻子的手,緊張地期待那個十年來在腦海中出現過無數次的身影。

即便那個身影最終沒有出現,夫妻倆還是激動得抱頭痛哭,因為警官告訴他們,被拐長達十年的孩子,終於找到了。

十年來的風餐露宿、大海撈針,在這個消息面前都不值一提。

▲CCTV-1《等著我》節目回看

癌症老人的心願

2015年,四川的桂宏正夫婦摩挲著兒子桂豪的照片,小心翼翼地將它放入行囊,再一次踏上了尋子的路。

這張照片是除了兒子桂豪六年前被監視器拍下的模糊畫面外,留下的唯一照片。

與之前漫無目的的在全國各地找孩子不同,這一次夫妻倆有了明確的目的地——廣東潮汕。

原來,四川警方在此前對一名因拐賣兒童而被捕的逃犯進行了突擊審訊,結合之前大量的搜證與調查,才確定了2009年那批被拐的孩子被賣到了潮汕。

而桂豪的爺爺也在這一年得了肺癌,看著父親的身體每況愈下,桂宏正知道父親心中最大的念想就是再看一看孫子。

▲桂宏正尋人途中

絕境中的轉機

四川警方迅速組織警力前往展開調查。

起初警方拿著被拐孩子的照片,在各村鎮、縣市進行人力摸排。

但是,那批被拐賣的孩子當時最大的不過三四歲。

小孩長得快,幾年間容貌變化巨大,這讓警方的調查進行得很不順利。

「如果能有一種方式,不用通過人工摸排比對,就能精準鎖定對象,那就太好了。」一線辦案的民警們,急切的期盼著更加高效的尋人思路和方法的出現。

2015年,桂宏正夫妻的尋子之路正在悄然迎來改變。

彼時,利用人工智慧進行深度學習的浪潮開始席卷學術界,騰訊優圖實驗室也開始借助深度學習技術,來提升人臉識別的能力和效率。

轉機出現在2017年。

2017年5月,福建警方上線了一個名叫「牽掛你」的尋人平台,應用騰訊優圖實驗室的人臉識別技術,嘗試幫助尋找走失的老人和小孩。

令人意想不到的是,僅僅上線半年時間,「牽掛你」平台就幫助尋回了500多名走失人員。

這樣的成績很快就引起了四川警方的注意。

聽說人臉識別可以用來尋人後,他們馬上聯繫了和警方有密切合作的騰訊守護者計劃,希望能夠共同用優圖的人臉識別技術進行一次尋人行動,找到這批孩子。

CCTV-1《等著我》欄目也馬上加入了這次尋人行動。

這次通過人臉識別技術的尋人項目,是一次新技術的嘗試,同時也是《等著我》欄目組一直的期待。

唯一的念想

負責和警方對接這次尋人行動的,是參與騰訊守護者計劃來自安全管理部的Harry。

加入騰訊之前,Harry已經是一名擁有十多年從警經驗的人民警察。

利用自身多年從警經驗,將最新的前沿技術推薦給警方用於案件打擊,是他加入騰訊的初衷。

經過初步了解,Harry知道這次跨越十年的尋人難度極大,和尋找短期走失人口的「牽掛你」平台相比根本不是一個量級。

這批被拐兒童從幼兒到少年的十年,是人一生中容貌變化最大的階段。

其技術難度是幾何級倍數增長的,這在當時國際上都是一個巨大的學術難題。

然而,Harry和團隊還是義無反顧的答應了下來,哪怕有一絲希望,也不放過任何一次找回孩子的機會。

「我相信我們的技術團隊,我覺得他們和我一樣,都是願意用技術讓世界變得更好的人。」

懷著這樣的初衷,為了找回被拐的孩子,守護者計劃團隊通過四川警方拿到了這批被拐超過10年孩子的照片,作為優圖實驗室進行深度學習和比對的素材。

這是尋親的唯一線索。

團隊向警方獲取照片的過程中,真切地感受到,孩子被拐賣,會對一個家庭造成多大的打擊。

同樣十多年警察出身的守護者計劃團隊成員Hyman,這位一米八的硬漢難掩聲音的哽咽:

「這些家庭非常不容易,像桂宏正夫妻倆多年來一直堅持找孩子,花光了積蓄就回家賺錢然後繼續上路。」

「這對開酒鋪的夫妻,十年來堅持不撤,就是為了等孩子找回來;有的父母已經因為找孩子的事離婚了,然而一旦有孩子的消息,兩個人還是會湊在一起尋找……」

一聽說原片能夠提高識別的概率,這些父母即便強忍不捨,也一層層地包好交到辦案民警的手中,一直囑咐,「就這麽一張照片,可一定要送回來啊。」

這張照片,就是他們唯一的念想。

「哪怕多找到一個也是好的」

照片寄到上海的那天,優圖的Darwin博士和團隊成員一起拆開包裹,他們一張一張地仔細看完照片,卻紛紛皺起了眉頭。

「照片數量太少而且質量太差,有的孩子甚至只有一張照片,很多照片面部都比較模糊。」

在正常情況下,這樣的照片根本沒辦法作為機器學習的素材。

但是,當大家回想起剛剛拆快遞時,每一張照片都被油紙包裹得嚴嚴實實。

其中有一個孩子為數不多的照片全是他的百天紀念照時,Darwin博士和團隊成員意識到他們沒辦法再要求更多了。

「我們盡最大努力去做,哪怕最後能多找到一個也是好的。」

「我想用我們的技術為這個社會做點事情,幫一幫那些一直再堅持的父母。」

Darwin博士對大家說完,親自將這些照片進行高清掃描後,又小心翼翼地把照片用油紙包好,寄回了四川。

那段時間團隊成員似乎達成了某種無聲的共識,迅速成立專項項目組,每天晚上留下來研究技術方案,把更多精力轉移到尋人項目上來。

沒有現成的訓練素材,團隊就想方設法找來了大量不同人群不同年齡段的圖像。

將圖像進行維度提取處理後,交給機器進行識別和訓練。

千萬級海量的數據訓練,是一項非常浩大的工程。

經過幾個月的訓練,優圖的跨年齡人臉識別技術的準確率有了極大提升。

但是提升後的準確率,仍然不足以運用到實踐當中。

即使是在十萬級別規模的實際應用當中,1%的誤差都會帶來1000人的誤判結果,這是不能接受的。

▲機器將圖像轉換成數據進行學習

從大海撈針到精準尋人

就在團隊一籌莫展地思考改進的方案時,一個噩耗傳到了上海。

「桂豪的爺爺走了。」

2018年5月,正在河南參加尋親大會的桂宏正接到了一個從四川打來的電話。

還沒放下電話他就失聲痛哭起來,「我的老父親去世了,我要回去送送他。」

一直苦苦支撐的老人,終究是沒有等到自己的孫子回家。

這樣的悲劇不能再發生了,時間拖得越久,找到這些孩子的希望就越渺茫。

聽到這個消息,正在攻堅的優圖團隊,下定了更大的決心。

「能不能用機器來教機器,讓分布好的模型去指導分布不好的模型?」

優圖團隊核心成員Quant在此時提出了一條開創性的思路,讓優圖團隊在缺少訓練素材的情況下大大提高了機器學習的效率,準確率也穩步提升。

最終,將跨年齡識別的準確率穩定在了96%以上。

▲人臉比對示意圖(這是動圖,請點擊)

也就是在桂豪的爺爺離開人世的那個月,警方的案件偵破有了突破性進展。

優圖團隊用警方提供的海量數據進行了第一次實際比對,警方圈定了與每個被拐孩子最像的排名前五的結果,進行了最後的確認。

讓技術充滿溫度

騰訊守護者計劃的Harry在機場焦急地徘徊,時不時看一眼手機,好像怕錯過什麼消息。

他在等一個來自警方的關鍵電話。

距離前往一線協助警方採集目標對象的DNA已經過去了三天,還是沒有消息。

乘坐的航班馬上就要起飛,他擔心自己不能第一時間接到比對的結果。

就在飛機即將起飛,Harry馬上要關機時,他接到了這個期待已久的電話。

「4個!」

第一批比對,優圖的跨年齡人臉識別技術就找到了當年十個被拐孩子中的4個,其中有3個是在評分最高的目標中命中。

Harry難掩內心的激動,第一時間將這條消息通過微信傳達給優圖實驗室的同事們,才安心關上了手機。

遠在上海的優圖實驗室裏,當大家看到微信裏群裏傳來的喜訊,所有人都沸騰了!

Darwin博士暗暗握拳,Quant露出了欣慰的笑容。

在這群擁有理性的大腦和溫柔內心的研究員眼中「做人臉識別的時間越久,就會越信賴機器給出的結果。」

這次比對的成功,讓警方意識到,他們尋求多年,能夠進行遠程科學比對,精準鎖定目標對象的新尋人方式終於出現了。

而Harry和優圖實驗室的同學們,又一次通過實際行動,踐行了他們用技術讓世界變得更加美好的初心。

▲騰訊優圖人臉識別演算法負責人Darwin博士

最重要的,是那些苦苦尋找孩子多年而無果的家長們,又燃起了希望。

技術的突破,讓一個個破碎的家庭重新團圓有了更大的可能。

在這之後,騰訊優圖實驗室與警方以及CCTV-1《等著我》欄目組志願者們,又陸續進行了兩次規模更大的比對。

截止到目前,已經成功找回10個孩子中的7個,桂宏正夫妻苦苦尋找了十年的兒子桂豪終於被找到了。

距離完全找回那批十年前被拐賣的孩子的目標已經越來越近,這在中國打拐尋人的歷史上,都是一次前所未有的突破。

▲桂宏正夫妻現場流下激動的熱淚

那些聽起來遙不可及的技術其實離我們並不遙遠,那些看起來復雜的公式和符號其實也並不冰冷。

因為在這些技術背後的,是一群有著堅定信念和柔軟內心的人集結在一起。

他們讓技術不再是停留在電腦螢幕上的代碼,讓技術越來越有溫度。

他們正在創造一個富有想像力和充滿無限希望的未來。

  人大代表建議「拐賣婦女兒童罪,最高調至死刑」,網民熱議大力支持
  四川五歲被拐走的男童34年後終和家人團聚,母親因思念悲傷已經失明。
  武漢大學數據調查報告:中國兒童販子最常走的10條路,重慶、成都是「兒童的噩夢」。