電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

本文來源:城市數據團(微信id:metrodatateam)+中國電信上海公司 聯合發布

(「上海居民」的含義是:從晚上23點-第二天早上8點,出現在上海市內同一地點的月累計時長,超過一定時長的電信用戶。)

每天都有很多人來到上海。

每天也有很多人離開上海。

這裡面有上海的原住民,有來滬多年已經安家立業的新上海人,也有懷揣夢想未定歸處的年輕人。

當我們說起「上海人」的時候,我們究竟在說誰?上海到底是誰的上海?

我們將從新老上海人(出生地籍貫)視角,嘗試回答這個常答常新的話題。

最近,城市數據團中國電信上海公司合作,利用脫敏數據,對上海居民家庭的籍貫分布特徵和人群特徵,進行了一個小研究。

特別說明:

1-數據脫敏方式為:將個人特徵標籤在500m*500m地理空間聚合後整體輸出,打標方法綜合了固網寬帶用戶數據和手機用戶數據。

2-「上海居民」的含義是:從晚上23點-第二天早上8點,出現在上海市內同一500m*500m地理空間的月累計時長超過一定閾值的電信用戶。

3-「居民籍貫」是以身份證前幾位代碼推測的出生地省份,與實際籍貫可能略有出入。

根據這組數據,2017年上海居民的籍貫來源地TOP10及其比例為:

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

可以看到:

1.本地籍貫的「老上海人」占比約60%;

2.外地籍貫的新上海人(以下簡稱為「新上海人」)的主要來源地依次為安徽、江蘇、河南、江西、山東、浙江、湖北、福建和四川。

是的,上海有40%左右的市民來自於全國各地、甚至全世界各地。

由此可以判斷,上海早已不僅僅是原住民的上海,而是全國人民乃至全世界人民的上海了。

接下來,我們設計了一組指數,用以比較不同來源地居民的生活狀態:

1. 居住空間指數(居住地人群分布比例:每個格子裡的某來源地新上海人占總人數的比例、居住空間中心度指數:某來源地新上海人居住在市中心10km範圍內的人口占該類新上海人總數的比例)

2. 經濟能力指數(包括房屋價值指數、車輛保有指數、手機品牌指數;該指數越大,說明綜合經濟能力越強)

3. 人生階段指數(包括平均年齡指數、家有老人指數、家有小孩指數;該指數越大,說明平均年齡越大、或家中有老人小孩的概率越大)

4. 返城比例(2018年春節後返回上海的比例,來源為《2018年Q1滴滴出行報告》)

通過對四個指標的綜合評估,我們可以對不同來源地的在滬人口進行分類:

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

(說明:指數都進行了標準化處理,位於0~1區間。上圖中線條越貼近邊緣說明指數越大,線條越貼近中心說明指數越小;如安徽籍新上海人(右下圖紅線)的返程比例指數高、人生階段指數低。)

老上海人:多居住在市中心地段,綜合經濟能力強,平均年齡偏大、以家庭為單位生活。

江蘇、浙江籍新上海人:主要居住在中環-外環附近,經濟能力與上海人不相上下,在新上海人中屬於年齡較大的。

江西、湖北、福建籍新上海人:主要居住在外環周邊,經濟能力指標略低於江浙人,年齡居中。

山東、河南、四川籍新上海人:居住在外環周邊和部分郊區,年齡最小,經濟能力一般,2018年春節後,有大約四分之一未返回上海。

安徽籍新上海人:廣泛居住在全市各個區域,年齡適中,經濟能力較差,但返城率很高。

接下來,我們針對每一個類型具體來看吧。

1.老上海人

老上海人的空間分布規律呈現兩極分化:要麼住市中心、要麼住遠郊。

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

(說明:上圖表示上海人占所有常住人口的比例。顏色越紅代表比例越大、濃度越高,越藍代表比例越小、濃度越低,下同。)

市區的老上海人比例最高的是浦西的市中心。近年來,市中心多為老房子、少有新房子、且房價昂貴,故住房很多都在老上海家族間傳承。

因此,市中心的老上海人比例得以保持在高水平,而該區域的新上海人相對濃度較低。而浦東的老上海人比例最高的則是南匯地區(臨港除外)

同時,老上海人在郊區的青浦、奉賢也有明顯的聚集點,而崇明三島上,崇明和橫沙為老上海人集聚。

由於代際傳承、生育意願等諸多原因,老上海人的平均年齡遠比新上海人要大:

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

接近10歲的年齡差距暗示著兩件事:

1. 老上海人的老齡化程度非常嚴重,近年上海城市的快速發展很大程度上依賴於新上海人的支撐;

2. 老上海人的消費動力、消費水平比年輕的新上海人低。這一點,在數據中也有所體現。

一方面,由於占據較好的地段,老上海人的房屋價值遠遠超過新上海人;另一方面,老上海人對汽車和手機的消費水平卻比較低。

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

老上海人是上海市民群體中最大的組成部分,是上海城市發展的中堅力量,毫無疑問,上海是老上海人的上海。

那麼,新上海人的情況如何呢?先來看看占比最多的安徽籍新上海人吧。

2.安徽籍新上海人

有意思的是,安徽籍新上海人在空間分布上與老上海人「互補」。

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

具體而言,安徽籍新上海人比例最高的地方在松江、金山、嘉定、浦東北部,而這些正好是老上海人比例最低的地方;安徽籍新上海人比例較低的中心城區和青浦、奉賢、浦東南部、崇明等地,則正好是老上海人比例最高之處。

安徽籍新上海人的綜合經濟能力較差,房屋、車輛、手機三個指標都不突出。

然而,他們卻非常喜歡上海:

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

上圖中,橫坐標代表不同籍貫新上海人的綜合經濟能力指數,縱坐標代表他們在2018年春節後返回上海的比例。總的來說,經濟能力與返城率之間存在一定的正相關性,但安徽籍新上海人卻是一個異常值:他們的春節後返滬率遠遠高於按經濟能力測算的預期水平。

安徽籍新上海人更多的分布在了老上海人濃度較低的地方,他們綜合經濟能力指數偏低,但是對上海的忠誠度很高。他們需要上海,上海也需要他們,毫無疑問,上海也是安徽籍新上海人的上海。

3.浙江、江蘇籍新上海人

浙江和江蘇雖然地域相近、文化相近,但浙江人和江蘇人來到上海以後,居住地的空間比例分布特徵卻截然不同。請看下圖:

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

浙江籍新上海人在市區有張江、顧村、嘉定新城三個高濃度的小聚集點,在郊區的西南角有楓涇-朱涇有一個高濃度的大聚集點。不難發現,沿著朱涇-楓涇一路西去,便可進入浙江境內,看起來他們是新上海人中最戀家的一個族群。

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

而江蘇籍新上海人則在西南、西北、東方都有較高比例的連片分布,同樣與老上海人形成「互補」之勢。

經濟能力方面,江蘇、浙江籍新上海人都處於很高的水平。不同的是:江蘇籍新上海人在房屋、車輛、手機三個指標上的表現非常均衡,而相比之下,浙江籍新上海人用更好的手機,但汽車保有指數偏低:

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

(說明:指數都進行了標準化處理,位於0~1區間。上圖中「倒Y型」藍線越長說明指數越大,藍線越短說明指數越小。)

江浙籍新上海人是與老上海人特徵差異較小的一個族群,從歷史原因和地域臨近的角度不難解釋。他們是這個城市中的重要奮鬥者,毫無疑問,上海也是江浙籍新上海人的上海。

4. 福建、湖北、江西籍新上海人

湖北、江西、福建籍新上海人的空間分布也各有特點。

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

在空間分布上,湖北籍新上海人有三個明顯的高比例帶狀區域,分別是大張江地區、嘉定和松江。

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

江西籍新上海人在嘉定北部、寶山北部、松江有大片高比例分布,同時在奉賢、南匯老城區、以及長興島西側也有小片的聚集點。

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

而福建籍新上海人則沒有高密度的大範圍分布,而是以「抱團」形式,在徐涇、泗涇、楊行等多處形成小範圍組團,這可能跟福建人的宗族、同鄉的社會網路文化有關。

福建籍新上海人不僅愛抱團,家庭觀念也很重。與相似年齡階段的其他新上海人相比,福建籍新上海家庭中有小孩的比例更高。

湖北、江西、福建籍新上海人也是各有特色的分布在了上海的不同地區,他們也是上海市民中的重要組成部分。毫無疑問,上海也是湖北、江西、福建籍新上海人的上海。

5.山東、四川、河南籍新上海人

從空間上看,山東、河南、四川籍新上海人的居住空間總體較為邊緣,但彼此之間又有所差異。具體請看下列圖紙:

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

山東籍新上海人似乎對於港口、碼頭等對外樞紐有著強烈的偏好,高比例聚集區分布在外高橋-浦東空港、臨港和楓涇。

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

四川籍新上海人似乎對製造業有更明顯的偏好,高比例聚集區分布在金山產業園區、松江產業園區和寶山產業園區。

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

河南籍新上海人的擴展趨勢大概是「山東+四川」,在外高橋、嘉定北部、松江西部均有高比例集聚點。

總的來說,山東、河南、四川籍新上海人的居住空間較為邊緣化(居住空間中心度指標較低)。住得遠,可能意味著更少的工作機會、或者更長的通勤時間、或者不那麼完善的生活服務和娛樂服務。

但同時,他們又是這個城市裡最年輕的一群人:

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

可以看到,人生階段指標下的三個分指標(平均年齡、家有老人、家有小孩)間存在明顯的同步變化。比起年齡較大、已經成家立業的江浙滬人,年齡較小的四川、山東和河南籍新上海人更多是獨身、或與年齡相仿的好友/情侶一起在滬打拼。

但是,在2018年返鄉過春節後,大約25%的四川、河南、山東籍新上海人沒有再回到上海:

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

可以看到,返城率與人生階段指數(指數越小,說明平均年齡越小、家有老小的比例越低)呈現顯著的正相關(相關性系數為0.905)。越年輕的人,回來得越少,離開得越多。

山東、四川、河南籍新上海人是最典型的奮鬥者形象,他們是這座城市的最具活力的市民。雖然有返鄉意願加強的趨勢,但是,毫無疑問,上海也是山東、四川、河南籍新上海人的上海。

寫在最後的話

以上是我們通過數據,對不同出生籍貫上海居民的居住空間和生活狀態的一些推測。

然而,所謂「生活狀態」,並不是冷冰冰的數字,而是一個「如人飲水,冷暖自知」的命題。

我們並不真切地知道,新上海人在上海過得怎麼樣。我們只知道,他們還沒有進入上海的心臟(市中心)。

請看下圖:

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

(說明:上圖表示新上海人占所有常住人口的比例。顏色越紅代表比例越大、濃度越高,越藍代表比例越小、濃度越低。)

至此,請允許我們暫時脫離一個嚴謹的數據分析師的角色,涉嫌過度發揮的腦補一張畫面:

幾百萬新上海人,高濃度的聚居在外環以外,每天奔波在路上3個小時以上,只為了心中的夢想,也許是為了逆襲人生出人頭地、也許是為了給孩子更好的教育機會、也許僅僅是為了生存和糊口……

當我們重新提出這個問題:上海是誰的上海?

我們想說,上海應該是所有奮鬥者的上海,上海應該屬於每一個來此隻身闖蕩的人,上海應該屬於每一個來此逐夢青春的人。

不僅如此,上海應該公平、包容的對待每一個奮鬥者,這才是我們心中的上海,這才是我們心中的偉大城市。

說明:

1.本文作者為 團支書、T1000。數據由中國電信上海公司提供,文章由城市數據團與中國電信上海公司聯合發布。

電信用戶可以視為上海居民的抽樣,但由於存在一定的抽樣誤差,且數據進行過脫敏處理和算法加工,本文的結論可能與真實情況有所出入。

電信大數據告訴你,上海是誰的上海?多少比例來自多少省份,都聚集在哪裡?

2.數據脫敏方式為:將個人特徵標籤在500m*500m地理空間聚合後整體輸出,打標方法綜合了固網寬帶用戶數據和手機用戶數據。

3.「上海居民」的含義是:從晚上23點-第二天早上8點,出現在上海市內同一地點的月累計時長,超過一定時長的電信用戶。

4.「居民籍貫」是以身份證前三位代碼推測的出生地省份,與實際籍貫可能略有出入。

閱讀原文

熱門書籍》中國奇蹟的句點:殭屍企業、鬼城與影子銀行,停滯的中國將如何波及全球經濟?新的成長力道會出現嗎?