造就第331位講者 崔曉波

TalkingData創始人&CEO


今天跟大家談兩個詞——城市,數據。


首先,我們來看一組數據。



截至去年,中國活躍的移動手機數量已經將近13億部。手機已成爲人類生活習慣的一部分。


其次,可穿戴設備飛速發展。有將近4千萬人日常佩戴着可穿戴設備。


再次,物聯網設備同樣在迅速發展。


所有這一切都使得數據的體量、維度呈現指數級的爆發。



數據多到什麼程度呢?


中國一年內產生數據的體量是350億EB。也就是說,如果我們把這些數據存在1T一塊的硬盤裏面,這些硬盤可以鋪滿中國960萬平方公里的土地,尚有剩餘。


這纔是大數據!


我們平時經常會把這些數據與傳統的數據概念混在一起。事實上,只有呈指數級增長的數據才能稱之爲“大數據”。



01
建一座數字城市,研究這個真實的世界


隨着大數據的體量、存儲量、維度的高速發展,我們的計算能力同步提升,逐步產生了智能。


此時,一個問題擺在我們面前。那就是,隨着數據體量的增加、算力的增長,我們看待世界的角度會不會發生變化?



我認爲,我們看世界的角度將從實體物質化轉化爲數據虛擬化。


這句話有點抽象。


我先給大家講一個故事,讓大家更容易理解。


去年我去美國參觀了很多無人車的企業。我去到谷歌旗下Waymo公司的主要實驗城市——鳳凰城,還參觀了它的實驗基地。意外發現每個研究員面前都有兩塊屏幕。其中一塊屏幕上貼了一張紙條,上面用紅字寫的英文simulation,翻譯過來叫模擬。


對此,我很好奇。於是,我就拍拍旁邊一個研究員的肩膀問:爲什麼你要貼這個紙條?


他說:以前我們是不貼的。但是後來,我有時候我分不清楚哪個是真實世界,哪個是我們用數字模擬的世界。在我眼中,它們好像看起來已經差不多了。


Waymo無人車在虛擬世界中進行測試



爲什麼像谷歌這樣的頂尖公司要做數字模擬的世界?


拿無人車來說,谷歌,花了十年時間,積累了大約400萬英里的路測數據。而特斯拉,每年只能收集100萬英里左右的路測數據。


但是,要實現無人駕駛,大家知道需要多少路測數據嗎?


至少一億英里。


按照現在這個速度是完全不可能的。


那怎麼來解決?


他們就開發了一套模擬系統,把鳳凰城每一個建築物、每一條道路,甚至每一棵樹木、障礙物都數字化了,形成了一座數字城市。


在這座模擬城市裏,會用很多無人車的模擬程序在“跑”,一天時間就能積累100萬英里的路測數據。


現在,無論是研究城市,還是研究別的商業問題,慢慢地已經不需要在實體世界裏做了,都可以把它們放在數字世界裏去研究。利用增強學習的方法,加速AI對世界的理解,併產生對世界的反饋。這將是未來所有的行業都必須經歷的一個階段。


02
將居民重新分類,新的城市規劃便誕生了


我們想象的城市是什麼?是鋼筋水泥的建築,還是休閒之地? 


其實,城市並非冷冰冰的,也不是靜態的,而是像脈搏一樣時刻跳動着。



現在的城市規劃與之前最大不同是什麼?技術讓我們可以實時看到城市中的變化,使得動態響應的模型成爲可能,而看待城市的方法也會隨之改變。


這是一張北京城區圖,裏面主要有兩種顏色:紅顏色表示高收入人羣,藍顏色表示低收入人羣。



這是非常傳統的研究城市方法,源於18世紀工業時代。那時候資源非常匱乏,屬於中心型的供給,因此在很多城市中產生了金融街、CBD等等。


實際上,這種城市結構會造成非常大的交通壓力、配套設施壓力、教育設施的壓力等等。


這種模式肯定是無法適應未來城市的。


仔細觀察這張圖會發現,在北京這樣人口密集的城市裏,其實已經出現了一些問題。


這個現象我們叫“時空摺疊”。


什麼叫時空摺疊?


就是不同收入層次的人,雖然在同一座城市生活,卻因爲生活習慣、工作性質、作息時間等種種原因,鮮有機會有所交集、發生交互。而一個真正有活力的城市,需要不同層次的人頻繁交流與交互。這在理論上早已經被證明瞭。


時空摺疊會帶來各種安全的問題、貧富分化的問題、相應設施配給等等各種各樣的問題。


那麼,有沒有方法能夠來解決這個問題?


我們在北京做了一些實驗。目前,北京的常住人口將近2600-2700萬。我們採集1000萬居民的數據。這些數據包括他們在線下所有行爲、位置和軌跡的數據以及線上所有行爲、訪問習慣、訪問網址的數據。


通過大數據的方法,我們嘗試將人羣重新分類,而不僅僅是像過去那樣,簡單地按照收入結構或者白領藍領劃分。


當我們用機器學習、矩列的方法細分時,會發現很有意思的事情。你會發現在大城市,所有人羣的習慣已經改變了,不再以朝九晚五上班族爲主,出現了一些新的羣體。



這些新羣體的名字實際上是我們取的。


比如“居家深宅幸福奶爸”羣體。他們每天待在家裏,玩遊戲、關注母嬰類產品,經常收快遞。這羣人的比例並不低。


還有我們稱之爲“城市自由工”的新羣體。這個羣體的誕生是由於共享經濟與外賣快遞行業的發展,讓城市中出現很多自由職業。他們大部分住在遠郊區縣,每天通勤距離非常遠。整天都待在室外,且在城市裏活動範圍特別廣泛。


還有一類“年輕文藝的買買買的女性”人羣。她們經常關注化妝、購物信息,熱衷出入演出場所。


慢慢地,人以羣分的基礎真的出現了。未來會按照人的生活軌跡、活動習慣、生活方式去劃分。大數據不再是冷冰冰的,而是以人爲本,反映人的生活習慣和個性特徵。


怎麼樣才能讓這些人在城市中活得比較舒服、比較爽?


我們做了名叫“city lens(城市透鏡)”的新系統,經由傳感器,把城市裏的人、物、街道及公共設施等數據收集上來。



但這些都是靜態的數據,不是最關鍵的。關鍵在於,我們用這些數據建立起一個立體的城市響應模型。


圖中紅色部分是北京國貿的中國大飯店。



可以看到我們重新劃分的那七類人羣的活動頻率、活動習慣以及他到底何時會出現在這裏。


基於這種新方法,我們對未來城市的建設思路會截然不同。未來城市不是中心供給,而是我們針對這些人羣的聚集地,重新規劃城市裏的資源。


不再是這裏建一個金融街,那裏規劃一個CBD,另一處是大學區。而是這些都融合在一個區域裏面。


只要有人羣聚集的地方,就需要配備一個類似新加坡鄰裏中心那樣的社區中心,解決所在居民的所有學習、工作、生活問題,讓他們享有足夠的基礎設施,並減少通勤時間。


這就是我們研究未來城市如何建設的新方法。


03
數據應該取之於民,用之於民


我們發現光研究人的行爲遠遠不夠。儘管太多的政府與企業很在乎大數據所反映的人的行爲。但我們發現人的行爲一點都不重要,重要的是行爲背後的心智。也就是他爲什麼要做這件事情?他爲什麼是這樣的生活習慣?



這是我們與MIT的Media Lab(媒介實驗室)合作的一個項目。我們用樂高搭起了一座“模擬”城市,這實際上是一個數字化模擬系統。


這個系統用來幹什麼?它曾在法國巴黎用來實現與市民的交互。


我最近看了很多中國的智慧城市項目,覺得大家的思路似乎都還侷限在管理、監管、洞察等方面,但我覺得這不是未來的智慧城市。


真正的智慧城市,是在它想改變交通設施規劃或者新建一幢建築物時,聽證會是由市民高度參與的。不僅有市長、規劃部門站在哪兒,還會有市民站在旁邊。


參與者可以拿一個樂高說,我想把這個建築物移到那個位置去。我想把這個商業寫字樓與那個住宅地產換換位置。而每次的調整,模擬系統會重新算出新的數字。



例如,當地的通勤指數會因此變成什麼樣,會不會產生新的擁堵?房價會不會升高?消費指數會不會下降?這纔是未來市民非常關心的事。


我們看到一些先進的城市的規劃與建設,往往是迴歸本質的,是以人爲本的。


爲了深入研究,我們又做了一些研究項目。其中較有代表性的是北京的大柵欄規劃。


大柵欄位於北京的前門,是非常有名的旅遊區,做設計的人特別喜歡去。


大柵欄中間有一條街叫楊梅竹斜街。左邊的圖與右邊的圖,佈置完全不一樣。左邊是政府的規劃,是把這塊區域全部推平,建了一些高大上的商業區,入駐很多所謂的老字號;右邊沒動,全是四合院、老城區、老胡同。



從熱力圖上,我們可以清楚地看到,白天的人流全都去了老宅區和四合院,沒有人喜歡去那些規劃出來的高大上商業區。


於是,我們就做了一個實驗,開發了一款遊戲。讓楊梅竹斜街的居民像搭樂高一樣,按照自己的想法擺放各種建築物。


不同的顏色代表不同類型的基礎設施,例如餐廳、便民設施、小賣部。大爺大媽甚至小孩都過來做遊戲。



結果特別好玩。你會發現當地居民非常有想象力。他們的擺法我們都想不出來。但是,你最終會發現居民設計的社區比規劃部門設計得更合理,更貼近他們的生活,貼近社區的本質。


如果大家有機會去楊梅竹斜街,可以看到許多四合院放了很多很先進的設備,爲的是讓當地居民感受美好的生活。


這就是我們所說的人本數據。也是爲什麼做城市規劃必須以人爲本的原因。


我們要回歸到城市和數據的本質。數據應該取之於民,用之於民。


04
做“正直”的數據公司


七年前我們創業時,幾個創始人坐在公園裏,一直在想如何將數據做到極致?它到底能解決什麼問題?



當時,我們總結了兩句話。


第一句是,數據會改變企業的決策。越來越多的中國的企業不會只靠拍腦袋、靠直覺、靠官職大小、靠嗓門高低來決策,而會用數據驅動的方法創造商業價值。


第二句是,數據將會改變人類的生活品質。這是我們的一個初心。大家已經看到數據與城市一旦結合,力量強大到足以改變城市的規劃與市民的舒適度。


上個月,我與英國前首相卡梅倫探討了人工智能這個話題。我說,現在很多人工智能的程序已經能改變選舉的結果了,你們這些政治家會不會覺得以後要失業了?


卡梅倫聽後特別激動。就此,我們探討了好久,最後一致覺得,有一個東西其實是人工智能無法具備的,那就是integrity,正直。


因爲人工智能是沒有人性的,它既可以作惡,也可以爲善。作爲未來的城市建設者和大數據擁有者,最重要的,其實已經變成了“正直”。



現在市場上非常多的亂象,大家可能都被賣房子、賣保險的人騷擾過。根源在於那些數據資產的擁有者、使用者偏離了“正直”這個軌道。


七年前,我們想用數據改變企業決策,改善大家的生活。


時至今日,我們覺得首先要做一家正直的大數據公司,這纔是目前這個階段對於我們來說最重要的。


  點擊閱讀原文,看「造就」更多演講。

相關文章