AI在一定程度上重塑了我們觀察和記錄世界的方式。

DJI大疆推動機器視覺、深度學習技術與無人機等設備結合起來,將複雜的操作變成簡單的指令,讓專業影像記錄門檻不斷降低,普通人也能輕鬆地實現自己的創作構想。

航拍無人機進入機器視覺時代

當精靈2被冠以Vision之名起,大疆就已經顯露出它在機器視覺領域的野心。2015年,初代智能跟隨的雛形成功在研究室中誕生。

(知乎動圖顯示失靈,在手機端雙擊該圖即可查看動態效果)

次年3月,大疆精靈 Phantom 4 誕生,這款消費級無人機具備環境感知與避障、視覺追蹤、指點飛行三大創新功能,標誌著消費級無人機從此擁有了「視力」與「智力」,能夠識別周邊物體、判斷飛行環境,並在一定條件下實現自主飛行。無論在當時還是現在看來,都是革命性的創新。

(知乎動圖顯示失靈,在手機端雙擊該圖即可查看動態效果)

什麼是機器視覺呢?機器視覺是人工智慧正在快速發展的一個領域方向。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷,先將被攝取目標轉換成圖像信號,得到被攝目標的圖像後,通過數學模型計算,提取目標的多層次表徵,再結合立體幾何與運動學模型的計算,對目標的位置進行測量、估計和預測,進而根據一系列觀測數據來控制設備動作。

當時的精靈4通過程序預設好的參數和演算法來識別物體的主要特徵,在識別目標對象後,協同飛控完成空中自動構弧等操作,極大降低了使用者的操作門檻。

在實際操作中,用戶只要在DJI GO App中選擇「智能跟隨」模式並點擊被跟隨目標,精靈4便會在視野中自動掃描該對象,將相機鏡頭牢牢鎖定在被跟隨對象身上,而且在被跟隨對象進行不規則運動的時候,精靈4也能進行跟拍。

先進的機器視覺技術讓航拍不再是專業人士的權利。「精靈4開啟了一個全新時代,讓初學者也可以自如操控無人機,將用戶從繁瑣操作中解放出來,專註於航拍。」

引入深度學習演算法,識別能力也更為精確。

如果你聽說過AlphaGo那次震驚世界的人機圍棋大賽,那你一定對深度學習不陌生。從16年至18年,歷時3年的跨步,人工智慧所採用的深度學習演算法,被成功引入到無人機開發當中。

無人機的深度學習,就是通過對大量物品和身體的樣本學習,讓它能夠更加智能而準確地識別出被攝物體。

當時,為了讓大疆精靈4P能夠對運動物體進行自動跟隨拍攝,研發人員加入了更多特徵模型,也通過大量的樣本學習,讓飛行器可以分辨人、汽車、船隻,根據物體運動速度調整靈敏度,拍攝更加流暢穩定。

最後先進的圖像識別演算法讓精靈 4 Pro V2.0能識別和追蹤拍攝對象,在運動中保持構圖一致,讓高難度航拍變得輕而易舉。

深度學習演算法的運用,也為御2無人機航拍效果錦上添花。

(知乎動圖顯示失靈,在手機端雙擊該圖即可查看動態效果)

強大的跟隨性能,讓御2除了主動繞行之外,還實現了軌跡預測、高速跟隨等更多效果,識別能力也更為精確。

(知乎動圖顯示失靈,在手機端雙擊該圖即可查看動態效果)

語義理解作為計算機視覺領域的一個重要研究方向,大疆在該領域的研發成果為精準農業提供了新的科技支持。

比如在果園場景中,果樹往往分布不均勻,高矮差異大,期間也經常夾雜建築物、電線杆等障礙物,針對果樹的全自動噴洒作業難度較大。而利用三維重建和深度學習技術,精靈 4 RTK版、多光譜版可以對植保機作業區域進行三維場景的精準掃描,通過大疆智圖軟體構建果園場景的三維模型。

基於深度神經網路的三維模型識別系統,即可在三維模型中識別出果樹、建築、電線杆等物體,並標記出每棵果樹的位置與樹冠大小,構建果園三維語義地圖。就這樣,地塊區域狀況一目了然,就可以即時洞察植物健康,根據準確數據進行打葯、施肥等精細作業。

人人都能用得上的人工智慧

在航拍場景中,大疆的智能跟隨技術已趨成熟,但是他們並未止步於此。

大疆針對手持場景進行了專門的優化,引入了基於頭肩的檢測與跟隨演算法,並把學習樣本增加到千萬量級,從而覆蓋更多場景,這就是2019年推出的全新智能跟隨3.0。

(知乎動圖顯示失靈,在手機端雙擊該圖即可查看動態效果)

基於頭肩模型演算法,智能跟隨3.0可以智能識別頭部與肩部的協調關係,不僅跟隨目標時不易丟失,對於用戶的低頭、轉身、跳躍等豐富的動作變化,都可以被捕抓到。

而且,採用頭肩演算法的智能跟隨3.0,從遠到近都能夠精準識別判斷,相比身體與臉部識別而言,能給用戶提供更大的創作空間。

(知乎動圖顯示失靈,在手機端雙擊該圖即可查看動態效果)

當然,智能跟隨3.0最有意義的地方還不僅於此。

在這個全民vlog的時代,每個人都亟需一個功能強大且操作門檻低的拍攝設備。而智能跟隨3.0,就實現了這一點。它是一個真正意義上的,人人都用得起的人工智慧。

(知乎動圖顯示失靈,若在APP端請雙擊該圖即可查看動圖效果)

之所以說它變得「人人用得起」,是因為之前的智能跟隨技術,因為涉及龐大的計算量,必須依靠特定的硬體模塊才能實現,所以基本只能應用在無人機產品上,使用門檻相對較高。

(知乎動圖顯示失靈,在手機端雙擊該圖即可查看動態效果)

而智能跟隨3.0極大優化了演算法,在保持演算法精度的前提下,使得技術更加的輕量化,讓即便是晶元能力稍遜的千元手機,都可以用上這個功能。大疆在2019年發布的靈眸手機雲台3、如影SC都應用了這項技術。

(知乎動圖顯示失靈,在手機端雙擊該圖即可查看動態效果)

未來,依然有無數的可能

2019年RoboMaster 機甲大師賽的全國賽事的直播中,最新一代AI技術應用讓畫面更趣味性和觀賞性。

可以看到,畫面上可以動態顯示對戰小車類型、種類和血槽進度。注意了,這不是事後加的特效,而是直播實時渲染的結果。

這樣的效果看似簡單,但在技術層面實現相當不容易。識別物體運動變化非常豐富,現場環境光照不僅很弱而且還有各種光影變化,加上實時顯示不能有拖影的限制,對演算法的要求非常高。

未來,這項技術與AR增強現實結合後,必將大放異彩。

隨著以人工智慧為代表的新一輪信息技術革命的突破性進展,影像技術必將迎來高速發展和革新的歷史時刻。

我們可以一起期待,屬於大疆的下一個「不可能」。

關注 @DJI大疆創新 ,為你分享最新鮮專業的內部技術乾貨及產品資訊~


學科教育。

從我的設想來看,我認為AI將是未來教育的趨勢。一直以來,我都在想一個問題,我們的教育缺乏什麼。個性化和定製化。因為我們從事教育的都是老師,給學生解答問題都只能來一個講一次,或者選擇大部分人錯誤的集體講解。也就是說,作為一個老師,我們對學生的指導最小單位為班級。但是作為變化不算大,或者說幾乎沒有變化的知識,引入Al進行定製,將最小單位到達個人。

其實,我們平時所做的作業,目的是什麼?不就是為了將不會的地方暴露出來嗎,不知道各位有沒有看過一個魔術。就是給你一張紙,你在上面挑一個字,然後魔術師依次給你看5張不同的紙,你只需要回答他上面有或者沒有即可,然後他就會告訴你那個字是什麼。實際上就是一個交集和補集之間的應用而已,而在我們的教學上,其實作業的設計也可以利用類似原理,通過這種方式對學生的知識盲區進行鎖定。想想都知道沒有一個老師能夠做到,但是對於AI來說確是可以。

同時,大家有沒有想過,我們每個人在學習上的成長其實會反應在我們的每次考試中,當然一個人只是個例,可是每年每屆有多少的學生?這些學生的數據,甚至能做到包含每個階段不同類型的學生,我就問問大家高考前做這麼多模擬題,每份都是你需要的嗎,做完之後你知道自己應該往那個方向查漏補缺嗎?學生太容易迷戀在題海裡面,而老師只能根據全級或者全班的情況布置模擬題,甚至老師也不會分析哪些模擬題適合。

我希望,有一天,我們每個人的備考都能做屬於適合自己的模擬題,希望每個人做完每次考試後,都能拿到屬於自己的反饋。這些靠老師做不到的,但是靠AI卻可以。

當然這是我們對Al最理想的期待,能夠完成自主的分析,題目的推薦等等。

其實從信息技術上,我認為各個互聯網大廠都完全有能力去實現這個,但是從我接觸來看,各大互聯網大廠都有向教育業進軍的想法,但是他們都只是著眼於將線下課程搬至線上,主要招聘還是一些前端後端等技術人才。

但是要完成我上述的期望和設計,沒有一個厲害的教育團隊是做不到的。

奈何我不勝碼力,亦無資本。希望有朝一日,我能把這個夢想實現了吧。


我目前在做的一件事,就是利用AI反射人類的學習方式,以AI為鏡而明己身。如何理解呢?

像其他回答所講的AI革新與進步,本質上都是將AI當作一件工具或一個發明,與計算機、汽車似乎沒有什麼差別,作為一種技術手段來看,這樣的理解非常準確。不過,讓我們再稍微思考一下這其中的不同

AI在做的,是將人類的認知、學習、記憶等功能剝離出來,並在二進位計算機上復現,以獲得特定任務上快速、準確的處理能力。在某些任務上,比如自然語言處理中的文本分類,BERT衍生的最新模型甚至已經達到超越人類基準線的水平。歸根結底,AI學科在誕生之初,就是從腦科學以及認知神經學衍生而來的,也就是說,AI的底層學習方式,本質上就是在模仿人類,比如最著名的深度神經網路,其神經元激活方式和多層結構就是直接效仿了人腦神經網路的機制。

既然如此,我們能不能將AI看作人的多個子集,不同子集中活躍的某些模型或系統機制,正好對應著人類所具有的某種思考、學習模式?更進一步,這些模式是否可以被用來借鑒,甚至提升人類的思維方式?

答案是肯定的。

雖然我的研究從去年開始,在各個平台已經發表了一些成果,目前也幫助了上萬名對思維、學習方式感到困惑的學生,但因為只是個人的業餘興趣,缺少系統性的計算機科學、神經學及心理學的實驗結論支撐。不過,有趣的是,Deepmind前段時間發表的論文,正好印證了我的假說:

Prefrontal cortex as a meta-reinforcement learning system?

www.nature.com

這篇paper論證了人腦的前額皮質與AI強化學習系統的聯繫。為了證明導致人工智慧元強化學習的關鍵因素也存在於大腦之中,DeepMind 研究者提出了一個理論,也就是我所說的AI反射理論。該理論不僅符合多巴胺和前額葉皮質的現有知識,而且也解釋了神經科學和心理學的一系列神秘發現。尤其是,該理論揭示了大腦中如何出現結構化的、基於模型的學習,多巴胺本身為什麼包含基於模型的信息,以及前額葉皮質的神經元如何適應與學習相關的信號。

根據論文中的描述,對人工智慧的深入了解可以幫助解釋神經科學和心理學的發現,這也強調了領域之間可以互相提供價值。比如在目前進展較快的強化學習領域,根據智能體的學習模式,我們已經可以從特定的腦迴路組織中獲得許多逆向思維的益處。

舉個例子,我的第1期文章從強化學習講起,最後通過智能體的學習方式,解構了日常生活中遊戲的成癮機制,最後藉助強化學習系統的知識,總結出了如何高效利用大腦的系統機制進行學習

圖靈的貓:【思維論01】如何讓自己像打王者榮耀一樣發了瘋、石樂志的學習??

zhuanlan.zhihu.com圖標

在未來,希望有更多科研成果出現,讓我們可以通過通俗易懂的語言,將這種思維方法普及給更多人,提高我們獲取知識的能力,並改變對事物的認知和思考習慣。


不是AI從業人員,就從兩個身份入手回答嗷。科研人員和城市規劃師,還都非常初級,觀點不成熟,看官輕拍。我的觀點都是基於ai能做好,做不好的大概只能叫機器,所以比較誇張哈。

城市科學。AI可以自動做研究,寫基金,寫論文。個人三年文獻閱讀量估計在2000篇左右,寫作量去年大概不到20萬字。有了科研AI。我這種弱雞大概可以被導師辭退退學了。分分鐘成千上萬的文獻檢索量,分分鐘寫出科研八股文。。即便未必有特別大的價值。可架不住人家做的多啊。。這種科技創新能力不敢想像。。。甚至可以發展一些新領域,會不會有一些領域的開拓創新是純粹的ai引領,發現新的規律是ai做的,莫非後來的科研人員,文章裡面會這樣引用「AI(2050)提出新的科學理論,AI(2070)對此有不同觀點,本研究認同AI(2075)的理論」。。哇。酸爽。

城市規划行業呢。一直收到新技術的刺激。CAD,Gis各種吧。好像現在就有城市大腦這個東西,已經能做很多東西了。規劃有了Ai大概我們就可以失業了。自動招商引資,自動策劃項目,自動做發展戰略,自動做強排方案,自動做設計凹造型方案,自動做效果圖,自動做ppt。然後自己彙報,自己列印成果,自動審批,自動檢測管控。哇。我們主要做一些輔助調整,坐享結果。以後規劃就是這樣的名稱某市國土空間總體規劃(2030年AI/非AI)主要規劃人員:規劃AI(教授級工程智能系統),設計AI(高級設計智能系統)等等。目前強排的人工智慧應該可以實現了吧,所以其他部分的實現是時間、成本等問題。

總結一下。AI很好,也很重要。但只是輔助人的智慧工作,而非代替。人與AI相處還是要有絕對的信息優勢,大概就是可操作和可控制,即使某個個體、某個領域無法實現優勢,那麼打破也是一種優勢。城市規劃這個領域,AI也不能做到絕對的公平公正,提高效率減少錯誤倒是可以的。


作為圍棋界的一員,相比其他傳統行業,AI對我們的革新可以說是「讓圍棋換了個遊戲方式」。

眾所周知2016年AlphaGo戰勝了李世石,但大家不知道的是大致從2017年開始,AI就從伺服器級才能到達九段水平,變成了家庭電腦就可以輕鬆戰勝人類最頂尖的高手

現在隨便一款家用級的電腦,加上AI水平就能超過最厲害的人類高手(在我碼前面兩行字的一小會功夫,我家電腦就算了七萬五千個變化,這是人類所遠遠不及的。)

AI顯示變化圖及左側的勝率變化。

因此圍棋的訓練方式也發生了天翻地覆的改變,原本與對手復盤總結的方法,變成了「瞎琢磨」。找問題變成了交給AI,幾秒後AI就會告訴你正確的下法。

在比賽過程中,AI會實時給出勝率和最佳參考圖

整局棋的勝率走勢,和自動分析過程變化

不過招法上的革新倒是其次,最重要的是AI的思路與人完全不同。因為圍棋的空間和變化太多,因此以前人類是先去邊角這些能算得清的地方下棋棋盤中間的廣闊星空留到後面爭奪而AI最令人震驚的一點就是它能分析出中間天文數字的變化,然後給出最佳一手。

這使得現在再去看2016年以前的棋譜,感覺恍如隔世一般,甚至像DOTA1和DOTA2一樣,圍棋在短短几年間變得陌生得像兩個遊戲似的。

現如今,圍棋的訓練深受AI的影響,因此隨著對AI的模仿,大家開始主動往棋盤中間的去探索。一方面是令人類距離完美的「圍棋之神」越來越近。另一方面是改變了此前略顯單調的布局下法和戰鬥思想,讓比賽也變得更有觀賞性

同時由於AI對訓練方式的改變,使得原本認為「年輕力壯」才能下好棋的觀點出現了改變,近兩年出現了一些原本默默無名,靠AI訓練逆生長的選手。比如李昊承等人。

在此前的職業生涯里一直默默無聞的李昊承(左一)在服完兵役回來後,卻在近一年的比賽中戰勝了包括朴廷桓、李世石、申真諝等N位韓國高手。並隨隊打入韓國圍棋聯賽季後賽的總決賽(可以理解成NBA總決賽)

由於AI出現後,大家都能在技術上跟上年輕人。所以我相信隨著時間的推移,圍棋選手會變成經驗+技術的結合體。這會給棋界發展帶來新的變化。


說完AI對圍棋職業圈的影響,接下來說一下目前AI下沉到業餘圈對圍棋培訓的影響。

以前在圍棋的初學階段,為了激起學生的興趣,所以對圍棋的解釋是4個圍一個的「圍」棋

後面再慢慢改回圍空圍地盤的「圍」棋。而現如今隨著AI也進入圍棋教學中,「愛思通」等軟體則用畫圖標記等方式讓學生跳過4個圍一個的第一階段,直接進入「」棋第二階段

並且在作業方面,現在可以利用AI分析,每道題是做了多久、試了幾次、哪種類型的題容易錯等方面,從而更有針對性的去教學


推薦閱讀:
相关文章