學了點opencv,做了一個車牌識別,被打擊到了。目前有點迷茫,不知道該學點什麼。是否要聽聽吳恩達老師的機器學習(本人對機器學習沒有任何瞭解),是否聽聽李飛飛老師的課。然後再代碼實現方面要具備哪些能力(代碼水平一般)類似那些框架什麼的。本人的目標是能做出點小的東西,主要是發論文(想讀博)。目前研一已經過去2個月了。求大佬不吝賜教


推薦關注我們公眾號有三AI,一年原創將近百萬字的技術文章,大部分是計算機視覺領域,可以參考我們的年終總結:

【年終總結】2019年有三AI做了什麼,2020年我們要做什麼??

mp.weixin.qq.com圖標

另外從兩個方向來回答這個問題,第一個是怎麼系統性進階,第二個是如何系統性學習。

第一個問題,如何系統性進階,我鬥膽將學習深度學習的同志分為5大境界,分別是白身,初識,不惑,有識,不可知,下面一個一個道來,以計算機視覺方向為例。

http://weixin.qq.com/r/xEw1LebEMbtOraJO9xnW (二維碼自動識別)

1 白身

所謂白身境界,就是基本上什麼都不會,還沒有進入角色。在這個境界需要修行的內容包括:

(1) 熟練掌握linux及其環境下的各類工具的使用(2) 熟練掌握python及機器學習相關庫的使用

(3) 掌握c++等高性能語言的基本使用

(4) 知道如何獲取和整理,理解數據

(5) 掌握相關的數學基礎

(6) 瞭解計算機視覺的各大研究方向

(7) 瞭解計算機視覺的各大應用場景

(8) 瞭解行業的優秀研究人員,知道如何獲取最新的資訊,能夠熟練閱讀簡單的技術資料

如果掌握了這些,那麼就從白癡,不,是白身境界晉級了。怎麼判斷這個境界呢?可以參考以下的文章,看看掌握的如何。

AI白身境界系列完整鏈接:

第一期:【AI白身境】深度學習從棄用windows開始

第二期:【AI白身境】Linux幹活三板斧,shell、vim和git

第三期:【AI白身境】學AI必備的python基礎

第四期:【AI白身境】深度學習必備圖像基礎

第五期:【AI白身境】搞計算機視覺必備的OpenCV入門基礎

第六期:【AI白身境】只會用Python?g++,CMake和Makefile瞭解一下

第七期:【AI白身境】學深度學習你不得不知的爬蟲基礎

第八期: 【AI白身境】深度學習中的數據可視化

第九期:【AI白身境】入行AI需要什麼數學基礎:左手矩陣論,右手微積分

第十期:【AI白身境】一文覽盡計算機視覺研究方向

第十一期:【AI白身境】AI+,都加在哪些應用領域了

第十二期:【AI白身境】究竟誰是paper之王,全球前10的計算機科學家

2 初識

所謂初識,就是對相關技術有基本瞭解,掌握了基本的使用方法。在這個階段,需要修行以下內容。

(1) 熟練掌握神經網路

(2) 培養良好的數據敏感性,知道如何正確準備和使用數據

(3) 至少熟練掌握一個深度學習框架的使用

(4) 熟悉深度學習模型的基本訓練和調參,網路設計

(5) 掌握歸一化,激活機制,最優化等對模型性能的影響

(6) 能熟練評估自己的演算法,使用合適的優化準則

我們正在更新這一個系列的文章

AI初識境界系列完整鏈接:

第一期:【AI初識境】從3次人工智慧潮起潮落說起

第二期:【AI初識境】從頭理解神經網路-內行與外行的分水嶺

第三期:【AI初識境】近20年深度學習在圖像領域的重要進展節點

第四期:【AI初識境】激活函數:從人工設計到自動搜索

第五期:【AI初識境】什麼是深度學習成功的開始?參數初始化

第六期:【AI初識境】深度學習模型中的Normalization,你懂了多少?

第七期:【AI初識境】為了圍剿SGD大家這些年想過的那十幾招

第八期:【AI初識境】被Hinton,DeepMind和斯坦福嫌棄的池化,到底是什麼?

第九期:【AI初識境】如何增加深度學習模型的泛化能力

第十期:【AI初識境】深度學習模型評估,從圖像分類到生成模型

第十一期:【AI初識境】深度學習中常用的損失函數有哪些?

第十二期:【AI初識境】給深度學習新手開始項目時的10條建議

3 不惑

進入到不惑境界,就是向高手邁進的開始了,在這個境界的重點就是進一步鞏固知識,並且開始獨立思考。如果說學習是一個從模仿,到追隨,到創造的過程,那麼到這個階段,應該跳過了追隨,進入了創造的階段。

如果是在學校讀研究生,就要能夠發表水平不錯的文章,如果是在公司做業務,就要能夠提出正確且快速的解決方案,如果是寫技術文章,就要能夠信手拈來原創寫作而不需要參考。

這個階段需要修行以下內容:

(1) 熟練玩轉數據和模型對一個任務的影響

(2) 能夠準確的分析出模型的優劣,瓶頸

(3) 對於新的任務能夠快速尋找和敲定方案

(4) 擁有各種各樣的深刻理解深度學習模型的技能,從可視化到參數分析等等等

(5) 能夠優化模型到滿足業務的需求,實現工業級落地

(6) 瞭解行業的最新進展,並在某些領域有自己的獨到理解

不惑境界的內容

第一期:【AI不惑境】數據壓榨有多狠,人工智慧就有多成功

第二期:【AI不惑境】網路深度對深度學習模型性能有什麼影響?

第三期:【AI不惑境】網路的寬度如何影響深度學習模型的性能?

第四期:【AI不惑境】學習率和batchsize如何影響模型的性能?

第五期:【AI不惑境】殘差網路的前世今生與原理

第六期:【AI不惑境】移動端高效網路,卷積拆分和分組的精髓

第七期:【AI不惑境】深度學習中的多尺度模型設計

第八期:【AI不惑境】計算機視覺中注意力機制原理及其模型發展和應用

第九期:【AI不惑境】模型剪枝技術原理及其發展現狀和展望

第十期:【AI不惑境】模型量化技術原理及其發展現狀和展望

第十一期:【AI不惑境】模型壓縮中知識蒸餾技術原理及其發展現狀和展望

第十二期:【AI不惑境】AutoML在深度學習模型設計和優化中有哪些用處?

4 有識

到這裡,就步入高手境界了。可以大膽地說自己是一個非常合格的深度學習演算法工程師甚至是研究員了,在自己研究的領域裡處於絕對的行業前沿,對自己暫時不熟悉的領域也能快速地觸類旁通。

無論是眼界,學習能力,還是學習態度都是一流水平,時而大智若愚,時而鋒芒畢露,當之無愧的大師兄。

5 不可知

最後一個境界,就是不可知境界,超出我能描述的範圍了。舉一個例子,馬文·閔斯基,既可以讓AI生,又可以讓AI死,這樣的人是不會遇到的,放心好了。

這個修行之路仍然在更新中,我們發布了超過360頁的指導手冊,大家可以去自行獲取。

------------------------------------這是分隔線------------------------------------

第二個問題,如何系統性學習,大家就可以去我們公眾號《有三AI》和知乎專欄《有三AI學院》看,覆蓋CV/NLP兩大領域,涵蓋深度學習數據和模型、GAN、AutoML等基礎技術,人臉圖像,醫學圖像,圖像分類分割等應用領域,學習資源、論文推薦、AI行業與產品等學習資料,將近30個專欄。

下面是一些綜述性質的總結和兩個適合初學者的內容

  • 有三AI發布360頁11萬字深度學習CV演算法工程師成長指導手冊,可下載收藏列印,未完待續
  • 有三AI一週年了,說說我們的初衷,生態和願景
  • 【年終總結】2019年有三AI NLP做了什麼,明年要做什麼?
  • 【年終總結】有三AI至今在人臉圖像演算法領域都分享了哪些內容?
  • 【年終總結】2019年有三AI知識星球做了什麼,明年又會做什麼
  • 【小結】除了網路搜索(NAS),AutoML對深度學習模型優化還有哪些貢獻?
  • 【完結】12篇GAN的優化文章大盤點,濃濃的數學味兒
  • 【雜談】有三AI不得不看的技術綜述(超過100篇核心乾貨)
  • 【總結】言有三阿里天池深度學習模型設計直播匯總,附贈超過200頁直播PPT課件
  • 【完結】16篇圖像分類乾貨文章總結,從理論到實踐全流程大盤點!
  • 【完結】12篇文章帶你逛遍主流分割網路
  • 【完結】優秀的深度學習從業者都有哪些優秀的習慣
  • 【完結】給新手的12大深度學習開源框架快速入門項目
  • 【雜談】有三AI專欄作者邀請,在這裡寫文章能獲得什麼,有什麼不同?

2 深度學習模型設計

模型解讀系列文章:

第一期:【模型解讀】從LeNet到VGG,看卷積+池化串聯的網路結構

第二期:【模型解讀】network in network中的1*1卷積,你懂了嗎

第三期:【模型解讀】GoogLeNet中的inception結構,你看懂了嗎

第四期:【模型解讀】說說移動端基準模型MobileNets

第五期:【模型解讀】pooling去哪兒了?

第六期:【模型解讀】resnet中的殘差連接,你確定真的看懂了?

第七期:【模型解讀】「不正經」的卷積神經網路

第八期:【模型解讀】「全連接」的卷積網路,有什麼好?

第九期:【模型解讀】從「局部連接」回到「全連接」的神經網路

第十期:【模型解讀】深度學習網路只能有一個輸入嗎

第十一期:【模型解讀】從2D卷積到3D卷積,都有什麼不一樣

第十二期:【模型解讀】淺析RNN到LSTM

第十三期:【模型解讀】曆數GAN的5大基本結構

2 開源框架速成(更新完)

開源框架速成系列:

第一篇:【caffe速成】caffe圖像分類從模型自定義到測試

第二篇:【tensorflow速成】Tensorflow圖像分類從模型自定義到測試

第三篇:【pytorch速成】Pytorch圖像分類從模型自定義到測試

第四篇:【paddlepaddle速成】paddlepaddle圖像分類從模型自定義到測試

第五篇:【Keras速成】Keras圖像分類從模型自定義到測試

第六篇:【mxnet速成】mxnet圖像分類從模型自定義到測試

第七篇:【cntk速成】cntk圖像分類從模型自定義到測試

第八篇:【chainer速成】chainer圖像分類從模型自定義到測試

第九篇:【DL4J速成】Deeplearning4j圖像分類從模型自定義到測試

第十篇:【MatConvnet速成】MatConvnet圖像分類從模型自定義到測試

第十一篇:【Lasagne速成】Lasagne/Theano圖像分類從模型自定義到測試

第十二篇:【darknet速成】Darknet圖像分類從模型自定義到測試

將近500篇成系統的文章,超過100萬字原創,相信全網沒有第二個這樣的計算機視覺公眾號,希望對你有用。


學了點opencv,做了一個車牌識別,被打擊到了。目前有點迷茫,不知道該學點什麼。是否要聽聽吳恩達老師的機器學習(本人對機器學習沒有任何瞭解),是否聽聽李飛飛老師的課。然後再代碼實現方面要具備哪些能力(代碼水平一般)類似那些框架什麼的。本人的目標是能做出點小的東西主要是發論文(想讀博)。目前研一已經過去2個月了。求大佬不吝賜教

猜測一下,同學你是大本畢業直接讀研沒出去工作過的吧~

A、計算機視覺三大關鍵發展是獲取、處理、識別分析(也有認為識別與分析可以分開);

B、獲取、處理、識別各自有自己的技術瓶頸點,目前主要集中在處理、識別兩個方向上的瓶頸亟待突破;

C、機器學習是目前計算機視覺中解決「識別」瓶頸的一種重要方法,但也有侷限性和劣勢區域。

D、處理與識別的技術重要性基本是等同的。

E、不管你用什麼代碼語言,最關鍵的是如何將數學模型轉化為可運行代碼的轉化能力。

F、高校論文研究熱點不一定賺錢,賺錢的熱點不一定好出論文!

暫時給出以下建議:

建議一:瞭解所處行業的市場技術供需情況

畢竟不管怎麼學習,最終大家的目標都是要恰飯嗎~

目前計算機視覺的市場化有兩個大方向,一個是針對普通民用、商用方向,一個是針對實體製造業用以提升生產能力的工業應用方向。

對於普通民商用方向,可以參考的企業有Face++曠世、商湯以及國內外知名IT企業的計算機視覺技術研發部門。但大體來說,基本集中在日常社會環境中對於人/物體的分割識別、狀態與身份確認上。具體應用環境有警用人臉身份識別(巡邏過程中高效搜索通緝犯)、特定場所人羣分析、AR互動(虛擬試穿,活體檢測,美顏與換臉)等等。

對於實體製造業的工業應用方向,三大基本需求是定位、測量、狀態(瑕疵)識別,可參考企業美國康耐視、德國MVTec。

而這兩個大方向上,掙錢的方式與服務的客戶(及其需求特性)都是有很大差異的,你只能選擇其中一個去收穫財富與成就,而掙大錢的前提是抓住行業需求痛點。

另外,不對本專業所涉及行業的需求有清晰認識的話,我估計你開題報告都可能寫不出來~

建議二:想清楚為什麼要讀研博

一般研究生階段迷茫的,普遍都是沒有行業經驗(抓不住需求痛點),而沒有行業經驗就容易找不到研究方向。所以我希望同學你先想清楚你為什麼要讀研,並且為什麼打算繼續讀博!千萬不要陷入為了讀書而讀書的境地,你讀理工學科出來,最終是要服務於社會,滿足社會某種需求的。

此外,一直待在學校的學生沒有行業經驗很正常,沒什麼可感覺難受的,但不去主動瞭解就很有問題了,至少說明你的信息收集能力很成問題!計算機視覺在工商業的使用很豐富案例和問題討論,有不少交流羣和交流論壇,多去看看。

建議三:搞清楚自己適合走什麼道路

最後請允許我回歸到你的職業發展問題上,不是所有人畢業後(包括博士畢業)都留在本專業範圍內工作,一般有效轉化率最高也就50%。你畢業後可以選擇的職業途徑很多(行政公務員、中小學教師、企業職員、自主創業、繼承家業等等~),如前面所述高校論文研究熱點不一定賺錢,我希望你在單純頭大於如何完成碩士學業之前,先搞清楚自己以後到底要怎麼走職業道路。


卷積神經網路是計算機視覺領域的重要方法,尤其在模式識別方面的應用非常多。

如果想要提高識別準確率的話,可以從卷積神經網路開始學起,以及它的一些變體,例如深度殘差網路、深度殘差收縮網路等。

卷積神經網路

殘差網路

深度殘差收縮網路

首先還是需要做很多實驗的,opencv做車牌識別據我所知已經有非常成熟的方案了,重要的是先找到自己感興趣的點,然後再對這個感興趣的點做研究主要流程一般如下:

1、找到自己感興趣方向的主流方案,2、在github上找相關代碼,一般都會公佈的。3、clone代碼,然後復現,瞭解整個流程,要是自己沒有GPU,也可去智星雲租用GPU,我們現在沒法回實驗室,就這麼乾的。4、對已經復現的實驗,進行改進,只要能稍微有所改進就可以發論文了。


可以看看我這篇回答,希望能為你提供幫助

機器視覺CV:圖像處理+深度學習方向,需要學習什麼知識??

www.zhihu.com圖標

更多信息可以關注 『機器視覺CV』公眾號,我分享了大量圖像處理 計算機視覺 OpenCV 深度學習的相關知識和實戰項目,讓你掌握計算機視覺的相關知識。


推薦閱讀:
相關文章