深度學習基礎-卷積、池化、轉置卷積、空洞卷積辨析

為什麼要寫這篇文章呢？因為我算是深度學習的小白吧！接觸到深度學習1年整了，感覺自己學的都是皮毛，買了好多書，但真正看完太少了。本文只是針對圖像來說的，文本、語音我可以說一點都不會，只是瞭解個RNN。我們都是從圖像分類開始的，從簡單的Lenet到Xception…以及很多新興的模型，從圖片分類中我們瞭解最多的就是卷積、池化。然後我們又接觸到目標檢測從Two stage到Single stage，從Rcnn到Mask Rcnn，從Yolo到cornet。我就是整到這就遇到問題了，因為一個Mask Rcnn就給我這個小白整的有點迷糊，知道大概是怎麼回事，RPN，ROIalign等還好，整到Mask、FCN就稍微有點迷糊，因為這裡涉及到了反捲積（Deconvolution），所以我又要好好看看圖像分割的模型了。具體模型已經知道了下一步就是狠狠的嚼它們，但是嚼它們之前我感覺我應該好好的鞏固一下基礎了，所以寫下了這篇文章。本文是參考別人的文章寫的，其中加入了自己的想法，如果有錯誤的地方，大家可以指出，我一定改。

卷積操作（Convolution）

關於卷積操作，這篇相當不錯，A guide to convolution arithmetic for deep learning關於卷積的內容大部分都是這篇文章的。咱們主要看一下卷積運算。只是針對2維卷積操作,並且輸入、輸出、kernel都是正方形的,左右、上下移動的步長相等，都是0填充；這種操作同樣也適合多維卷積核非正方形的輸入、輸出、kernel。首先需要定義一些參數和符號：inputs（i1=i2=1）,kernel size(k1=k2=k),strides（s1=s2=s）,padding（p1=p2=p），outputs=o