UNet++: A Nested U-Net Architecturefor Medical Image Segmentation 論文筆記

原文地址:arxiv.org/abs/1807.1016發表日期:2018


解讀

本文的創新點在於把不同尺寸的UNet結構融入到了一個網路里。我們知道,在運用CNN的分割問題上,主要分為以FCN為基礎的結構,和以U-Net為基礎的結構。前者的encoder-decoder是非對稱的,後者的encoder-decoder是對稱的;另外兩者的特徵融合方式也有些差別。但本質上分割網路都是差不多的:先encoder再decoder。那麼到底encoder應該多大,decoder應該多大呢?文章的出發點就在於探求這個問題,並以此為基礎,提出了融合不同尺寸U-Net結構的網路。

下面對論文中的幾個關鍵點進行總結,更為詳細的解讀可以看作者之前發布的文章思路,作者思考問題,提出問題,解決問題的過程很有啟發性。zhuanlan.zhihu.com/p/44
  1. 網路結構

主體結構

    • 從上圖的(c)可以看到主體網路的細節,就是由一個個同深度的encoder-decoder組合而成的。
    • loss如何來做。對每一個不同尺寸的子網路的輸出,進行1*1卷積後取一個loss,取1*1卷積的原因是為了和Groud Truth的通道一致。

2. 其他一些關鍵點

    • 本文主要是針對醫學圖像的,醫學圖像比自然數據集需要更高的精度,作者列出了一些具體的例子。
    • 作者還提到了semantically similar 這個概念,具體是什麼意思沒有理解的很清楚。原文表述如下:「We argue that the network would deal with an easier learning task when the feature maps from the decoder and encoder networks are semantically similar」。我的一個理解是encoder最初的卷積得到的feature map表示的是低維的特徵,對應尺寸的decoder的feature map 則已經經過了數次卷積,不是一個尺度的特徵,U-Net中進行long-skip的融合會丟失一些信息。所以作者加入更淺的U-Net結構,使得融合時的feature map尺度差異更小。
    • 另外,文章還提到了模型剪枝的問題,在保持精度的情況下讓模型更小,這更多的是從應用角度去考慮,這裡不做更深的討論。
    • 實驗方面,因為UNet++的參數和Unet相比有所增加,作者給了U-Net更多的參數進行對比實驗,來證明提出的網路不是單純的增加參數提升效果。

Reference

UNet++: A Nested U-Net Architecturefor Medical Image Segmentation

zhuanlan.zhihu.com/p/44

推薦閱讀:

相關文章