為什麼在設置 model.eval() 之後，pytorch模型的性能會很差？

這是我在訓練模型時的一個十分疑惑的問題：
我使用pytorch構建使用 BatchNormalization 層的分割模型。我發現在測試中設置 model.eval() 時，測試分割結果為0。如果不設置 model.eval() ，它將運行良好。我試圖搜索相關問題，但得出的結論是 model.eval() 可以固定BN的參數，但是我仍然對如何解決此問題感到困惑。我的batchsize設置為1,是否有此影響呢？

一般來說，Segmentation/Detection的模型，在訓練的時候，需要對backbone的網路，比如ResNet50之類的batchnorm層設置為eval mode...特別是當你的batchsize很小的時候...不確定是不是因為這個原因...當然inference的時候也要eval mode...寫的時候要特別注意...

在訓練模型時會在前面加上：

model.train()

在測試模型時會在前面使用：

model.eval()

雖然不適用這兩個語句程序也能運行，但運行的細節不一樣。比如Batch Normalization 和 Dropout。

Batch Normalization

BN的作用主要是對網路中間的每層進行歸一化處理，並且使用變換重構（Batch Normalization Transform）保證每層提取的特徵分佈不會被破壞。

訓練時是針對每個mini-batch的，但是測試是針對單張圖片的，即不存在batch的概念。由於網路訓練完成後參數是固定的，因此每個batch的均值和方差是不變的，因此直接結算所以batch的均值和方差。

Dropout

Dropout能夠克服Overfitting，在每個訓練批次中，通過忽略一半的特徵檢測器，可以明顯的減少過擬合現象。

詳細見文章：《Dropout: A Simple Way to Prevent Neural Networks from Overtting》

eval()就是保證BN和dropout不發生變化，框架會自動把BN和DropOut固定住，不會取平均，而是用訓練好的值，不然的話，一旦test的batch_size過小，很容易就會被BN層影響結果！！！