台湾 || 语言: 大陆简体港澳繁體台灣正體

Learn To Transfer

雪花台灣 2019-07-15 02:10

本文對ICML 2018楊強老師團隊的一篇文章《Transfer Learning via Learning To Transfer》進行梳理總結。

先回顧一下遷移學習的主要思想來源：人本身具有遷移知識的能力，比如羽毛球運動員可以更好更快地掌握網球的技巧，因此我們希望機器也具有這種遷移的能力，將以往訓練模型學習到的知識在新的領域加以應用。

那麼這篇文章的出發點又是什麼呢？比如我們現在需要在羽毛球運動員、游泳健將和教授這三人中選擇一位來從事網球運動，我們會選誰呢？當然，根據歷史經驗，我們會選擇羽毛球運動員。注意這裡的歷史經驗，可能是下面的一些歷史觀察：

羽毛球運動員轉職網球運動員適應時間 3個月
游泳健將轉職網球運動員適應時間 6個月

教授轉職網球運動員適應時間 12個月

可以看出，通過歷史的「轉職」數據，可以在新的「轉職」場景下加以應用，比如選擇羽毛球運動員來從事網球運動，可能需要的時間成本會小很多。遷移就類似於「轉職」，要選擇最合適的東西遷移。

本文就是通過歷史的遷移信息，包括遷移的數據、遷移的東西等來擬合遷移的效果提升，從而在新的遷移任務到來時，直接優化最優的遷移內容，使得性能提升最大。

這篇文章提供了一種演算法L2T來決定遷移過程中怎樣遷移（How）以及遷移什麼（What）的問題。遷移學習裡面還有一個重要的問題就是什麼時候遷移（When），這個問題這篇工作並沒有涉及。

這篇文章提出了L2T的學習框架，和遷移學習（Transfer Learning）、多任務學習（Multi-Task Learning）、終生學習（Life-Long Learning）有一定的關聯和區別，用下面的圖來解釋：

相关文章