本文對ICML 2018楊強老師團隊的一篇文章《Transfer Learning via Learning To Transfer》進行梳理總結。
先回顧一下遷移學習的主要思想來源:人本身具有遷移知識的能力,比如羽毛球運動員可以更好更快地掌握網球的技巧,因此我們希望機器也具有這種遷移的能力,將以往訓練模型學習到的知識在新的領域加以應用。
那麼這篇文章的出發點又是什麼呢?比如我們現在需要在羽毛球運動員、游泳健將和教授這三人中選擇一位來從事網球運動,我們會選誰呢?當然,根據歷史經驗,我們會選擇羽毛球運動員。注意這裡的歷史經驗,可能是下面的一些歷史觀察:
羽毛球運動員 轉職 網球運動員 適應時間 3個月
游泳健將 轉職 網球運動員 適應時間 6個月
教授 轉職 網球運動員 適應時間 12個月
可以看出,通過歷史的「轉職」數據,可以在新的「轉職」場景下加以應用,比如選擇羽毛球運動員來從事網球運動,可能需要的時間成本會小很多。遷移就類似於「轉職」,要選擇最合適的東西遷移。
本文就是通過歷史的遷移信息,包括遷移的數據、遷移的東西等來擬合遷移的效果提升,從而在新的遷移任務到來時,直接優化最優的遷移內容,使得性能提升最大。
這篇文章提供了一種演算法L2T來決定遷移過程中怎樣遷移(How)以及遷移什麼(What)的問題。遷移學習裡面還有一個重要的問題就是什麼時候遷移(When),這個問題這篇工作並沒有涉及。
這篇文章提出了L2T的學習框架,和遷移學習(Transfer Learning)、多任務學習(Multi-Task Learning)、終生學習(Life-Long Learning)有一定的關聯和區別,用下面的圖來解釋: