台湾 || 语言: 大陆简体港澳繁體台灣正體

什麼？強化學習竟然來源於心理學？

雪花臺灣 2019-08-04 09:22

歡迎大家前往騰訊雲+社區，獲取更多騰訊海量技術實踐乾貨哦~

本文由羅暉發表於雲+社區專欄

1. Google的DQN論文

2015年2月，Google在Nature上發表了一篇論文(見附件)：Human-level control through deep reinforcement learning。文章描述瞭如何讓電腦自己學會打Atari 2600電子遊戲。

Atari 2600是80年代風靡美國的遊戲機，總共包括49個獨立的遊戲，其中不乏我們熟悉的Breakout（打磚塊），Galaxy Invaders（小蜜蜂）等經典遊戲。Google演算法的輸入只有遊戲屏幕的圖像和遊戲的得分，在沒有人為幹預的情況下，電腦自己學會了遊戲的玩法，而且在29個遊戲中打破了人類玩家的記錄。

Google給出的深度絡架構圖如下：

相關文章