台湾
|| 语言:
大陆简体
港澳繁體
台灣正體
熱點
娛樂
體育
財經
社會
時政
遊戲
科技
時尚
美容
關於
"強化學習ReinforcementLearning"
的文章
目前最好用的大規模強化學習演算法訓練庫是什麼?
雪花臺灣
3年前
強化學習ReinforcementLearning
深度學習DeepLearning
請問用Gumbel-softmax的時候,怎麼讓softmax輸出的概率分佈轉化成one-hot向量?
雪花臺灣
3年前
強化學習ReinforcementLearning
機器學習
深度學習DeepLearning
神經網路
用強化學習研究推薦系統的前景和難度怎麼樣?
雪花臺灣
3年前
強化學習ReinforcementLearning
進化策略比策略梯度有什麼優勢劣勢?
雪花臺灣
3年前
強化學習ReinforcementLearning
機器學習
深度學習DeepLearning
演化計算
強化學習在推薦,營銷等場景下,有何典型方法?
雪花臺灣
3年前
人工智慧演算法
強化學習ReinforcementLearning
推薦
機器學習
在強化學習中,為什麼TRPO和PPO演算法屬於On-Policy的演算法?
雪花臺灣
3年前
人工智慧
強化學習ReinforcementLearning
機器學習
深度學習DeepLearning
演算法
為什麼沒有很強的鬥地主AI,鬥地主AI的難點在哪裡?
雪花臺灣
3年前
人工智慧
強化學習ReinforcementLearning
機器學習
深度學習DeepLearning
鬥地主
在一個一般的二本學校,如何才能在大家都喜歡玩的情況下加強自己的自控力,並且提高學習效率呢?
雪花臺灣
3年前
強化學習ReinforcementLearning
心態與學習效率
自制力
機器學習和強化學習好難,怎麼辦?
雪花臺灣
3年前
強化學習ReinforcementLearning
機器學習
機器學習周志華著書籍
深入淺出強化學習:原理入門書籍
深入機器學習應該從哪門課或哪本書開始?求推薦資源?
雪花臺灣
3年前
強化學習ReinforcementLearning
有監督學習
機器學習
深度學習DeepLearning
無監督學習
為什麼DL,RL裡面演算法的最初版本都叫vanilla?
雪花臺灣
3年前
強化學習ReinforcementLearning
演算法
在工業界,應用 Multi-Armed Bandit 的例子多嗎?
雪花臺灣
3年前
人工智慧
強化學習ReinforcementLearning
如何用數據破壞深度學習模型?
雪花臺灣
3年前
強化學習ReinforcementLearning
機器學習
深度學習DeepLearning
無監督學習
遷移學習TransferLearning
機器學習、深度學習和強化學習的關係和區別是什麼?
雪花臺灣
4年前
人工智慧
機器學習
演算法
強化學習ReinforcementLearning
AI技術
PN-28: Sub-policy Adaptation for HRL (arXiv 1906)
雪花臺灣
4年前
機器學習
強化學習ReinforcementLearning
深度學習(DeepLearning)
加載更多
熱門新聞
週熱門