台湾
|| 语言:
大陆简体
港澳繁體
台灣正體
热点
娱乐
体育
财经
社会
时政
游戏
科技
时尚
美容
关于
"强化学习ReinforcementLearning"
的文章
目前最好用的大规模强化学习演算法训练库是什么?
雪花台湾
3年前
强化学习ReinforcementLearning
深度学习DeepLearning
请问用Gumbel-softmax的时候,怎么让softmax输出的概率分布转化成one-hot向量?
雪花台湾
3年前
强化学习ReinforcementLearning
机器学习
深度学习DeepLearning
神经网路
用强化学习研究推荐系统的前景和难度怎么样?
雪花台湾
3年前
强化学习ReinforcementLearning
进化策略比策略梯度有什么优势劣势?
雪花台湾
3年前
强化学习ReinforcementLearning
机器学习
深度学习DeepLearning
演化计算
强化学习在推荐,营销等场景下,有何典型方法?
雪花台湾
3年前
人工智慧演算法
强化学习ReinforcementLearning
推荐
机器学习
在强化学习中,为什么TRPO和PPO演算法属于On-Policy的演算法?
雪花台湾
3年前
人工智慧
强化学习ReinforcementLearning
机器学习
深度学习DeepLearning
演算法
为什么没有很强的斗地主AI,斗地主AI的难点在哪里?
雪花台湾
3年前
人工智慧
强化学习ReinforcementLearning
机器学习
深度学习DeepLearning
斗地主
在一个一般的二本学校,如何才能在大家都喜欢玩的情况下加强自己的自控力,并且提高学习效率呢?
雪花台湾
3年前
强化学习ReinforcementLearning
心态与学习效率
自制力
机器学习和强化学习好难,怎么办?
雪花台湾
3年前
强化学习ReinforcementLearning
机器学习
机器学习周志华著书籍
深入浅出强化学习:原理入门书籍
深入机器学习应该从哪门课或哪本书开始?求推荐资源?
雪花台湾
3年前
强化学习ReinforcementLearning
有监督学习
机器学习
深度学习DeepLearning
无监督学习
为什么DL,RL里面演算法的最初版本都叫vanilla?
雪花台湾
3年前
强化学习ReinforcementLearning
演算法
在工业界,应用 Multi-Armed Bandit 的例子多吗?
雪花台湾
3年前
人工智慧
强化学习ReinforcementLearning
如何用数据破坏深度学习模型?
雪花台湾
3年前
强化学习ReinforcementLearning
机器学习
深度学习DeepLearning
无监督学习
迁移学习TransferLearning
机器学习、深度学习和强化学习的关系和区别是什么?
雪花台湾
4年前
人工智慧
机器学习
演算法
强化学习ReinforcementLearning
AI技术
PN-28: Sub-policy Adaptation for HRL (arXiv 1906)
雪花台湾
4年前
机器学习
强化学习ReinforcementLearning
深度学习(DeepLearning)
加载更多
热门新闻
周热门