欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智东西公开课
Uber AI实验室提出强化学习新算法
2019-02-02
机器之心
17
2月1日消息,据报道,Uber AI Lab于近日发表新论文,提出一种名为GO-Explore的强化学习新算法。它利用了以下原则:(1)记住以前曾被访问过的状态;(2)首先回到有希望的状态(没有探索),然后从中探索;(3)利用任何可行的方式解决模拟环境,然后通过模拟学习强化。研究发现,合并这些原则的效果在hardexploration问题上产生了显着的性能改进。