Uber AI实验室提出强化学习新算法

2019-02-02

2月1日消息，据报道，Uber AI Lab于近日发表新论文，提出一种名为GO-Explore的强化学习新算法。它利用了以下原则：（1）记住以前曾被访问过的状态；（2）首先回到有希望的状态（没有探索），然后从中探索；（3）利用任何可行的方式解决模拟环境，然后通过模拟学习强化。研究发现，合并这些原则的效果在hardexploration问题上产生了显着的性能改进。