欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智东西公开课
DeepMind研究团队用分层模型加强转移
2019-06-28
机器之心
11
6月28日消息,DeepMind的研究团队使用分层模型来加强转移,同时减轻负面干扰来为物理机器人节省数周的训练时间。研究人员以结构化政策的形式开发和研究简单的层次归纳偏差,作为强化学习(RL)中任务之间知识转移的机制,并设计了一种能够实现稳定快速学习的 RL 算法来利用这些结构化策略的强大功能。研究人员在模拟机器人环境(使用运动和操纵域)以及真实的机器人实验中验证了该方法。
DeepMind