DeepMind研究团队用分层模型加强转移

2019-06-28

6月28日消息，DeepMind的研究团队使用分层模型来加强转移，同时减轻负面干扰来为物理机器人节省数周的训练时间。研究人员以结构化政策的形式开发和研究简单的层次归纳偏差，作为强化学习（RL）中任务之间知识转移的机制，并设计了一种能够实现稳定快速学习的 RL 算法来利用这些结构化策略的强大功能。研究人员在模拟机器人环境（使用运动和操纵域）以及真实的机器人实验中验证了该方法。

DeepMind