欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智猩猩
智东西
车东西
芯东西
智猩猩
公开课
公开课官网
公开课小程序
GTIC
快讯
头条
人工智能
芯东西
AIoT
云与智慧城市
机器人
VR/AR
活动
SAIL推出动态环境下的强化学习LILAC
2020-07-02
机器之心
10
7月2日消息,斯坦福大学AI实验室(SAIL)的研究人员设计了一种方法,可以处理随时间变化的数据和环境,其性能优于某些强化学习的领先方法。Lifelong Latent Actor-Critic(也称为 LILAC)使用潜在变量模型和最大熵策略来利用过去的经验来在动态环境中提高采样效率和性能。该团队在论文中写道:“在各种具有非平稳性的具有挑战性的连续控制任务上,我们观察到,与最新的强化学习方法相比,我们的方法可以带来实质性的改进。”
分享至: