订阅成功
扫码关注智东西Plus
接受订阅信息更新提醒
伯克利AI专家分享新强化学习库rlpyt

9月10日消息,来自伯克利人工智能研究所的研究人员Adam Stooke分享了pytorch中的一个新的强化学习库rlpyt,其中不仅包括了强化学习模块优化实现,还提供支持所有三个主要的无模型算法系列:政策梯度,深度学习和q函数政策梯度,致力于成为中小规模小规模研究的高吞吐量代码库。

订阅
订阅强化学习最新消息
订阅伯克利最新消息
相关快讯
  • 19年12月30日 19:51
    华为提出基于强化学习的因果发现算法

    12月30日消息,华为诺亚方舟实验室被ICLR 2020接收的一篇满分论文《CAUSAL DISCOVERY WITH REINFORCEMENT LEARNING》介绍:华为诺亚方舟实验室因果研究团队将强化学习应用到打分法的因果发现算法中,通过基于自注意力机制的encoder-decoder神经网络模型探索数据之间的关系,结合因果结构的条件,并使用策略梯度的强化学习算法对神经网络参数进行训练,最终得到因果图结构。

    在学术界常用的一些数据模型中,该方法在中等规模的图上的表现优于其他方法,包括传统的因果发现算法和近期的基于梯度的算法。同时该方法非常灵活,可以和任意的打分函数结合使用。

    来源:机器之心
  • 19年11月04日 16:11
    百度获NeurIPS 2019强化学习赛冠军

    11月4日消息,在NeurIPS 2019强化学习赛上,百度继2018年夺冠后再次获得冠军。百度基于飞桨的强化学习框架PARL完成挑战,并领先第二名143分。据悉,该比赛采用斯坦福国家医学康复研究中心研发的Opensim人体骨骼高仿模型。参赛者需要根据该模型中多达100多维以上的状态描述特征,来决定模型肌肉的信号,控制模型的肌体行走。

    来源:智东西
  • 19年10月17日 23:15
    Facebook推出ReAgent强化学习工具包

    10月17日消息,据外媒报道,Facebook今日推出ReAgent强化学习(reinforcement learning)工具包,首次通过收集离线反馈(offline feedback)来实现策略评估(policy evaluation)。目前ReAgent已与Microsoft Azure顶尖AI平台实现合作。

    来源:智东西
  • 19年07月31日 16:35
    谷歌推足球游戏强化学习环境1.1版本

    7月31日消息,谷歌曾于今年6月推出了一个名为Google Research Football Environment的新型强化学习环境,训练智能体掌握足球运动。该研究小组今日宣布,该强化学习环境的1.1版本,包括了新的实验,多人游戏和多代理培训支持以及游戏引擎的3倍加速。

    来源:智东西
  • 19年07月10日 23:21
    加大伯克利分校拟提高机器人抓取能力

    7月10日消息,近日,加州大学伯克利分校的研究人员正在设计一些机器人难以抓取的对抗性物体,以提高计算机视觉算法处理对抗图像的性能,加强机器人抓取物体的能力。研究人员表示,他们将计划用不同类型的抓取工具和吸力抓具来测试这些物体,试图找到最具对抗性的对抗物体。

    来源:智东西
  • 19年06月14日 17:18
    伯克利携清华成立RISC-V研究实验室

    6月14日消息,今日,加州大学伯克利分校Pardee荣誉教授大卫·帕特森(David Patterson)在RISC-V峰会上宣布,将成立专注于RISC-V研究的RIOS实验室(英语全名RISC-V International Open Source Laboratory),实验室设在伯克利加州大学和清华大学联合建立的清华-伯克利深圳学院(简称TBSI)。据悉,实验室的成立目标有3点:一、全面提升 RISC-V 生态系统至最先进水平(5年使命);二、成为一家以技术成果转移为主要使命的非营利组织;三、产出免受专利诉讼的工业级知识产权成果。

    来源:cnBeta
  • 19年06月04日 10:41
    Facebook与伯克利建开放研究共享平台

    6月4日消息,Facebook AI支持伯克利人工智能研究所(BAIR)建立BAIR开放研究共享平台,这是加州大学伯克利分校的一项新计划,旨在帮助推进行业领导者与大学生和教师之间的尖端AI研究。BAIR将通过持续的校园合作以及与Facebook,亚马逊,谷歌,三星和Wave Computing的研究人员的合作,促进新想法的分享。所有研究预计将公开发布,代码开源并可供整个研究团体使用。

    来源:智东西
  • 19年05月29日 12:14
    伯克利开源无奖励端到端深度学习研究

    5月29日消息,伯克利人工智能实验室推出一种无奖励的端到端深层强化学习方法,可帮助机器人在没有手动奖励的情况下从一定数量的描述成功完成任务的图像中学习。机器人将利用大约80个图像开始学习,并偶尔向用户查询其他标签。在查询过程中,机器人将向用户显示图像并要求用户标签以确定该图像是否表示任务的成功完成。研究人员们设定了大约25到75个此类查询,通过使用这些查询,机器人能够在 1-4 小时的交互时间内直接在现实世界中学习。据了解,该方法为目前现实世界中最高效的基于图像的机器人机器学习方法之一,研究团队已开源这一实验。

    来源:智东西
  • 19年05月08日 11:32
    伯克利BAIR让机器人快速适应环境变化

    5月8日消息,伯克利人工智能研究实验室(BAIR)近日介绍了帮助机器人快速适应环境变化的最新研究。据介绍,研究人员开发了一种基于模型的元强化学习算法,能够结合最新的经验对模型进行微调,以实现在几毫秒内在线帮助机器人快速适应如新的地形,恶劣天气等环境变化。在每一个时间步,用于更新模型的数据都能够从最近的经验的模型预测中轻易获取。这项研究通过元学习实现了高容量神经网络动力学模型的在线适应,研究人员称虽然该研究在模拟与硬件中都展示了一定的成果,但仍有很大的改进空间。

    来源:智东西
  • 19年03月26日 22:07
    加大伯克利分校BAIR设开放研究委员会

    3月26日消息,加州大学伯克利分校人工智能研究实验室(BAIR)宣布成立开放研究共享委员会。据悉,这是一个新型工业联盟计划,旨在加速人工智能研究。该委员会将加强学生,教师与企业研究学者的协作。

    来源:智东西
加载更多 ···