智东西3月7日消息,根据智源研究院公众号,北京智源人工智能研究院和新加坡南洋理工大学、北京大学近期联合提出了通用计算机控制General Computer Control (GCC),即智能体需要像人一样看屏幕,通过键盘、鼠标完成计算机上的所有任务。研究团队提出通用计算机控制智能体框架Cradle,使智能体不依赖任何内部API就能直接控制键盘、鼠标和任何软件交互,无论开源还是闭源,甚至能玩《荒野大镖客2》等商业3A游戏大作。
![](https://oss.zhidx.com/gtic/24/03/65e9930279ada-f1bb910b2dc79ba9305ce8e87c0cc61a.png/w1200)
论文链接:https://arxiv.org/abs/2403.03186
项目主页:https://baai-agents.github.io/Cradle/
代码链接:https://github.com/BAAI-Agents/Cradle