英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡

智东西(公众号:zhidxcom)
文 | 心缘

智东西5月22日报道,复古经典游戏《吃豆人》在人工智能(AI)的帮助下重生了!

刚刚,英伟达(NVIDIA)发布首个用生成式对抗网络(GAN)模仿计算机游戏引擎的新AI模型GameGAN,它能在对游戏规则一无所知的前提下,通过观察人类玩家玩吃豆人游戏,自行领悟游戏规则,进而设计出新的游戏关卡。

英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡

GAN,这个曾因“换脸”而闻名世界的神经网络,终于进军游戏设计领域。而复现游戏只是第一步, 这种能力不仅可以被游戏开发者用来自动生成新的游戏等级关卡,也可以被AI研究者用来更便捷地开发训练自主机器人和自动驾驶的模拟器系统。

GameGAN相关研究论文将于6月在国际计算机视觉与模式识别会议(CVPR)上发表。

英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡

一、用5万个回合的吃豆人游戏训练

1980年,日本南宫梦(Namco)公司推出轰动全球的经典迷宫追踪街机游戏《吃豆人》。后来这家公司在2005年和日本万代公司合并成万代南宫梦控股公司(BANDAI NAMCO Holdings)。

曾几何时,吃豆人游戏的爱好者们揣着硬币,跑到最近的游戏厅里,伴随着《吃豆人》的原声音乐,控制吃豆人在纷繁复杂的迷宫中一边努力吃到更多的豆豆,一边避开四种颜色的幽灵。

仅在1981年,美国人就投入了几十亿个25美分硬币来玩像吃豆人这样的投币游戏,时间长达75000小时。之后数十年间,这款热门游戏又出现了个人电脑、游戏机和手机版本。据不完全统计,20世纪足足有超过10亿人玩过《吃豆人》游戏。

如今,这款被列入世界游戏名作殿堂的经典游戏借助AI技术再度重生。

经过5万个回合的吃豆人游戏进行训练,NVIDIA研究院开发了强大的新AI模型NVIDIA GameGAN,它能在不用游戏引擎的前提下制作了一个全功能版本的吃豆人经典游戏。

换句话说,即便不了解游戏的基本规则,该AI模型也能完美再现这款经典游戏。

英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡▲玩家玩由GAN制作的《吃豆人》游戏

“这是第一个使用基于神经网络模拟游戏引擎的研究,”NVIDIA研究人员、该项目的主要作者Seung-Wook Kim说,“我们想看看AI是否仅通过观看游戏中玩家的行为来学习领悟游戏环境规则,它也确实做到了。”

训练GameGAN《吃豆人》游戏数据由游戏发行商万代南宫梦娱乐旗下的研发公司万代南宫梦研究所提供,来自这家公司的Koichiro Tsutsumi说,看到结果后,他们“相当震撼”,“大家无法相信在没有游戏引擎的情况下,AI可以再现经典的吃豆人游戏引擎。”

他认为:“这项研究为帮助游戏开发者加速创造新关卡布局、角色甚至游戏提供了令人兴奋的可能性。”

二、设计游戏新关卡,还能换吃豆人形象

据NVIDIA多伦多研究实验室主任Sanja Fidler介绍,这个用吃豆人游戏训练AI的项目大约从8个月前启动。

用GameGAN版本来生成吃豆人的游戏环境,靠得不是传统的游戏引擎,而是神经网络。

借助万代南宫梦研究所提供的数据,Seung-Wook Kim及其同事在多伦多的NVIDIA AI研究实验室中在NVIDIA DGX系统上用《吃豆人》游戏对神经网络进行了总计几百万帧的训练,同时加入了AI智能体玩吃豆人游戏的按键轨迹数据。

英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡▲该研究的数据集样本,训练数据由如红色方框所示的部分状态组成(左:吃豆人,中:吃豆人迷宫,右:VizDoom)

基于GAN的模型学习能创建足以媲美原版游戏内容的新内容。

无论哪个游戏,GAN都可以通过从过去的游戏中提取屏幕录像和玩家按键轨迹来学习它的规则。游戏开发者可通过将原始关卡的游戏剧本作为训练数据,借助这样的工具为现有游戏自动设计新的等级关卡。

英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡▲人类玩家和GameGAN一起玩官方版本《吃豆人》游戏

GameGAN由两个相互对抗的神经网络——一个生成器和一个鉴别器组成,包含动态引擎、渲染引擎和内存这三个主要模块,所有模块均为经端到端训练的神经网络。

其中动态引擎用于根据玩家行为变化更新当前的状态,外部内存模块用于在玩家返回到相同位置时保持场景的长期一致性,渲染引擎根据动态引擎的状态生成输出图像。

英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡

▲GameGAN由三个主要模块组成

当一个AI智能体在玩由GAN生成的游戏时,GameGAN会对智能体的行为做出反应,实时生成游戏环境框架。如果经由多种关卡或版本的游戏剧本训练,GameGAN甚至可以生成从未见过的游戏关卡。

AI持续追踪虚拟世界,记住已经生成的内容,以保持帧与帧之间的视觉一致性。

在视觉SLAM中,检测循环闭合已经是个挑战,生成一个完整的迷宫就更困难了。游戏中既有确定性行为也有随机性行为,而对随机性行为进行建模亦是一大难题。

英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡▲左图为GameGAN正确绘制出迷宫边界,右图为没有正确闭合循环的失败案例

要保持视觉一致性,模型不仅要记住它在隐藏状态下生成的每个场景,还需设计一个损失来强化这种长期一致性。

对此,NVIDIA研究人员提出了一种由神经图灵机(NTM)驱动的外部内存模块,鼓励模型构建环境内部映射,使得玩家可以返回到此前访问过的具有高度视觉一致性的位置。

在《吃豆人》游戏中,统一的迷宫形状、豆豆、大力丸这些属于静态元素,玩家控制的吃豆人还有四处乱转的幽灵择属于动态元素。

研究人员还引入了一个特定的渲染引擎架构,通过学习生成静态元素和动态元素分离的场景,以确保长期的视觉一致性。

英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡▲GameGAN如何在VizDoom和《吃豆人》游戏中将静态和动态元素分离

GameGAN通过对抗训练来学习环境动力学,得到暂时一致性的模拟结果。而对于某些需要长期一致性的情况,研究人员提出了时间循环损失来将静态元素和动态元素分离,以学习记住它所生成的内容。

研究人员分别在《吃豆人》和VizDoom环境中对GameGAN等四种模型进行定量和定性的综合评估。

如下图所示,Action-LSTM生成的帧缺少豆豆等细节,World Model在保持时间一致性方面存在困难,有时会出现严重的不连续,而GameGAN可以生成一致性模拟。

英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡▲基于相同初始屏幕的不同模型表现

GameGAN可学习简单和复杂的关键性游戏规则。例如,和原版游戏一样,吃豆人不能穿过迷宫墙壁;它需要四处走动吃豆豆,如果吃下一个大力丸,幽灵就会变蓝逃窜;当吃豆人从一侧离开迷宫,它会被传送到迷宫的另一侧;如果它撞上了幽灵,屏幕就会闪一下,然后游戏结束。

经训练的GameGAN模型可以创建各种有趣的静态环境元素和移动元素。

由于该模型能将静态背景从移动的角色中分离出来,它可以吃豆人、幽灵的形象换成你最喜欢的表情符号,也可以将游戏中的迷宫替换成绿篱墙式的迷宫,同时无需修改原始游戏代码。

英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡▲GameGAN在《吃豆人》和VizDoom中使用随机图像交换背景/前景

游戏开发者可以使用这一功能尝试新的角色创意或游戏主题。

三、不止是游戏,还能模拟机器人和无人车

自主机器人通常是在模拟器中训练的,在与现实世界中的物体互动之前,AI可以先在模拟器中学习环境的规则。

对于开发人员来说,创建模拟器是一个耗时的过程,他们必须编写有关如何与目标交互、光线如何在环境中运作等规则。

模拟器被广泛用于研发各类自主机器,比如学习如何抓握和移动周围物体的仓库机器人、在人行道上运输食品或药品的送货机器人等。

英伟达用AI完美复现经典《吃豆人》游戏!GAN首次进军游戏设计,自学生成新关卡

而GameGAN提出了这样一种可能性:未来有一天,训练神经网络将能取代为某个特定任务编写模拟器的工作。

比方说你在一辆车上安装了一个摄像头,它可以记录道路环境或者司机在做什么,比如转动方向盘或者在踩油门。这些数据可以用来训练一个深度学习模型,这个模型能预测在现实世界中,如果人类驾驶员或自动驾驶汽车发生像猛踩刹车之类的行动后会产生什么后果。

结语:GameGAN只是AI学习模仿现实规律的第一步

“我们最终将训练出一个AI,它仅通过观看视频和观察目标在环境中采取的行动,就能学习模仿驾驶规则和物理定律。”NVIDIA多伦多研究实验室主任Sanja Fidler认为,“GameGAN是朝着这个方向迈出的第一步。”

目前该AI系统还不能重新创造声音,不过Sanja Fidler说,未来他们或将补充这一能力。

NVIDIA将在今年晚些时候在AI PlayGround上发布其致敬游戏的AI模型,AI PlayGround是一个可供任何人直接体验研究演示的线上空间。

NVIDIA内容和技术部门副总裁Rev Lebaredian表示,在不远的将来,研究团队将用此方法涉足更多的游戏。

而随着AI设计游戏的能力日臻醇熟,这将为模拟充满不确定性的真实世界中的目标人物或物体行为提供更高效的编程工具。