玩了5万局游戏,英伟达让GameGAN自己生成「吃豆人」,世界首创无需游戏引擎

本文转载自新智元(AI_era)。

   新智元报道  

编辑:元子

【新智元导读】 近几年来,英伟达在GAN这个领域越走越远。英伟达推出"GameGAN",不需要任何底层游戏引擎,用GAN就能复刻出经典休闲游戏《吃豆人》,这项研究可以帮助游戏开发者加速开发新的关卡布局、角色甚至产生新的游戏创意,着实令人兴奋。

GAN的生成——对抗属性,让他一出生就具有强烈的造假能力,GAN最让人熟知的就是臭名昭著的Deepfake。

当然,工具本身无所谓好坏善恶,它只是个天真无邪的家伙,它的善恶取决于背后操纵它的人。好比一把枪,坏人拿来抢劫杀人,好人拿来保家卫国。

GAN也一样,到了有趣的科学家手里,它就能做出很多好玩的事情,比如英伟达。近几年来,英伟达在GAN这个领域越走越远,开发出了可以生成逼真假脸的"StyleGAN"、能将草图变成艺术作品的神笔马良"GauGAN"。

只是做图像已经满足不了英伟达的这帮科学家了,最近,他们又鼓捣出了"GameGAN",不需要任何底层游戏引擎,用GAN就能复刻出经典休闲游戏《吃豆人》。

GameGAN由Fidler、Kim、NVIDIA研究员Jonah Philion、多伦多大学(University of Toronto)学生Yuyu Zhou和麻省理工学院(MIT)教授Antonio Torralba共同创作,相关研究论文被CVPR 2020收录,并将于6月份在会议上进行介绍。

玩了5万局游戏,GAN用神经网络自己做了个PAC-MAN

NVIDIA Research创建的强大的新AI模型--NVIDIA GameGAN,可以在没有底层游戏引擎的情况下,生成一个功能齐全的PAC-MAN版本。

这意味着, 即使在对游戏的基本规则一无所知的情况下,AI也能重现游戏 ,并取得令人信服的效果。

GameGAN是第一个通过利用生成性对抗性网络,即GAN,模仿计算机游戏引擎的神经网络模型。由两个对抗性神经网络,即生成器和鉴别器组成。

"这是首次使用基于GAN的神经网络模拟游戏引擎的研究",英伟达公司的研究员、该项目的主要作者Seung-Wook Kim说。"我们想看看人工智能是否能够仅通过看一个智能体在游戏中移动的模式,就能学习到环境的规则。而它确实做到了。"

当人工智能体玩GAN生成的游戏时,GameGAN会对智能体的动作做出反应,实时生成新的游戏环境帧。如果对多个关卡或版本的游戏剧本进行训练,GameGAN甚至可以生成它从未见过的游戏布局。

利用来自BANDAI NAMCO Research的数据,Kim和他在多伦多的NVIDIA AI研究实验室的合作者使用NVIDIA DGX系统对PAC-MAN剧集(总共有几百万帧)的神经网络进行训练,并将其与玩游戏的AI智能体的按键数据配对。

AI会持续跟踪虚拟世界,记住已经生成的内容,以保持每一帧的视觉一致性。

然后,训练好的GameGAN模型会生成环境中的静态元素,如迷宫形状、小点和Power Pellets--再加上移动元素,如敌人的幽灵和PAC-MAN本身。

它可以学习游戏的关键规则,无论是简单的还是复杂的游戏规则。不管是什么游戏,GameGAN都可以简单地通过摄取过去游戏中的屏幕录音和智能体按键来学习它的规则。

由于模型可以将背景与移动中的人物分开,因此可以将游戏重新设定为在室外的绿篱迷宫中进行,或者将PAC-MAN换成你喜欢的表情符号。开发者可以利用这个功能来尝试新的角色创意或游戏主题。

游戏开发者可以利用这样的工具,利用原始关卡的剧本作为训练数据,为现有游戏自动设计新的关卡布局。

这种能力可以被游戏开发者用来自动生成新游戏关卡的布局,也可以被AI研究人员用来更方便地开发训练自主机器的模拟器系统。

"当我们看到这个结果的时候,我们都被震惊了!不敢相信AI可以在没有游戏引擎的情况下重现标志性的PAC-MAN体验,"游戏发行商BANDAI NAMCO Entertainment Inc.的Koichiro Tsutsumi说,"我们提供了PAC-MAN的数据来训练GameGAN。"

这项研究为帮助游戏开发者加速开发新的关卡布局、角色甚至游戏的创意过程提供了令人兴奋的可能性。"

源于游戏,却不囿于游戏

对开发者来说,创建模拟器是一个耗时的过程,他们必须对物体之间如何交互以及光在环境中如何工作的规则进行编码。

模拟器被用于开发各种类型的机器人,比如仓库机器人学习如何抓取和移动物体,或者送货机器人学习如何在道路上导航以运送食物或药品。

GameGAN引入了一种可能性,那就是为这些任务编写模拟器的工作有一天可能会被简单地训练神经网络所取代。

假设你在汽车上安装了一个摄像头。它可以记录下道路环境的样子或者驾驶员在做什么,比如转动方向盘或者踩油门等。

这些数据可以用来训练一个深度学习模型,它可以预测如果人类驾驶员--或者是汽车--采取猛踩刹车等动作,在现实世界中会发生什么。

"我们最终可以通过观看视频和看到智能体在环境中的动作,就能学习模仿驾驶规则、物理定律"NVIDIA多伦多研究实验室主任Sanja Fidler说。

"GameGAN是实现这一目标的第一步。"

END

备注:GAN

GAN

生成对抗网络、GAN等技术,

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

我来评几句
登录后评论

已发表评论数()

相关站点

热门文章