近两年来,AI 绘画逐渐成为人工智能领域大热的方向之一,多模态任务也成为了行业热点。从 Disco Diffusion ,到 OpenAI 的 DALL·E、CLIP、GLIDE、DALL·E 2 (unCLIP) 以及谷歌的 Imagen ,各种图像生成模型层出不穷。这些模型可以将以自然语言形式表达的大量概念转换为合适的图像,效果十分惊艳。

在2019年3月的 GTC 大会上,NVIDIA 推出了一款 AI 绘画工具 GauGAN。GauGAN 使任何人都能够通过涂鸦模式创作出精美绝伦的风景画。同年7月,NVIDIA 研究院首席科学家刘洺堉就主题《如何利用生成式对抗网络 GAN 实现“AI神笔马良” GauGAN 的神奇效果》对 GauGAN 进行了深度讲解。

去年11月,NVIDIA 推出 GauGAN 第二代 :GauGAN2,允许用户通过输入文字和简单的绘图就能创建逼真的图像。文本生成匹配图像的模式也是 GauGAN2 主要的创新,生成的图像会根据逐渐输入的文本不断发生变化,最终生成和文本匹配最佳的图像。用户无需绘制想象场景的每个元素,只需输入一个简短的短语即可快速生成图像的关键特征和主题。甚至还可以在用涂鸦绘画等生成图像后,输入文本进行相应的修改。

Demo 地址:http://gaugan.org/gaugan2/

9月27日下午1点,智东西公开课策划推出的「 NVIDIA GauGAN2 技术公开课」将正式开讲。本次公开课邀请到 NVIDIA 研究科学家黄勋进行直播讲解,主题为《 NVIDIA AI 绘画模型 GauGAN2 核心技术及全景图生成应用》。黄勋是 NVIDIA 研究科学家,康奈尔大学博士。在博士期间他曾获得 NVIDIA 、Adobe 和 Snap 等奖学金。

本次公开课中,在对主流文本生成图像模型进行介绍和比较之后,黄勋博士将会重点讲解基于多模态输入生成风景图像的 GauGAN2 ,并对 GauGAN2 背后的核心技术:专家乘积模型,进行深入解读。最后,黄博也会分享他们近期用 GauGAN2 生成全景图的应用(GauGAN 360),并探讨未来的方向。

「NVIDIA GauGAN2 技术公开课」将以视频直播形式进行,包含40分钟主讲和20分钟问答。同时,针对本次公开课,也组建了专属交流群,届时主讲人黄勋博士将加入,欢迎感兴趣的朋友申请。

公开课信息

主 题

《NVIDIA AI 绘画模型 GauGAN2 核心技术及全景图生成应用》

提 纲

1、主流文本生成图像模型对比
2、GauGAN2 基于多模态输入生成风景图像
3、专家乘积模型:GauGAN2 背后核心技术
4、GauGAN2 的全景图生成应用及未来方向

主 讲 人

黄勋,NVIDIA 研究科学家,康奈尔大学博士,北京航空航天大学本科;博士期间曾获 NVIDIA ,Adobe,Snap 等奖学金。

直 播 时 间

9月27日13:00-14:00