美国东北大学博士秦灿：UniControl——多模态的统一可控图像生成模型｜AI新青年讲座

「AI新青年讲座」由智东西公开课出品，致力于邀请青年学者，主讲他们在生成式AI、LLM、计算机视觉、机器学习等人工智能领域的最新重要研究成果。

AI新青年是加速人工智能前沿研究的新生力量。AI新青年的视频讲解和直播答疑，将可以帮助大家增进对人工智能前沿研究的理解，相应领域的专业知识也能够得以积累加深。同时，通过与AI新青年的直接交流，大家在AI学习和应用AI的过程中遇到的问题，也能够尽快解决。

「AI新青年讲座」目前已完结218讲；有兴趣分享学术成果的朋友，可以与智东西公开课教研团队进行邮件（class@zhidx.com）联系。

Stable Diffusion 已经表现出了强大的视觉生成能力。然而，它们在生成具有空间、结构或几何控制的图像方面常常表现不足。现有的 ControlNet 和 T2I-adpater 等工作实现了针对不同模态的可控图片生成，但在单一、统一的模型中适应各种视觉条件，仍然是一个未解决的挑战。

来自 Salesforce AI、美国东北大学和斯坦福大学的研究者们，针对这个问题，最新提出了一个各种条件下的统一可控图像生成模型：UniControl。

UniControl 在单一的框架内合并了各种可控的条件到图像（C2I）任务。同事为了使 UniControl 有能力处理多样的视觉条件，研究者们引入了一个任务感知的 HyperNet 来调节下游的条件扩散模型，使其能够同时适应不同的 C2I 任务。

在九个不同的 C2I 任务上进行训练后，UniControl 展示了强大的视觉生成能力和 zero-shot 泛化能力。

7月14日上午10点，「AI新青年讲座」第219讲邀请到 UniControl 一作、美国东北大学博士秦灿参与，主讲《UniControl：多模态的统一可控图像生成模型》。

讲者
秦灿，美国东北大学博士；研究方向为迁移学习和生成式AI，包括域迁移、小样本学习、多模态学习、扩散模型等；相关研究工作发表于NeurIPS、ICLR、CVPR、ICCV、KDD、TPAMI、Nature Communication等顶会和顶刊，并获ICCV19 RLQ最佳论文；此前在西安电子科技大学获得学士学位，博士就读于美国东北大学，曾在Adobe研究院，Salesforce AI研究院等机构实习。

第219讲

主题
《UniControl：多模态的统一可控图像生成模型》

提纲
1、生成式 AI 基础模型的应用
2、单一模态的可控图像生成模型及局限性
3、各种条件下统一可控的生成模型 UniControl
4、对开放环境中的 zero-shot 适应能力
5、可控视觉生成的展望

直播信息
直播时间：7月14日10:00
直播地点：智东西公开课知识店铺

成果
论文标题：《UniControl: A Unified Diffusion Model for Controllable Visual Generation In the Wild》
论文地址：https://arxiv.org/abs/2305.11147
开源代码：https://github.com/salesforce/UniControl

相关推荐