智东西(公众号:zhidxcom)
编译 | 徐珊
编辑 | 云鹏

智东西7月16日消息,据外媒Tech Xplore报道,南加州大学的研究团队在2021年学习代表国际会议发表了名为《基于组监督和零样本的学习(Zero-Shot Synthesis with Group-Supervised Learning)》的论文,他们正在研究如何让AI模仿人类的想象过程,以合成或了解从未见过的事物。

当我们去想象一只猫在长城上奔跑时,我们大脑中的一系列神经元将会被快速激活,然后在大脑中呈现不同的图像。这个想象的过程对人类来说很简单,对于深度神经网络系统来说很难。尽管它在某些领域中取得了超过人类的表现,但该系统仍难以做到人类的“想象”。

研究人员通过解耦(Disentanglement)技术让AI产生与人类相似的“想象力”,以合成不同属性的、前所未见的物体。研究人员认为,这项技术不但可以协助人们合成新药,而且还能提高自动驾驶汽车的安全性,并且让人工智能消除数据算法带来的潜在偏见。

“我们受到人类视觉概括能力(human visual generalization capabilities)的启发,试图在AI中模拟人类的想象”,该研究的第一作者(lead author)葛云皓说,“人类可以按属性(例如形状、姿势、位置、颜色)将他们已知的信息分类,然后将它们重新组合去想象一个新的事物。我们的研究主要通过神经网络系统模拟这个过程。”

一、AI难以分清事物的属性特征

事实上,如果你想让一个AI可以自行生成一张汽车图像,理想情况下,您可以通过为这个AI提供几张汽车的图像,它就可以从颜色、类型等角度生成多种类型的汽车,如红色的保时捷,绿色的皮卡等。

完成这类的任务是人们设计AI的长期目标之一——AI创建可以推断的模型(models that can extrapolate)。这意味着当人们给AI几个样本时,AI就应该能从这些样本中提取基本的共性,并将它们应用于大量的新事物中,即便AI此前从未见过这样的事物。但是目前AI最常接受的样本特征训练是像素等,这些并不需要考虑对象的属性。

比如说,长方形的木板,具有长方形、木质、板等属性,但AI并不清楚长方形的木板有哪些属性,它只能从给定的一些木板图片中提取事物的共性如木板长度相同,而这些共性不一定都是事物的属性。因此目前大部分AI模型都难以分清事物的属性特征。

二、通过“解耦”让AI理解事物属性

在该项目中,研究人员试图使用“解耦”的概念来克服AI模型难以分清研究对象不同属性的难题。

简单来说,解耦是指就是当你直接替换事物的某个特性时,对原来事物的理解不造成影响。

比如说,你有一台黑色的电脑,并且从未见过黑色的水杯,但是你知道水杯是什么样的。你会将从黑色的电脑上知道什么是黑色的, 然后将这个概念应用于水杯上,你就知道黑色的水杯是什么样的。在这个过程中,你就实现了“解耦”。

让AI拥有人类的“想象力”!深度神经网络新突破,或用于合成药物

▲来源:Tech Xplore

与传统算法一次只分析一个样本不同,AI学习拆解事物的属性需要通过解耦技术分析一组样本图像,并挖掘它们之间的相似性,实现“可控解开表征学习(controllable disentangled representation learning)”。然后,AI将重新组合这些属性信息,以实现“可控的新图像合成(controllable novel image synthesis)”,或者可以叫做“想象力”。

葛云皓以变形金刚为例解释,“AI可以采用威震天的形状,大黄蜂的外观和动作,以及纽约时代广场的背景进行‘想象’。最终,即使在此前训练期间AI从未见过这个场景,它也将呈现这样的一幅画面:在时代广场,黄色的威震天做着大黄蜂标准动作。”

这样的想象方式有点类似于人类的推断行为,当人们看到一个物体的颜色时,我们可以用新颜色替换原始颜色,并轻松地将轻松地推断这个颜色的其他物体会是什么样的。

解耦还可以应用于深度伪造技术(deepfakes)。例如,将人脸的运动和人的身份分开,AI模型可以将A的身份替换为B,但保留A的动作,合成新的图像和视频。

此外,在进行该项研究时,该研究团队生成了一个156万张的图像数据集(dataset),可以帮助相关领域的研究团队开展研究。

三、拆开后重组事物属性后,“解耦”可协助研发新药

虽然解耦并不是一个有关AI“想象力”的新设想,但研究人员表示,他们的设计框架可以让AI适应于大多数的数据和知识领域,这将扩大AI“想象”的应用范围。此外,AI还可以从相关信息中完全抹除种族、性别等容易造成歧视的属性,让人们的信息在被数据分析时,得到相同的处理方式。

在医学领域,学会分辨属性的AI可以帮助医生和生物学家发现更多有用的药物。AI将药物的功能与药物的其他特性分开,然后将不同药物的特性重新组合,以合成新药。

不仅如此,当AI具有“想象力”后,它还可以帮助创建更安全的人工智能。比如说,它让自动驾驶汽车“想象”如何避开训练中从未遇见的危险场景。

“深度学习在很多领域都展示了较大的前景,但这些往往通过让AI浅层模仿(shallow mimicry)人类行为发生的,这些技术并没有更深入地了解每个研究对象独一无二的属性特征”,计算机科学教授Laurent Itti说,“第一次真正地释放了人工智能的想象力,使它们能更加理解人类是如何看待世界的”。

结语:AI解耦或成“双刃剑”

南加州大学的研究团队通过解耦技术,让AI能够分清事物的不同属性。并且,AI可以将不同事物的属性重新组合,形成以前从未见过的事物。该技术还可以让自动驾驶汽车避开从未遇见过的危险前景,以及协助合成新药物。

当AI学会了如何拆解事物的属性之后,可以重新帮助人们了解事物的多样性,提高人们对事物认知。但是当AI解耦应用于造假时,又将给人们造成一定危害。AI解耦技术或成为一把“双刃剑”,而人们在利用AI技术优势时,如何掌控好技术的“缰绳”,人们还将继续探索。

来源:Tech Xplore