南加州大学的一组研究人员正在帮助人工智能做一些人类更容易做的事情:想象看不见的东西。

这种设计技术可能会带来更公平的人工智能、新药物和提高自动驾驶汽车的安全性。

这个人工智能系统是由计算机科学教授洛朗·伊蒂和博士生葛云浩、萨米·阿布-艾尔-海贾和甘欣共同开发的,实际上,它利用自己“知道”的属性,然后想出一个从未见过的物体。

人类可以根据不同的属性(例如形状、姿势、位置、颜色)来区分所学的知识,然后重新组合这些因素来想象一个新的物体。

该团队受到了人类视觉泛化能力的启发。南加州大学的研究人员希望在机器上模拟人类的那种想象力,该研究的主要作者Ge说。

“当人们看到红色船只和蓝色汽车的图像后,他们可以分解和重组所学知识,想象出红色汽车的新图像,”葛告诉记者yabovip16.com在下面简短的问答中。

南加州大学的团队使用神经网络模拟了同样的过程。

“想象力”系统输出的想法是所学知识的结合。上图展示了一个简单的例子,展示了机器如何训练五个独立的字母,每个字母都有自己的颜色和背景,产生了一个组合所有数据的想法:一个棕色小写字母“g”在金色背景上。

本文题为基于群监督学习的零镜头合成该研究发表在今年5月7日举行的2021年学习表征国际会议上。

如何“解开”机器视觉障碍

机器最常见的训练是基于样本特征,比如像素,而不考虑对象的属性。

在这项新研究中,南加州大学的研究人员试图用一种叫做“解纠缠”的概念来克服这一限制。该方法采用一组样本图像,而不是传统算法一次一个样本,并挖掘它们之间的相似性,以实现一种称为“可控解纠缠表示学习”的想法。

接下来,这些知识被重新组合,以实现“可控的新图像合成”,或者你可以称之为想象。这有点像大屏幕上的机器人。

“把变形金刚电影《葛优在早些时候的新闻发布会上说.它可以是威震天汽车的形状,黄色大黄蜂汽车的颜色和造型,以及纽约时代广场的背景。结果就是一辆大黄蜂颜色的威震天汽车在时代广场上行驶,即使在训练期间没有看到这个样本。”

在采访中yabovip16.com下面,Ge解释了解纠缠如何扩大了应用的机会。

yabovip16.com:传统的人工智能是根据样本和图像数据训练的,对吧?你如何训练机器变得“富有想象力”?一个系统是否必须训练“学习”的组件或属性,可以交换进出?

照顾叶云豪通用电气:训练机器“想象力”,我们有一个假设,人类可以自由“因式分解”学到的知识和他们想象一个新的“组合”看不见的场景“想象力”例如,在人类看到的图片红色船只和蓝色的汽车,他们可以分解和重组学到知识想象小说红色汽车的图片。

基于这一假设,我们提出了一种新的学习范式——群体监督学习,它以一组样本作为输入,学习样本之间的相似性。可控解纠缠表示学习模拟了人类的“知识分解重组能力”,实现了模拟“想象”的零拍合成。

在本文中,带有属性标签的样本是用来合成新的未见场景的基本元素的例子。在不同的任务中,属性的含义可能会发生变化。“换入换出”是一种尝试模拟重组能力的方法;在我们的小组监督学习范式下,你可以使用不同的方法来实现这个模拟。

yabovip16.com你对这种系统的其他具体应用有什么设想?哪些应用程序最需要“想象力”?

照顾叶云豪通用电气

  1. 发现新的药物。将现有药物的某些已学功能结合在一起,合成或发现具有所需功能的新药。
  2. 在公平决策方面,基于我们的可控解纠缠能力,我们可以将不期望的因素分解出来,避免系统在决策时考虑这些因素。例如,种族和性别不应该被考虑在一些决定,以确保公平。我们的小组监督学习可以首先理清种族和性别信息,然后在做决定时只使用剩下的信息。
  3. 将我们的方法作为数据增强方法,通过想象生成新的数据。

yabovip16.com:一个富有想象力的人工智能可以在哪些方面帮助自动驾驶汽车?

照顾叶云豪通用电气:我们可以利用所学到的经验来综合或想象一些极端或危险的情况,教会自动驾驶系统避免这种情况,有助于提高鲁棒性和安全性。

与公平性问题类似,我们不希望自动驾驶系统在决策过程中考虑一些因素。我们可以利用可控的解纠缠表征学习能力,将决策过程中无用的因素解纠缠并删除,帮助消除决策偏差,有利于安全。

yabovip16.com:是什么保护这个系统不发展出一个富有想象力但危险的设计想法?

照顾叶云豪通用电气:这种学习模式是由用户控制的;设计师应该是有道德的。

yabovip16.com你下一步打算做什么?

照顾叶云豪通用电气:我们希望使我们的方法更一般化,这将发布数据集和应用程序的需求。我们还希望将我们的方法扩展到不同的数据模式和任务中。

你怎么看待“富有想象力的”人工智能?分享你的问题和评论。