人工智能不断接受新的挑战,包括检测德刀(顺便提及,也使用AI)赢得胜利扑克合成生物学实验带来了提振。这些令人印象深刻的成就部分来自于训练系统的庞大数据集。这种训练既昂贵又耗时,而且它产生的人工智能只能做好一件事。

例如,培训AI在狗和一只猫之一的图片之间区分,它是喂养数千美元的 - 如果不是数百万的狗和猫的图像。另一方面,一个孩子可以看到狗或猫一次或两次,并记住哪种情况。我们怎样才能让AIS更多地了解孩子们?

安大略省滑铁卢大学的团队有一个答案:改变AIS培训的方式。

这是关于通常用于训练AI的数据集的东西 - 除了巨大,他们是非常具体的。一只狗的照片只能是狗的照片,对吗?但是一只带有漫长的狗的真正小狗怎么样?那种狗,虽然仍然是一只狗,但看起来更像是一种完全成长的金毛猎犬的猫。

这是Waterloo队的方法的这个概念是基于的。他们描述了他们的工作上个月在预印本(或非同行评议)服务器arXiv上发表。用一个例子教一个人工智能系统识别一种新的物体类别,这就是他们所谓的“一次性学习”。但他们更进一步,专注于“一次不到的学习”,或简称LO-shot学习。

LO-SHOT学习包括一个系统学习,以根据小于类别数量的示例对各种类别进行分类。这不是最简单的概念,以包裹头部,所以让我们回到狗和猫的例子。假设你想教导AI识别狗,猫,袋鼠。如果没有几种动物的明确例子,可能会如何完成?

Waterloo Team说,关键是他们称之为软标签。与硬标签不同,将数据点标记为属于一个特定类,软标签梳理到该数据点和多个类之间的关系或相似度。在只有狗和猫训练的AI训练的情况下,可能会描述第三类对象,比如袋鼠,可以描述60%的人喜欢狗,40%的人喜欢猫(我知道袋鼠可能不是最好的第三类动物)。

“软标签可用于表示使用较少的原型的培训集,而不是课程,通过普通(硬标签)原型来实现样本效率的大幅增加,”本文说。翻译?告诉AI A袋鼠是一些分数猫和一些分数狗 - 这两种狗都看起来很好地了解 - 它能够识别袋鼠而不见过一个。

如果软标签足够细微,理论上你可以教会AI基于数量少得多的训练例子识别大量类别。

本文的作者使用了一种称为简单的机器学习算法k - 最近邻居(knn)更深入地探索这个想法。该算法在假设中运行类似的东西最有可能在彼此附近存在;如果你去狗公园,那么会有很多狗,但没有猫或袋鼠。去澳大利亚草原,没有袋鼠,但没有猫或狗。等等。

为了训练KNN算法来区分类别,您可以选择特定的功能来表示每个类别(即,对于动物,您可以使用重量或尺寸作为特征)。在X轴上的一个特征和y轴上的另一个功能,算法创建一个图,其中彼此类似的数据点彼此聚集。沿着中心的一条线划分了这些类别,并且算法辨别出线的哪一侧的算法很简单,应该落在新的数据点。

Waterloo团队将其简单且使用过2D图中的颜色。使用图形上的颜色及其位置,团队创建了合成数据集和伴随软标签。下面有一个更简单的图形,以及饼图形式的软标签。

图片来源:Ilia Sucholutsky和Matthias Schonlau

当该团队让算法根据这些软标签绘制不同颜色的边界时,它能够将图分割成比软标签中给出的数据点数量更多的颜色。

虽然结果令人鼓舞,但该团队承认他们只是第一步,而且还有更多的探索尚未完成的概念。KNN算法是其中最不复杂的模型;当LO-SHOT学习应用于更复杂的算法时可能会发生什么?此外,要应用它,您还需要将更大的数据集蒸发到软标签中。

一个想法团队已经在处理的是拥有其他算法为使用LO-Shot训练的算法生成软标签;手动设计软标签并不总是简单地将一些饼图分成不同颜色。

LO-shot在减少人工智能系统工作所需的训练数据量方面潜力很大。除了减少培训新模型所需的成本和时间,该方法还可以让无法获得大型数据集的行业、公司或个人更容易接触人工智能——这是人工智能民主化的重要一步。

图片来源:Pen_ash.Pixabay

Vanessa是奇点枢纽的高级编辑。斯洛伐克捷克比分直播她对可再生能源,健康和医学,国际发展和无数其他主题感兴趣。欧洲杯和欧冠的区别当她没有阅读或写作时,你通常可以在户外,在水中或在飞机上找到。

关注Vanessa: