AWS用新方法将AI系统添加识别类别的训练工作最小化

AWS近日在Alexa博客中发布了一项只用新类别数据,来添加AI系统分类类别的研究成果,通过新方法将添加识别类别的训练工作最小化,该研究由Alexa研究团队首席科学家Alessandro Moschitti和其来自意大利特伦托大学的同事Lingzhen Chen,近期会在美国AI协会举办的第33届研讨会中,发布只用新类别训练数据,更新AI系统分类器技术的论文。

现今大部分热门的AI系统核心都是分类器,借由分类器将输入数据分为多个不同的种类,举例来说,分类器读取狗的图片后,能够根据图片的特征,将该图片分为狗,而不是猫,而语音的数据也是同理,但是,如果要在既有的分类器中加入新的种类,传统的方法就需要大量的新类别训练数据,经过繁杂的训练的过程,才能更新分类器。

过去的方法需要大量地新类别数据,并将这些数据加入原本用来训练分类器的数据中,最后再借由集成的数据集,训练出新的分类器,而现在的商用AI系统,都是通过数百万的范例训练而成,若要每添加一个类别就要重新训练分类器,将会是非常费力的工作。

在研究实验的范例中,研究人员训练了可以识别线上新闻文章中人和机构的神经网络,目标是要在原有的分类器中添加可以识别地点的能力,实验结果显示,最有效地方法是保留既有的分类器,将分类器输出的数据传递给一个独立分开的分类器,研究人员称之为神经适应器( neural adapter),接着,将神经适应器的输出数据当作是第二个平行分类器额外的输入数据,也就是说,适应器和新分类器是一起训练的,在执行的过程,相同的输入数据会一起通过分类器。

图片来源:AWS

这项研究成果对Alexa意义重大,由于Alexa的开发团队主要负责Alexa的核心功能,但是AWS也通过Alexa技能工具包,允许第三方开发者来打造自家的Alexa技能,现在已经有超过7万个第三方开发的技能,这项研究成果能够让第三方开发者,在不需要访问训练数据的情况下,直接利用Alexa的系统来开发新技能。