为推动少数语言语音系统研究,脸书推出AI模仿幼儿学说话大挑战

脸书与巴黎文理研究大学合作,并在微软研究院赞助下,集合三方资源举行人工智能大挑战ZeroSpeech 2019,要求开发者教导人工智能系统,以更接近幼儿学语的方式来学习语言。这项研究能让研究人员,在语言或是文本有限的情况下,仍然可以训练人工智能语音系统。

人类幼儿在学习阅读与写作之前,就学会说话,脸书提到,为人工智能复制这种能力,将有助于解决数千种低资源语言相关的人工智能任务,这些语言缺乏构建传统语音合成系统的要素,包括需要的文本资源或是语言专业。

ZeroSpeech 2019为ZeroSpeech 2017和ZeroSpeech 2015的延续,要求参与者创建一个人工智能语音合成系统,该系统不使用任何文本或是语音标签(Text-To-Speech without Text)。挑战为未知语言提供原始声音频,在缺乏对照、文本或是标签的情况下,参加者必须以非监督式学习探索字根单元,并将之与语音相对照,并用最佳的方式以给定的声音重新合成出一个句子。

这项挑战会为参与者提供原始声音频以及基线系统,该系统其中一个组件负责字根探索,另一个负责语音合成,参与者可以自行构建端到端的系统,以产生更高品质的声音波形,最低标准是至少替换其中一个基线组件。

这个挑战不仅将探索非监督式学习技术,也将有助于自动翻译与自然语言理解的相关研究,让这些领域的研究不只集中在英文,而能以更全球化多语言的角度推进。挑战截止日期为3月15日,并将在9月的Interspeech会议颁奖。