为推动少数语言语音系统研究，脸书推出AI模仿幼儿学说话大挑战

脸书与巴黎文理研究大学合作，并在微软研究院赞助下，集合三方资源举行人工智能大挑战ZeroSpeech 2019，要求开发者教导人工智能系统，以更接近幼儿学语的方式来学习语言。这项研究能让研究人员，在语言或是文本有限的情况下，仍然可以训练人工智能语音系统。

人类幼儿在学习阅读与写作之前，就学会说话，脸书提到，为人工智能复制这种能力，将有助于解决数千种低资源语言相关的人工智能任务，这些语言缺乏构建传统语音合成系统的要素，包括需要的文本资源或是语言专业。

ZeroSpeech 2019为ZeroSpeech 2017和ZeroSpeech 2015的延续，要求参与者创建一个人工智能语音合成系统，该系统不使用任何文本或是语音标签（Text-To-Speech without Text）。挑战为未知语言提供原始声音频，在缺乏对照、文本或是标签的情况下，参加者必须以非监督式学习探索字根单元，并将之与语音相对照，并用最佳的方式以给定的声音重新合成出一个句子。

这项挑战会为参与者提供原始声音频以及基线系统，该系统其中一个组件负责字根探索，另一个负责语音合成，参与者可以自行构建端到端的系统，以产生更高品质的声音波形，最低标准是至少替换其中一个基线组件。

这个挑战不仅将探索非监督式学习技术，也将有助于自动翻译与自然语言理解的相关研究，让这些领域的研究不只集中在英文，而能以更全球化多语言的角度推进。挑战截止日期为3月15日，并将在9月的Interspeech会议颁奖。