Meta公布台语翻译系统 没有标准文本书写系统仍能进行训练

人工智能自动翻译系统发展都是,效果已经越来越好,不过目前的技术仍然是基于文本来进行翻译,并非直接通过语音进行。最近Meta就开发出无文本翻译系统,就算没有标准的文本书写系统,也仍然可以训练AI模型。

Meta表示,新推出的“通用语言翻译工具”(Universal Speech Translator, UST)是全世界首个人工智能“口语对口语”翻译系统,可以对应没有标准书写系统以及缺乏专业翻译人员的语言,直接进行翻译。

(1/3) Until now, AI translation has focused mainly on written languages. Universal Speech Translator (UST) is the 1st AI-powered speech-to-speech translation system for a primarily oral language, translating Hokkien, one of many primarily spoken languages.https://t.co/onYKQ8uoKNpic.twitter.com/Iy8MRMOypQ

— Meta AI (@MetaAI)October 19, 2022

他们首个应用这个技术的语言,就选择了台语(闽南语)和英语的组合,系统已经可以对于两个语言之间的对话进行自动翻译和发音,Mark Zuckerberg更亲自示范这个技术。Meta表示,对于这种口耳相传的语言,在收集资料、设计模型和评估准确度的时候相当困难,需要首先利用“语音探勘”技术分析语音,然后配对闽南语和中文,再翻译到英文增加到训练数据库,中间也加入自己的拼音系统来评估准确度。Meta表示未来这个技术可以扩展到其他语言,也将会公开“大型语音翻译语料库”(LASER)让其他研究人员使用。

来源:Facebook