Google AI已经能理解100多种语言，通用语言模型语义理解表现极佳

Google近日公布去年11月投入使用的通用语言模型研究。结果显示，Google语言模型现在已经可对100多种语言进行识别。在部分通用语言识别上，Google语言模型的语义理解表现更是亮眼。相较OpenAI推出的大型语言模型Whisper，语义识别错误率更低。

根据Google官方介绍，Google语言模型可进行持续的自我学习，并可在BEST-RQ算法的加持下不断修改语言模型整体架构，从而完成持续分析、学习语言结构等操作。除此之外，Google语言模型在进行语义理解时，还会调动text injection以及监督式loss函数，从而让语言模型语义理解更加精准。

目前，Google语言模型在处理70多种语言翻译时，错误率已经可以保持在30%以内。

值得一提的是，Google语言模型在处理非裔美籍人士所使用的英语口语CORAAL、混合口音的SpeechStew以及其他多种语言的FLEURS测试中，其正确率甚至在Whisper之上。