Google近日公布去年11月投入使用的通用语言模型研究。结果显示,Google语言模型现在已经可对100多种语言进行识别。在部分通用语言识别上,Google语言模型的语义理解表现更是亮眼。相较OpenAI推出的大型语言模型Whisper,语义识别错误率更低。
根据Google官方介绍,Google语言模型可进行持续的自我学习,并可在BEST-RQ算法的加持下不断修改语言模型整体架构,从而完成持续分析、学习语言结构等操作。除此之外,Google语言模型在进行语义理解时,还会调动text injection以及监督式loss函数,从而让语言模型语义理解更加精准。
目前,Google语言模型在处理70多种语言翻译时,错误率已经可以保持在30%以内。
值得一提的是,Google语言模型在处理非裔美籍人士所使用的英语口语CORAAL、混合口音的SpeechStew以及其他多种语言的FLEURS测试中,其正确率甚至在Whisper之上。