AI竞赛亚马逊不缺席,新开发大型语言模型准确率胜过GPT-3

OpenAI以GPT-3.5系列模型之一微调,2022年初完成训练,年末推出ChatGPT引发热议,带动全球AI热潮。亚马逊新开发的大型语言模型(Large Language Models,LLM)宣称只用10亿个参数创建模型,准确率还比最先进GPT-3高16%。

亚马逊近期发布《Multimodal Chain-of-Thought Reasoning in Language Models》论文,资深产品经理Assaf Yablon指出,LLM经过10亿个参数训练,达91.68%的惊人准确率,相较红火的GPT-3,它是以1,750亿个参数训练而成,准确率是75.17%,亚马逊LLM准确率比GPT-3高16%,这令人印象深刻的成就是在Chain-of-Thought(CoT)提示帮助下完成。

亚马逊LLM推论答案流程。(Source:Assaf Yablon)

亚马逊方法是通过两阶段架构集成语言(文本)和视觉(图像),架构分成基本理由和推断答案,如此答案推论过程受益于多模型资讯。简而言之,亚马逊LLM能根据更多知识产生更有洞察力的基本理由和答案。

看来这波AI竞赛亚马逊并没有打算缺席,LLM架构不算复杂且完整开源。想象如能进一步开发成类似ChatGPT的对话式AI,可用于亚马逊电商客服,一问一答解决消费者App操作、付款、到货等问题,也能推荐商品,使购物体验优化。此外,由于架构集成文本和图像,或许也能帮助品牌供应商或第三方卖家产生商品文案。

(首图来源:shutterstock)