微软将自家自然语言生成模型T-NLG用在Bing搜索引擎中,改进字词预测,并且利用自然语言表示模型T-ULR,提升多语言智能问答的品质,还能在摘要中,突出显示与用户搜索相关的信息。
微软提到,Bing每日执行用户数亿次的查询,这些查询因用户意图、语言和地区不同,呈现多样且动态的形式,为了要能够良好地处理这些查询,微软在Bing上大规模的使用AI模型。在过去一年,自然语言处理模型有了很大的进展,无论是微软自家的T-NLG模型,还是OpenAI的GPT-3模型,其参数规模都大幅增长,微软也就将这些模型用于Bing中,以提升搜索体验与结果的品质。
首先,微软以T-NLG模型改进Bing搜索栏的自动建议功能,自动建议功能能够根据用户输入的字词,配对最相关的查询建议,来改善搜索体验,其目的是要让用户以更少的时间以及键盘输入次数,获得更佳的查询结果。最常用的解决方案,是根据其他用户的输入,来提供搜索前缀,但是随着用户输入更具体的搜索字词,该方法也逐渐失效,因此Bing需要能够即时生成建议,提供用户准确的搜索建议。
因此微软使用T-NLG模型,使Bing具备即时生成建议的能力,不受限于以前用户输入的资料,也不局限于用户当前输入的字词,自动建议覆盖的范围大幅增加,也改善了整体用户体验。微软提到,以技术的角度来说,无论是模型的大小还是推论的数量,使用生成模型具有一定的挑战性,他们应用了压缩以及缓存技术,来解决推论的效率问题。
微软也改善了Bing的其他人也问了这些问题(People Also Ask,PAA)功能,来覆盖用户的搜索意图,微软解释,PAA让用户能够直接探索与原始搜索有关的问题,不需要花耗时间修正搜索,就能够取得想要的解答,与自动建议功能同样的情况,由于Bing已经回应过许多用户的搜索,因此能轻易地提供类似的问题与解答,不过,有时候还是会遇到没有类似意图的搜索,于是Bing就必需要生成有用的问答,来提供PAA内容。
微软使用模型对数十亿个网页文件,产生问题与答案配对,因此当有相同的文件出现在搜索引擎结果页面上时,微软除了会在PAA区块显示现存类似的问题之外,也会加入预先生成的问题与答案配对,补充PAA区块内容。
另外,Bing也应用自然语言表示模型T-ULR,提升多语言和多地区的搜索结果品质,现在Bing的智慧问答功能,已经可以对超过100种语言和200个地区,提供零次问答服务,而且微软也应用该模型,突出显示搜索结果中的摘要重点,让用户能够更快地找到需要的答案。