Brave搜索使用AI模型摘要用户搜索结果

诉求高隐私安全的浏览器Brave开发人工智能模型,不使用ChatGPT或是其他后端系统,在自家搜索引擎加入能够总结搜索结果的人工智能功能Summarizer,摘要旁也会列出数据源,方便用户查证事实。Brave在2021年正式推出自家的搜索引擎,取代Google成为默认,同样主打不关注用户活动或是搜索的高隐私性。

Brave提到,由于人工智能语言模型ChatGPT的推出,以及微软宣布在Bing搜索引擎集成OpenAI的模型,为应对人工智能在搜索引擎上的应用趋势,Brave通过集成过去发展的技术,开发了Summarizer。

Summarizer会在Brave搜索页面的顶端,显示简单扼要的搜索摘要,使用户能够快速掌握搜索结果,官方提到,Summarizer所提供的摘要完全基于网页搜索结果,通过利用大型语言模型处理网页上多个数据源,产生简洁精准的答案,并且以通顺连贯的语句表达。

Summarizer完全由Brave搜索团队开发,由三个不同的大型语言模型组成,这些语言模型分别负责不同的任务,第一个问答模型,会尝试从文本片段中截取具体的答案,Brave过去便已经使用大型语言模型提高搜索的相关性,知识图和精选摘要功能都是使用类似的技术,不同之处在于分析的文本片段数量和长度增加。

在问答模型截取粗略的答案后,Brave搜索会利用一组零样本分类器,过滤掉仇恨言论、粗鄙用词和垃圾消息等文本,最后留下可以使用的文本集,交由摘要模型处理,该模型会尝试重写并且删除重复的文本,保持语言的一致性和可读性。

由于Summarizer所给出的答案,完全基于网页的搜索结果,Brave提到,与单纯的生成性人工智能不同,不会输出未经证实的结论。而使用网页搜索结果,也让Summarizer能够提供当日事件的即时资讯,但是官方仍提醒,用户不应该完全相信人工智能所产生的结果,如同不应该完全相信网页上的资讯。

除了提供摘要之外,Brave搜索也会以人工智能模型产生网站摘要,替换原本各搜索结果下方的文本描述,并且突出显示可能的答案。这项功能属于单一来源的摘要,也就是该网站文本摘要,而并非考虑多个来源所产生的全面性总结。

Brave搜索现在每秒处理600次的查询,而Summarizer约针对17%的查询产生摘要,官方提到,他们的AI模型可能是目前世界上最大型的该类系统,因为他们对每个查询都使用Summarizer,因此每秒查询量较其他搜索引擎更多。Summarizer目前已经向所有Brave桌面和移动用户推出,不想使用的用户,可以在设置中关闭功能。