硅谷创业公司Summari将连接内容自动生成摘要节省阅读时间

近期微软与Google接连宣布新的AI应用,微软将ChatGPT导入搜索引擎Bing与浏览器Edge;Google则是宣布推出AI聊天机器人Bard,许多AI创业公司也正加快脚步开始推出产品与新服务,硅谷创业公司Summari则是看准生成式AI技术的优势,将其运用在网络文章摘要生成上面。

用户只要丢一个连接,Summari就能迅速摘要出该篇文章的内容,除了省去读者一一点进网页大量阅读的时间,甚至还能为网站增加SEO,根据Summari官网上的实际案例宣称,曾为某科技类博客提升54%的网站停留时间以及48%的浏览量。

从支付工具到解决资讯爆炸,Summari总算觅得可行商模

Summari的创办人暨首席执行官Ed Shrager在2017年到2019年间,曾担任软银愿景基金(SoftBank Vision Fund)的董事,最后决定离职创业。他先是成立了支付网络创业公司Imagine Financial,无奈疫情暴发,这个点子就此打住。

接下来Ed Shrager与团队不断寻找新灵感,并以企业通信软件Slack作为创业点子的记录工具,但源源不绝的点子跟讨论很快就淹没在Slack频道里,必须一一重新阅读才能找会记忆与脉络。这时,Ed Shrager的“Aha moment”(灵光乍现的一刻)出现了:何不把有趣的想法“摘要化”,除了可以让团队快速理解创业点子外,也能节省沟通成本。

Summari创办人Ed Shrager从Slack上杂乱的消息中找到创业点子。(Source:LinkedIn)

Ed Shrager把这个想法延伸到网络时代下的媒体阅读环境:如今读者身处资讯爆炸的网络世界,不可能每篇文章都读遍。Ed Shrager因而再成立Summari,希望借由“摘要生产”这个产品,让读者迅速读完万篇文章。

然而在尝试一年后,Summari发现这样他们的商业模式无法顺利运行。Ed Shrager承认:“我们很难改变消费者阅读的行为,即便他们喜欢这项技术,也不会因此掏钱购买。”从读者常态的阅读习惯而言,若文章太长,或许会选择大致浏览过,或是存下连接以便有空的时候阅读,想让读者每月花钱订阅摘要技术并不那么容易。

经过持续努力,Summari总算觅得新的商业模式:改为B2B业务,为大量产出内容的网站生产摘要并收费。Summari收费以网站流量为基准,每月流量5万以下的网站,月费10美元;流量5万至25万的网站,月费50美元;流量25万以上的网站则是可以洽谈企业合作方案。此外,Summari也提供免费试用方案,不限网站流量,摘要最多5个连接,共2,5000字以内的文章。

不过具体来说这些网站可以怎么使用呢?举例来说,若新闻网站导入Summari的连接摘要工具,当读者在浏览新闻时,若内文文本有超连接,读者只要把鼠标光标放在超连接文本上,就会自动跳出该篇文章的摘摘要资讯,以简单的内容或列点的方式说明该文章内容,而不用真的点进超连接。

若内文文本有超连接,读者只要把鼠标光标放在超连接文本上,Summari就会自动跳出该篇文章的摘摘要资讯。(Source:Summari)

虽然目前Summari没有透露实际客户数量,但从官网的案例分享来看至少有3个客户,分别是科技媒体Know Techie、体育媒体Front Office Sports以及SEO顾问公司Wiideman Consulting Group。

其中,Wiideman Consulting Group希望寻求优化连接预览摘要的解决方案,因此运用了Summari的技术。在使用三个月后,他们发现客户的网站自然流量提升7.5 %,每位访客的页面浏览量也增加了4.3%,平均停留时间增加9.09%。

Summari一行训练生成式AI技术,但还达不到精准摘要的要求

Summari背后的技术,正是当今正红的生成式AI。

要想产出精确的摘要,关键在于去除不重要的资讯,留下重要的内容,但这也涉及摘要的用途为何。举例而言,一篇和新冠状病毒相关的专业论文,摘要需要包含艰涩的医学术语吗?还是要让普罗大众都能读懂?当时AI技术产出摘要的局限性在于“判断”资讯的重要性,以及如何服务不同的受众。

进一步分析,摘要有两种形式,一种是截取式摘要,截取原始文章的片段,虽然以技术而言较容易,但牺牲的是摘要的精确性。另一种更高层次的形式是抽象式摘要,通过GPT(Generative Pre-trained Transformer)模型生成经由总结的内容,能确保摘要精准,相对对技术而言,是极大的挑战。

由于Summari深知为文章摘要,内容高品质且精确是最基本的要求,不过创业初期的AI算法仍达不到这样的要求,因此仍然是以人工方式进行摘要,试图自行训练并优化一个大型开源NLP(natural language processing)数据库。

他们走访哈佛、斯坦福等25所顶尖大学,招募对此感兴趣的学生,用能抢先看到有趣的内容和些许报酬作为吸引力,让学生愿意为内容摘要,并训练他们的摘要符合一致性以及高品质。“虽然一些学生表示,就算没有报酬还是愿意为Summari摘要, 但Summari认为支付报酬是应该的,因为不想利用年轻人。”Shrager解释。

2021年11月,Summari和创业公司Primer AI合作,借由Primer AI的平台及其资料截取技术,加上Summari自身庞大的人工摘要数据库,训练AI模型,让生成的摘要符合精准性和规格化。

Summari与Primer AI合作,精进AI生成技术。(Source:Primer AI)

“摘要不会取代文章”,Shrager认为,摘要只是让读者迅速分辨文章值不值得细读的工具,Summari的目标也在于提升文章的浏览。此外,Summari也避免摘要过短的内容,或没有价值的文章。

然而,日前微软才推出集成Open AI的ChatGPT和GPT3.5技术的新版搜索引擎Bing和浏览器Edge,也可以协助用户摘要正在浏览的页面或文件。Summari虽作为“连接摘要”的先行者,但是现在AI市场变动非常快,一旦像微软这样的大型科技公司也加入摘要的战场,创业公司如何生存将是一大考验。

(首图来源:Summari)