OpenAI开发的人工智能聊天机器人ChatGPT最近在社会引起热话,虽然有大批用户支持,但同时也引发争议,受到很多人批评和质疑。有媒体开始测试用ChatGPT写新闻的可行性,但也有媒体担心自己饭碗会被人工智能机器人抢走。《华尔街日报》和CNN等主要新闻机构就炮轰OpenAI,称OpenAI实验室在没有付费的情况下盗用他们的文章,以训练ChatGPT。
事缘本月15日,曾任《华尔街日报》记者的Francesco Marconi在Twitter发文指,他曾问及ChatGPT以什么新闻来源进行训练,并要求它提供数据库中的顶级新闻来源清单。ChatGPT回复有高达20家主流媒体在列,包括路透社、纽约时报、卫报、BBC、CNN、华盛顿邮报及彭博社等。
Francesco Marconi指,ChatGPT的人工智能由大量高品质的新闻来源训练,但不清楚OpenAI和这些传媒机构有什么协议。倘若OpenAI在未经传媒同意下擅自提取数据,有违服务条款。
ChatGPT is trained on a large amount of news data from top sources that fuel its AI. It’s unclear whether OpenAI has agreements with all of these publishers. Scraping data without permission would break the publishers’ terms of service.pic.twitter.com/RXEjMHWXiI
— Francesco Marconi (@fpmarconi)February 15, 2023
美国新闻集团(News Corp)旗下道琼斯斯公司(Dow Jones)执行副总裁及总法律顾问Jason Conti在给予Bloomberg的声明稿中称:“任何想利用《华尔街日报》报道训练人工智能的人,事前都应该向道琼斯斯公司取得相关授权,但道琼斯斯公司并没有和OpenAI完成任何协议。公司对有人滥用我们记者的文章一事十分认真,现在已着手展开调查。”Bloomberg已就事件向OpenAI查询,OpenAI对此尚未作出回应。
据外媒引述知情人士透露,CNN也认为OpenAI滥用他们的文章去训练ChatGPT,有违新闻网站服务条款。CNN打算与OpenAI洽谈,向OpenAI收取盗用内容授权费。
除了新闻机构外,今年1月也有一群艺术家集体控告Stability AI、Midjourney和DeviantArt等AI绘图工具,指控这些AI绘图工具在未获授权下,滥用数十亿张受版权保护的图片,用于训练AI。
数据源:Bloomberg