自从ChatGPT问世,它便成为史上窜红速度最快且影响力最广的聊天机器人。尽管ChatGPT已经向世人展现几近无所不能的可怕能耐,但以文本的输入输出作为唯一的互动模式,总觉得有点受限的感觉。若能像人类面对面直接说话的方式进行互动,才会更加直觉与自然。
如今以色列D-ID公司在巴塞罗那举行的世界移动通信大会(MWC 2003)上展示与众不同的生成式AI API,让企业可以将虚拟人物流媒体图片无缝添加到自家产品、应用程序及服务上。当前企业若想要打造自家AI聊天机器人时,除了自行开发外,也可以通过ChatGPT API等方式快速搞定,但其提供的沟通接口,多半是一长条的文本提示栏,如今D-ID公司的生成式AI API则支持虚拟人物及头像,这让用户与聊天机器人之间的互动就像和一般人对话的方式一样轻松、自然。
用户想要打造更人性化的自然沟通接口很简单,在D-ID生成式AI API下,只需一张人头照,就可以自助生成虚拟头像的流媒体图片,接着通过内置的文本转语音技术或上传自己声音的录音频,便能让虚拟头像讲话,更酷的是,该API并支持超过100种语言。如果遇到不方便讲话的时候,用户也可以选择用打字的方式与该AI聊天机器人沟通。
D-ID首席执行官暨共同创办人Gil Perry表示,人类并不适合只依赖文本或音频对话,聊天机器人若拥有一张人脸,反而让人觉得更亲切、更自然。他并且认为,当前人们往往对AI抱持怀疑或警惕的态度,具备人脸接口的聊天机器人多少能打破这样的疑虑及隔阂。
站在商业角度来看,人脸/对话式聊天机器人不仅能节省雇佣真人从事客服及员工培训上的成本,并且比起纯文本输入式聊天机器人,更具增进客户体验度及黏着度的效益,并且更能发挥提升员工学习效率的帮助。或许在不久的未来,我们也能看到服务型机器人在生成式AI的加持下,与人类流畅沟通互动的情景。
(首图来源:D-ID)