2017年I/O大会,Google发布一款识人又识物的新产品。
- 你只需要对着别人的名片一扫,所有信息就能存进通讯录。
- 你只需要对着景物一扫,就能获得当前景物的所有信息。
- 当你在游览时,它还能当你的随身翻译、导游……
更重要的是,这款产品打破了智能手机的档次局限,无论是高端旗舰还是低端入门,只要搭载的是智能系统,任何手机都用得上它。
这个在当时有着神仙功能的新品,就是我们在往后2年I/O活动都能看到的“Google Lens”,如今这个产品经过2年发展,已成为识物工具中的佼佼者。
而随着今年Google在这款工具里加入AR和朗读功能后,有着124年历史的笛洋美术馆(de Young museum)也在近日宣布,将全面支持游客用Google Lens游览展馆。
这也是世界第一家支持Google Lens的美术馆/博物馆。
(Source:de Young museum)
在笛洋美术馆内,游客可以通过Google Lens识别展品,系统在进行识别后会推送当前作品的作者、历史等相关信息,游客可以在馆内通过这个功能自由获取想了解的内容。
(Source:Google)
更有意思的是,除了识别作品,游客还可通过Google Lens识别特定物品,成功后系统会播放作品相关的AR图像或视频内容。
通过这种方式,游客能获得面前这幅作品以外的信息,比如作者介绍作品的创作经历等,让游客通过具体且优雅的方式获得知识内容,就像和艺术家面对面交流。
不过,AI识物能在未来取代传统人类导航,成为游客获得新知识的主要途径吗?这个想法可能不错,但现在似乎还有点早。
强大的AI人工智能让Google Lens成为世界数一数二的识图工具,越来越多应用途径,也让这款工具走出实验室和PPT,成为用户了解新事物的另一种途径。
(Source:Google Lens)
但这种机械式的向导能取代人力成为未来游览的发展主流吗?笔者认为“取代”可能说得有点早了,而且在短期内,AI导航不会取代人类成为主流。
首先不否认AI的两个优势:全天候运行和可延展性。
相比于人类导航,AI能24小时全天工作,同时通过自学习能力,AI能在执行任务时不断学习,且在网络的帮助下,AI并不是一个大脑在学习,而是服务器主脑和终端“大脑”的信息互通,进而组成一张存储特征的智能网络。
表面来说,比如笔者用手机扫描面前的杯子,系统会记录物体的特征信息,当其他用户扫描类似的物体时,AI会特征识别和结果筛选,快速得出结果。或当笔者第一次扫描这物体时,AI会先记录特征,当笔者第2次扫描时,AI会继续增加特征,进而全局提升识别的速度和准确率。
神经网络的自学习能力能让AI的识别效率接近人脑,甚至有不受情绪和精神的影响,可能还超越人脑,但能得出准确无误的结果,前提是需要大量训练。
(Source:COCO)
AI能在短时间内得出识别结果,实际上依赖研发团队在功能推出前的各种训练工作。譬如在Google的TensorFlow API中,他们会通过COCO数据库的90大类、共30万张图像对AI做识别训练,通过图像提升AI的识别能力;但即便有大量的训练信息为基础,AI也并非天下无敌。
The Verge近日《人工智能难以识别低收入地区的日用品》文章,就探讨AI识别的基础,并下了“AI训练不平衡”观点。
研究人员发现,物体识别算法在识别月收入50美元的家庭物品时,结果的误差大约会比超过3,500美元的物品增加10%,而且不同地区物品的准确率也差异甚大,比如算法在识别美国物品方面会比索马里和布基纳法索的物品提升15%~20%准确率。
另外,这篇文章有意思的论点在于,由于AI识物在训练时大多都是在发达地区训练,因此对于非发达地区的物品,AI识物会出现识别失效情况,这种不平衡的现像很可能影响未来自动驾驶在非发达地区的发展,因为自动驾驶需要依赖传感器和AI识别。
同一个Soap(肥皂),不同的结果。(Source:The Verge)
所以尽管AI在某些方面比人类表现出色,但前提需要大量的数据支撑,对于有变量的物品,人脑学习和处理会比AI优秀。面对博物馆的固定展品,AI能带来低成本、快捷的体验,但应对交互和数据库没有的物品,人类导航仍有优势。
不过AI要取代人力,真正要克服的不是知识量,而是交互情感。
AI识物能提供详细的知识传播,但却不具备人类最可贵的交互交流。虽然AI识物方便参观者通过手机审查展品详细信息,但这只是机械性获得千篇一律的内容,并非人与人交流。这种区别就像网络授课和面对面课堂,获得的信息不变,但若要提问数据库没有的知识,谁能解答呢?
当然,面对情感这个大问题,不少厂商也正通过语音优化让AI贴近人类发声,比如Google Duplex在语音加入仿人类的语气和停顿,“唔”、“哦”这些助词让AI说的话更像真人而不是机器人;苹果也在iOS 13通过TTS对Siri进行多语音拼合优化,让Siri的发音更自然。
总体而言,虽然目前AI有强大的学习能力和识别效率,但还有知识的提供途径,AI当下仍处于辅助为主的发展阶段,拥有情感和交互的人力依然有主流优势。
不过不可否认的是,在网络技术推动下,AI已踏上高速发展道路,越来越贴近真实人类,AI若干年后能提供新知识给我们,并非不可能。