Google Lens图片识别力超强,识别产品超10亿种!

去年5月Google展示人工智能(AI)图片识别技术Google Lens,周三Google表示,经过一年半的进展,现在Google Lens已经能识别超过10亿个对象。

Google Lens是以AI和计算机视觉为基础的图片文本识别技术,让用户可以手机拍摄食谱后,将其食材加入购物清单,或拍摄名片后加入联系人名单。为了训练Google Lens,开发小组打造了自家光学字符识别(OCR)引擎,再结合经由Google 搜索和知识图谱(Knowledge Graph)累积对语言的知识,再以Google Books扫瞄而来的不同字符、语言、字体、及图画来训练机器学习算法。

碰到很难辨认数字0或英文本母O,这时Google Lens会运用Google 搜索的语言和拼字矫正模型来判断,一如Google可以将bannana修正为banana,因此Google Lens看得懂c00kie可能意思是cookie。

Google表示,现在他们利用自家OCR引擎做其他用途,像是读取产品标签,现在Lens已经能识别超过10亿种产品,是一年半推出时的4倍。

除了读取图像中的文本外,在美国地区Google Lens还增加图像商品速搜并集成图片搜索功能,用户只要用手机对着衣服、立灯或其他家饰物品,Google Lens还显示类似的商品,并提供商品的比价和评比等信息。