更全面的训练机器学习模型,Google添加多样性开放图像数据集

为了将地理的多样性带到开发图像中,Google最近宣布推出收集多样图像的数据集Open Images Extended,让全球的人们都能用Crowdsource App将图像加入Open Images Extended中,通过这样的方式,让图像开发和研究人员能够在研究中涵盖多样性,该数据集为Google开放图像数据集的新分支,用来补足核心开发图片数据集,第一个加入的数据集包含超过478,000张来自世界各地群众贡献(Crowdsourced)的图像,主要的图像数据来自印度、中东、非洲和拉丁美洲等地区。

这些图像聚焦于几个主要的种类,像是日常生活中的物品、植物和动物、食物和不同职业的人,人脸的图像因为隐私权保护,会经过模糊处理,为了训练出现bug含多样性的机器学习模型,训练数据必须广泛地涵盖全球的样本,Google表示,现在还是这个漫长旅程的早期阶段,因此,Google广邀人们下载Crowdsouce App,提供自己通过手机拍摄的家乡照片。