Google地图应用机器学习技术,自动清除7,500万笔不良评论

Google地图上有约2亿个兴趣点,用户每天会增加超过2千万条评论、评分或是其他内容,而为了确保这些内容的可靠性,Google需要在不当内容上传后,被其他用户看到之前就将它删掉,随着越来越多人在Google地图上做出贡献,Google就要不断运用各种技术以及人力,来快速解决违反政策的不良行为。

Google在其博客上表示,他们使用以机器学习技术为基础的自动侦测系统,每天扫描数百万笔的贡献,以维护平台内容的品质,Google甚至还能处理虚假评论,系统会在评论真正发布到Google地图上之前,逐一进行检查,以侦测虚假消息的特征,自动侦测系统的机器学习模型,会注意特定的单词和短语,检查用户账户过去贡献内容的类型,并侦测可疑的评论模式。

但因为机器学习技术并非完美,因此Google也聘请了操作员和分析师团队,对Google地图上的评论、照片、商业文件和其他类型的内容进行审核,同时Google也让所有用户标记评论,作为删除不当内容和误导性地点的依据。

在2019年,Google地图每天收到2千万笔的贡献,一年约是70亿笔的数据,Google提到,他们运用机器学习模型和自动侦测系统,共移除了超过7,500万笔违反政策的评论,以及4百万笔假的商业数据。而Google也利用来自用户的直接回应,共移除了超过58万条评论以及26万笔商业文件。

另外,Google也审核并删除了超过1千万张违反内容政策的照片,以及3百万个视频,这些违反政策的影音数据,大部分为离题照片。通过良好地训练机器学习模型以及操作员,Google也禁用了48万个用户账户。Google强调,绝大多数用户的贡献都是真实的,违反政策的内容不到百分之一。