“印度最丑的语言是?”Google大神有解惹议

明明是个不该有答案的问题,Google大神却毫不犹豫将有4,000万人使用的语言视为解答,自然引发轩然大波。

印度最丑的语言是?

“印度最丑的语言是?”倘若上周把这道不该有答案的问题输入Google搜索框,Google可是会毫不犹豫由搜索结果回答:康纳达语(Kannada)。

Home to the great Vijayanagara Empire,#Kannadalanguage has a rich heritage, a glorious legacy and a unique culture. One of the world’s oldest languages Kannada had great scholars who wrote epics much before Geoffrey Chaucer was born in the 14th century. Apologise@GoogleIndia.pic.twitter.com/Xie927D0mf

—PC Mohan (@PCMohanMP)June 3, 2021

印度议员莫汉(P. Chikkamuni Mohan)提供的屏幕截屏,可发现Google一度将康纳达语视为“印度最丑语言”的解答。

22种官方语言之一,用户至少4千万人

虽然一度遭Google视为“印度最丑的语言”,但康纳达语是22种印度宪法认证官方语言之一,主要盛行于印度西南部地区,使用的人至少有4千万,印度史上也不乏以康纳达语创作的作家、音乐家,有些人更曾是全国性奖项得主。

偏偏就是拥有丰富内涵历史的语言,Google视为“印度境内最丑的语言”。

诋毁康纳达语形象,网友齐举报

因此可想见,Google将康纳达语视为“印度最丑语言”截屏传开后,立刻引发强烈反弹。

将康纳达语视为该邦官方语言的卡纳塔卡邦(Karnataka)邦长林巴瓦利(Aravind Limbavali)很快便发布贴文,要求Google道歉,并提到邦政府可能会因为Google涉嫌“诋毁我们美丽语言的形象”而采取法律行动。同时许多网友也自动自发录像片,教导其他网友该如何以“仇恨、种族主义或带有攻击性”为由,向Google举报这搜索结果。

当用户在Google搜索框输入问题,Google的算法就会遍查网络资料,将最有可能为用户解惑的内容放入“精选摘要”字段,并附提供“精选摘要”解答内容的网页。浅灰色线条上方区域,就是本次出错的“精选摘要”字段。

到底发生什么事?

然而Google搜索结果又发生什么事,才导致这起再明显不过的乌龙?

原来问题就出在Google七年前推出的新功能“精选摘要”。当用户输入问题后,Google算法就会遍寻大量网站,挑出最有可能为用户解惑的答案,显示在搜索结果的“精选摘要”区域,并附上提供解答的网页,方便用户进一步查看。

7年前推新功能,偶尔出错惹麻烦

7年下来,Google内部对“精选摘要”上线后成果赞誉有加,但Google也不得不承认,有时候算法“精选摘要”的解答并非总是“正确”,某些情况下,算法会误将人们的意见、评论当成正解,显示于“精选摘要”。

这正是康纳达语误被算法当成“印度最丑语言”解答的原因,因为在某个网页,确实有过这则问题的回答,答案正是本次苦主康纳达语。

关注数字议题的记者佩努认为,随着后疫情时代的来临,Google也应承担一部分检核内容的责任。图为Google的CEO皮猜伊。 (Source:Google)

移除精选摘要、迅速致歉

遇到使用康纳达语者强烈反弹后,Google很快便以康纳达语、英文发布道歉声明,同时也移除出错的精选摘要,并承诺会继续改善算法,避免类似问题发生。

科技巨头有责,后疫情时代责任更重大

然而,考虑到Google科技巨头的身份,关注数字议题的记者佩努(Inji Pennu)主张Google应该要尽力执行验证程序,“通过文化分析消除这类偏见”。与此同时,他还建议Google应要举办内部工作坊,改善算法,好让它能识别哪些信息可能有争议性。

“这在后COVID-19时代尤其重要,当所有人生活都更数字化后,Google的平台就可能用来制造恐惧,甚至挑起种族纷争。”

不是首次出错

不过这也不是Google算法首次出错,而给公司带来麻烦。2018年时,Google CEO皮猜伊(Sundar Pichai)就被迫向国会议员解释,为何当时Google搜索“笨蛋”(idiot)一词,头几个搜索结果会包含当时美国总统川普(Donald Trump)的照片。