今天不仅仅是苹果,无独有偶地Google也碰上了语音助理的隐私性问题。Google这一方是上个月有大约1,000则被转录成文本的语音助理指令,被泄漏给了比利时的新闻媒体VRT NWS。为了表示负责,Google已经主动暂停了所有在欧盟的助理语音转文本抄录作业,并且重新审视语音频的使用与处理流程。
一名Google的发言人表示,在七月事发后,他们已经“与汉堡的数据安全相关当局取得联系,并且正在评估语音文件的处理流程,并且协助用户了解数据是如何被使用。”由于Google想要让助理更好地理解人类下指令的方式的话,就势必要依靠真人去“解译”那些机器听不懂的语句,因此有必要进行文本转录的作业,提供作为机器学习的基础,特别是相对来说使用人口比较少,公开样本少的语言(像这里的荷兰语、比利时语)更是如此。Google更进一步表示,他们一共只转抄了大约0.2%的语句,而且都是在用户触发语音助理后所说的内容,但VRT分析所有漏出的内容后,认定其中有153则语句不是由用户触发后所下的指令。
Google将暂停作业至少三个月的时间,而欧盟一方还在调查整件事件的来龙去脉,再决定是否采取处置行动。