用“脸部识别”算法指认罪犯,会出现什么大问题?

脸部识别算法在现代治安作为其中正开始普及起来。这些算法收到照片、监视录像或3D摄影机快照,就会侦测脸部、测量其特征,并与已知脸部数据库做比对,企图确定照片中人的身份。

在柏林,能够识别已知恐怖主义嫌犯的脸部识别算法被训练来鉴识经过火车站的群众。

在美国,二○一○年以来,这些算法光是在纽约州,仅仅针对欺诈和身份盗用就发动了超过四千次逮捕行动。

而在英国,现在把摄影机架在交通工具上面,看起来像加强版的Google街景车,自动四处开来开去,交叉比对我们和通缉犯数据库的相似度。这些厢型车第一次成功找到目标是在二○一七年六月,一辆车从南威尔斯一名男子身旁开过去,而当地警方已对这名男子发出逮捕令。

脸部识别:算法做得比人类“更好”,但也有重大问题

我们的安全和保安往往取决于我们的脸部鉴定与识别能力,但这项任务交在人类手上,可能会有风险。

以海关官员为例,最近有一项研究仿真机场保安设施,这些人脸识别专家未能发现身份证不符的比率达惊人的百分之十四——而完全合格者则有百分之六误遭驳回。我不知道你怎么想,但我觉得,当你考虑到每天通过希斯洛机场的人数,这些数字不只是令人有点焦虑而已。

我们稍后会看到,脸部识别算法当然可以把这项任务做得比人类好。但用于追捕罪犯时,鉴识错误的后果是如此严重,而这些算法的运用引发一项重大问题。 把两个人的身份弄错,到底有多容易? 我们之中有多少个一副塔利脸的正潜伏在外头某处?

一项从二○一五年开始进行的研究显示,你在自己的真实生活中拥有分身的机会(无论是银行抢匪或其他)小到几乎为零。

当我们遇到自己的“分身”?

阿德雷德大学的泰涵.露卡丝(Teghan Lucas)千辛万苦在四千人的照中做了八种脸部测量,其中连一组相符的都找不到,让她得出结论:两个人要有完全相同脸孔的机率低于一万亿分之一。

根据这项计算,塔利不光是运气有“一点”背而已。考虑到他那位万亿中选一的邪恶分身也住在附近,而且碰巧是名罪犯,我们应该可以预期要在几万年之后,才会有另一个倒楣的人落入同样的悲惨经验。

但有些理由让人怀疑这些数字不太兜得起来。想象遇上和你脸孔相同的某人当然难,但长得很像却毫无关系的陌生人,这类轶闻证据看起来确实比露卡丝研究可能显示的消息要常见许多。

以尼尔.道格拉斯(Neil Douglas)来说吧,他搭机要前往爱尔兰时才发现,他的分身就坐在他的位子上。在他们的自拍照里,后面有满满一飞机的旅客与他们同笑,这张照片很快像病毒般传播开来。

不久之后,世界各地留着络腮胡、红头发的人寄来自己的照片,证明他们也有相似的长相。“我想,我们可以组成一支小型军队了,”道格拉斯告诉BBC。

我甚至有自己的故事可以添上一笔。

“相像”与“相同”不是同一件事

我二十二岁的时候,有个朋友给我看一张他们在当地乐团Myspace的网页增至到的照片。那是一场我没去过的演唱会上所拍照片的拼贴图,显示很多人乐在其中,而其中一人看起来眼熟得令人毛骨悚然。

为了确认我没有在某天晚上失去知觉,出门游荡去了如今想不起来有参加过的派对,我寄了电子邮件给乐团主唱,他确认了我的怀疑:我那爱好电子合成流行乐的分身,有着比我更精彩的社交生活。

因此,塔利、道格拉斯和我,就是各有至少一名分身的这种人,可能还不只一名。在七十五亿人口中,我们加起来就有三人,而且我们还没开始认真算人头呢——这样已经远超过露卡丝估算的一万亿分之一。

有一个理由可以解释这种落差。一切都归因于研究人员对“等同”的定义。露卡丝的研究要求,两个人的测量结果必须完全相合。即便道格拉斯和貌似他的人像到不可思议,如果有一个鼻孔或一片耳垂相差多达一毫米,根据她的判准,他们严格说来不算是分身。

但就算你比较的是同一个人的两幅图片,精确的测量并不会反映出我们每一个人是如何持续在改变,由于年老、疾病、疲惫、我们所做的表情,或我们的脸如何因摄影机角度而被扭曲。

想以几毫米之差来捕捉脸的本质,那么你在同一个人脸上所发现的变异之多,将一如你在人与人之间发现到的。简单说,单凭测量无法区分两张脸孔。

虽然这两张脸孔或许不完全等同,但一点都不难想象自己会把道格拉斯和照片中他那素昧平生的分身给弄混。塔利的情况类似,他和真正的抢匪看起来甚至没有那么相似,但图片还是被联邦调查局专家错误解读,甚至于他被控以未曾犯过的罪名,扔进最高保安等级的牢房。

把不熟悉的脸孔弄混很容易!

正如海关官员所显示的,把不熟悉的脸孔弄混,即使这些脸孔只是略有相似,惊人地容易。

结果证明,人类出乎意料地拙于识别陌生人。这就是为什么我的朋友声称,她是耐着性子勉强看完克里斯多福.诺兰(Christopher Nolan)摄制优美的电影《敦克尔克大行动》(Dunkirk)——因为她要花很大的力气来分辨这些演员。

这是为什么青少年发现,“借”年长朋友的身份证去买酒颇有成功的机会。这也是为什么根据美国非盈利法律扶助组织“清白项目”(Innocence Project)评估,在百分之七十以上的冤案中,目击证人误认发挥了某种作用。

不过,虽然目击者或许很容易将道格拉斯与他的同机旅伴弄混,他的母亲当然可以毫无问题地从照片中认出她儿子——即使说的是真实生活中的分身:一对完全相同的双胞胎,如果你和他们只是泛泛之交,或许容易弄混,但只要你对他们有正确认识,分辨他们同样容易。

这里有一个关键点:相似性取决于观者的角度。没有严格定义相似性, 你无法测量两张脸孔有 多么 不同,我们也就没有一个标准可以说两张脸孔完全相同。 你无法定义何谓分身,或是说某一张特定脸孔有多常见;最重要的,你也说不出两幅图片摄自同一人的机率为何。

这意味着脸部识别作为一种鉴识法,不像DNA是自豪地端坐在强大的统计学平台之上。把DNA检测法用于刑事鉴识,罪犯特征剖析的焦点是放在基因组的特定区块上,这些区块已知在人类身上会有高度变异。该变异的程度是关键所在:如果犯罪现场发现的身体组织样本DNA串行与采样自嫌犯身上的串行吻合,代表你可以计算两者来自同一人的机率。

也意味着,你可以说出某个倒楣家伙碰巧就在那些点上有相同DNA串行的精确机率。你使用的标记越多,比对错误的机率越低,所以借由选择所要测试的标记数量,全世界每一个司法系统都完全能够决定他们愿意容忍的疑虑限度。

以脸孔来指认重罪得不到科学支持

即便我们觉得自己的脸孔与我们是何许人有如此本质性的关联,如果不知道人类身上的变异性,以脸孔来指认重犯的做法得不到严谨科学的支持。说到以照片认人,借用联邦调查局鉴识单位的说法:“缺乏统计,意味着这些结论最终都是奠基于个人看法。”

不幸的是, 用算法来做脸部识别并未帮我们解决该难题,这是对于运用算法来指认罪犯一事提高警觉的极佳理由。相像和相同不是同一回事,而且从来不是同一回事,无论算法变得多精准。

而且,另外还有一个要对脸部识别算法步步为营的好理由。这些算法并非真如你想的那般善于识别脸孔。