研究:在预测再犯风险上,算法比人的判断更准确

在刑事司法领域中,主管机关必须将未来再犯风险纳入评估,才能给予犯罪人适当的罚则,但由“人”进行的评估准确度总有极限存在。美国研究团队发现,算法在预测累犯上似乎要比人类准得多,在一些测试中,甚至达到了90%的准确度。

常年以来,基于算法的评估工具一直被美国广泛应用于医疗、金融、升学及刑事司法领域,能够很好协助人们在必须做出决策时权衡数据。

但是在2018年,达特茅斯学院研究人员提出了研究质疑,认为对此类工具在刑事司法框架风险评估上的准确性并未高于人类,在质疑受到广泛报道后也引发美国刑事司法改革界的讨论。

美国有着世界最高的监禁率,如何降低监禁率的同时确保社区对安全的需求,也成为美国近年备受讨论的话题。一些人认为,如果工具的准确度并未明显高于人们,那么用来预测就毫无意义,只会加剧判决中的偏见,另一些人则认为,这样重大的决定应该由人而不是计算机做出。

尽管这些辩论提出有关算法工具的重要问题,但在评估更多数据和因素后,斯坦福大学和伯克利加大学者得出了结论:在受控环境中只评估少数变量时,人们的预测能力确实能与工具比拟,但在类似真实刑事司法环境的情况下,工具在预测累犯的风险评估上仍明显比人更准确。

研究人员指出,达特茅斯的发现基于有限的因素,但现实世界中的刑事司法环境通常要复杂得多,而且更加含糊,还有大量外在因素可能影响情况。

在《科学进展》(Science Advances)期刊的新论文中,团队描述了他们在类似司法环境下进行的测试结果,人类的准确率约只有60%,而工具则高达90 %,显示基于算法的工具在风险评估上仍要比人们好得多。

斯坦福大学计算社会科学家Sharad Goel认为,经过验证的风险评估工具可以帮助司法专业人员做出更明智的决定。

“举例来说,这些工具可以帮助法官辨别并释放对公共安全构成很小风险的人。但当然像其他任何工具一样,风险评估工具必须与健全的政策和人为监督相结合,才能支持公正有效的刑事司法改革。”

(首图来源:pixabay)