现在,有一群科学家正在研究通过机器学习,来计算出谁将有可能在未来进行犯罪。听上去是不是有点像科幻故事的情节。科幻动漫迷们一定记得《心理测量者》这部漫画。
《心理测量者》动画
《心理测量者》描述的是一个人类内心活动均能够数值化的科技时代,同样能被量化的,还有每个人的“犯罪系数”。人类所有的感情、欲望、社会病态心理倾向等全部被监控摄像头记录并管理,每个心理状态和个性倾向所衡量的值,通称PSYCHO-PASS,也就是片名。它被用来判定人们的思想状态、个人精神本身。通过计算这些数值,系统可以自主断定一个人最理想的工作,感情,心理压力,甚至犯罪意图。
人们需要不断地保证自己的指数在正常范围,否则会被系统认为是潜在犯,将会被“矫正”。动漫故事里的情节对于我们来说,或许不再难以实现。宾夕法尼亚大学(University of Pennsylvania)统计学教授理查德·伯克(Richard Berk)和他的研究团队就在开发一种新的算法,希望能预测哪些人会在未来犯罪的风险高。
在此之前,伯克的算法已经能帮助监狱确定该把哪些犯人关到高度警戒区。假释部门用他的工具判断该对哪类假释人员采取更严格的监视手段,警官则用来预测曾因家庭暴力被捕的人是否会犯罪。他还编写过一个算法,可以告诉美国职业安全与卫生管理局(Oupational Safety and Health Administration),哪些工作场所可能违反安全方面的规定。
机器学习能提前预测犯罪发生
先来看看伯克的算法是如何做到预测犯罪的。参照之前谷歌旗下人工智能系统“阿尔法狗”。在完成打败韩国棋手李世石前,谷歌从网络上喂给“阿尔法狗”上万的棋局数据,让其学习如何以最优的策略进行下棋,还让“阿尔法狗”自己进行训练,提升自己。
伯克的算法与“阿尔法狗”类似。在今年2月份,伯克和宾夕法尼亚大学的心理学家苏珊·索伦森(Susan Sorenson)共同将研究发表在了《实证法律研究》的杂志上。他们收集了从2009年到2013年所有发生家庭暴力的案例,约有10万件。接着,他们使用了机器学习的方法,将这些数据喂给电脑程序,包括年龄、性别、邮编、第一次犯罪的年龄以及一长串先前可能相关的犯罪记录。比如酒后驾车、虐待动物、涉枪犯罪等。但伯克并没有将种族这个信息作为输入信息选项喂给计算机。
伯克的研究:年龄和犯罪的相关性
三分之二的案件信息,由研究人员输入来“训练”系统,并让其推测结果,这些人是否会第二次进行家庭暴力犯罪。三分之一的数据,他们则用来测试系统。这部分案件,计算只能知道和提审法官一样多的信息,然后得出结论,看谁会因为二次犯罪而被捕。
通过机器学习,警方能够很容易地锁定哪些人重复犯罪,需要监禁哪些二次犯罪风险较高的人。伯克在文章里说,目前,由于涉嫌家庭暴力的罪犯有一半是被释放的,这给警察和政府对他们的监控带来了很高的成本。他们的研究挑战就是在释放的案例中,推测哪些人二次犯罪的风险较低,从而能抽出更多的警力监控那些犯罪风险较高的人。与法官的判断进行对比的结果是:法官判断有20%的人会再犯,而计算机给出的比例仅为10%。
伯克的研究:预测犯罪的正确率结果
除了家庭暴力的案件研究外,伯克在假释和缓刑方面的算法已经得到美国费城政府的使用。伯克把费城市所有缓刑和假释的人都划分到了高犯罪风险、中犯罪风险和低犯罪风险三个档次里。对于系统认定为低犯罪风险的人,市政府大幅降低了对他们的监视强度。
该算法还运用在马里兰州和宾夕法尼亚州全州范围内的假释体系里。据彭博社拿到的数据分析,在2011年和2014年之间,大约有15%的假释申请人基于风险评分得到了不同的假释裁决。和以往的假释人员相比,在此期间获假释的人员被逮捕的情况大大减少。所以结论是:伯克的软件帮助州政府做出了更明智的决策。
政府部分的使用,也给伯克带来了更多的信心。现在他正在着手建立一个新的系统:伯克想基于环境以及新生儿父母的过往,在一个人出生的时候就预测出他/她是否会在年满18岁时犯罪。
机器算法能否代替人类做出判决
在伯克的算法出现前,在司法部分利用计算机来处理案件,在美国已有先例。上个世纪90年代,纽约市就曾用数据信息来预测哪些地铁站是犯罪高发区。现在,随着算法越来越先进和熟练,甚至已经开始有商业公司与政府展开合作。比如,由密歇根一家名为Northpointe公司开发的系统Compas。根据该公司的介绍,在被这款软件认定为高犯罪风险的人里面,大约有70%的人被逮捕。
尽管这些系统给政府机构提高效率,但仍受到了许多批评和质疑。,数据安全问题。机器学习需要基于大量的数据进行分析和学习。涉及犯罪的数据又是高度隐私的数据,很多人担心数据是否会泄露。伯克在接受采访时曾表示,自己仅使用对公众开放的数据,即已经被捕的犯罪数据。他训练的系统不会窥视和使用普通人的数据。但他的新算法,在婴儿出生时就判断是否会在年满18岁时犯罪可能会受到限制。因为一个人大部分的个人信息都分散在许多机构,要收集这么多的信息,会非常困难。
,准确性问题。这也是算法遇到的最大问题,也是被人诟病最多的问题。因为算法都是基于历史犯罪统计数据来预测未来的犯罪行为,有可能会把过去的执法模式和认为特定人群(几乎全部是穷人和非白人)有犯罪倾向的想法画上等号。伯克也承认了系统会有这样的风险。还有更为直观的案例。根据国外新闻网站ProPublica发布的调查报告,他们查看了佛罗里达州一家法院在2013年和2014年使用过的Compas风险评分,发现黑人被标注为高犯罪风险、但后来并没有犯罪的可能性几乎是白人的两倍,,当都被评定为低犯罪风险时,白人犯罪的情况则比黑人常见得多。
第三,算法是否应该公开。因为涉及商业利益,Northpoint并没有将自己的算法公开,这也导致许多人认为这个系统存在猫腻。伯克公开了自己的算法,也攻击了该公司的做法。,过度依赖的问题。现在很多政府机构开始依赖算法提供的结果。这也是伯克担心的问题之一。他在接受彭博社采访时说,如果系统没有经过科学的认证和测试,那质疑就会随之而来。尽管机器学习能做出决定,但要从目前情况来看,让系统代替人类做出决定可能还为时过早。