用电脑预测犯罪,小学生柯南可以退休了?
对不起,电脑说你的数据显示你有犯罪的可能性,请跟我到警察局走一趟。
电脑居然有比名侦探柯南还神的逻辑推理能力,光数据就可以看出谁是凶手?
的确可以,美国一位教授就教会了电脑预测犯罪的能力。
(图:PennCurrent)
宾夕法尼亚大学(University of Pennsylvania)的犯罪统计学(Criminology and Statistics)教授 Richard A.Berk 称可以用统计学的算法预测犯罪行为。
而 Berk 的这项工作建立在机器学习的基础上。
(图:AItists)
Berk 称只要把数据输入电脑——被逮捕的次数、犯罪类型、人口统计信息……,人工智能就能算出犯罪可能性指数。而这个想法在于建立一个不依据无意识偏见、审判者情绪和人类缺点的指标来确定罪犯。
如何预测犯罪,以家庭暴力为起点
Richard A.Berk,Susan Sorenson 和 Geoffrey Barnes 共同撰写了研究论文,于今年 2 月发表在《实证法律研究杂志(Journal of Empirical Legal Studies)》上。
论文中以家庭暴力为研究对象,考察了计算机通过算法预测“未来犯罪的风险程度”。
论文中他们将 28000 则发生在城市地区面临指控的家暴案例输入计算机,并假设了三种在两年内被指控家暴后可能发生的结果:因发生肢体伤害的家暴被逮捕;因其它类型伤害的家暴被逮捕;不会因再次家暴被逮捕。
输入的数据包括:年龄、性别、所在地邮政编码、初次犯罪的岁数及其被指控的犯罪类型,如谋杀、酒驾、家暴、虐待动物、金融诈骗等。
除此之外,还有个人被捕的次数、拥有的前科次数、在监狱中的表现记录、同高犯罪率邻居的接近性和 IQ 指数。
并参考 1984 年的保释修正案(1984 Bail Reform Act)。
(图表:《Forecasting Domestic Violence: A Machine Learning Approach to Help Inform Arraignment Decisions》)
研究以案件为观察对象,而不是个人,所以某个人有可能在研究案例中出现多次。
相对以往将种族和社会经济差距作为犯罪评判的标准,Berk 认为犯罪无关种族问题,并将种族因素排除在算法之外。
人工智能运用算法来预测犯罪的准确性则取决于数据前后关联的紧密程度。
预测犯罪,他已经花了几十年
据彭博科技报道,Berk 这项成果被运用在监狱内来确定哪个犯人处在限制的条件内;假释委员会应该在什么程度下监视出狱人员;还有警察确定家暴犯人是否有再次犯罪的可能性。
实际上,Berk 这项研究从 1960 年开始,至今已经进行了数十年, 90 年代中期,他开始专注于机器学习,Berk 将数据输入电脑中进行处理计算。2013 年他在 Chicago Ideas Week 节目上就表示了犯罪和天气一样可以被预测。
(图:YouTube)
此前,Berk 也为马里兰和宾夕法尼亚的州假释制度设计了相似系统。
依赖 AI 抓出潜在犯罪分子?还不是时候
在 Berk 实验中,算法可以非常准确地算出有低犯罪性的个人。但是对于准确预测有高犯罪性的个人还远不能达标:
- 预测一个人是否会从事不当行为,准确性为 9%;
- 预测假释或处于社会监控下的罪犯,是否会再犯杀人罪,准确性为 7%;
- 预测在保释期间的家暴者,是否会在开庭日前再次作案,准确性为 31%。
所以可以看出,将 Berk 的实验应用在实践中的方式是:将实验结果中低犯罪性的人分流出来,以节省多余的监控资源,再将资源集中运用在潜在高犯罪性的人身上。
(图:123RF)
但是如何用数据来准确指出谁是潜在的犯罪分子存在两个明显的问题:
- Berk 的实验中本身存在缺陷;
- 人类是具有自由意志的,自身能够判断犯罪是不是应该做的事情。只要没有真正地做出坏事,在刑事司法系统中他们就不构成犯罪,不能算犯罪分子。
另外,Berk 希望根据儿童及其父母的档案数据来判断儿童是否会在 18 岁成年前犯罪。但这就存在着一个很大的问题,每个人成长影响因素非常多,而新生婴儿还未做过任何事情,不可能只通过其出身环境和父母经历来判断其犯罪的可能性。
同时个人的档案数据分散在国家的各个机构,收集起来也非常麻烦。
以此来看,人工智能要真正准确地预测出犯罪分子还有一段相当长的路要走,即便在未来发展成熟,也未免就不会出现其它问题。
目前状况来看,还是需要万年小学生柯南帮我们指出:
凶手只有一个!
题图:Google