枕骨突出照片 交大教授训练机器看脸识罪犯:识别准确率可达86%以上
上海交通大学的武筱林教授和他的博士生张熙近期完成了一项研究,他们发现,通过学习,机器可以通过照片分辨出谁是罪犯,谁是守法公民,识别准确率在86%以上。这篇题为“基于面部图像的自动犯罪概率推断”的论文目前已上传到预先打印的网站arXiv。他们利用计算机视觉和机器学习技术检测了1856张中国成年男性的面部照片,其中近一半是被定罪的罪犯。实验结果表明,通过机器学习,该分类器能够以较高的概率区分罪犯和非罪犯的照片。尤其是罪犯与非罪犯在内眦间距、上唇曲率、鼻唇角三个测量指标上存在显著差距。罪犯内眼角距离平均比普通人短5.6%,上唇曲率大23.4%,鼻唇角小19.6%。同时,他们发现罪犯和非罪犯的面部特征差异更大。从古至今,从西方到东方,我们都能看到类似于“相由心生”的说法。但不论是相士或是从事相应研究的心理学家,都始终摆脱不了“迷信”或“歧视”的帽子。武筱林和张熙出于好奇,试图利用数据分析推翻这门古老的“伪科学”,但研究出来的结果令他们大吃一惊。更令他们始料未及的是,文章一经公开,就招来了漫天争议。吴晓林11月30日告诉本网站,他收到了很多邮件。虽然大部分都是国际研究人员的来信,询问学术交流的数据和实验细节,但也有很多不友好的评论,甚至指责他的研究对社会“不负责任”。
吴晓林。
“我们的运气也不好,文章刚出来的时候正好是特朗普当选前后。有来自美国的邮件说,‘美国现在已经一团糟了,你们就别添乱了’。 ”也有人直接建议武筱林撤稿。对于被贴上“歧视”的标签,武筱林有些恼火,他强调,他个人的价值观绝对是反歧视的,而他做这个研究的原本目的是证伪。此外,他还收到了一些荒谬的评论,例如,一些网友希望他把这个东西交给纪委使用。武筱林告诉本站,他目前还是打算专心把这个工作进一步做得更严谨、更充分,这项研究的成熟程度离应用还很遥远,他们目前也没有任何走向应用的打算。 “从另一个角度来看,我们的研究也可能为反歧视提供依据”。但他也承认,人工智能研究中如何划定价值伦理的禁区是一个非常严肃的问题,他自己很难回答。“现在世界范围里都存在这样的争论,人工智能已经发展到这一步了。”那么,吴晓林和张西是怎么做这个研究的呢?通过学习,机器辨认出罪犯照片的准确率在86%以上实验选取了1856张年龄在18岁至55岁之间的中国男性照片,照片中男性面部没有毛发遮挡、疤痕或其他痕迹,并将其分为犯罪组和非犯罪组。非犯罪组包含“网络蜘蛛”从网上抓取的1126张照片,以及各行各业的人:服务员、建筑工人、司机、医生、律师、教授等等。犯罪集团有730张照片,其中330张是公安部或省级公安部门的通缉令,400张是与实验集团达成保密协议的公安局提供的。在730名罪犯中,有235人涉及暴力犯罪,包括谋杀、强奸、殴打、绑架和抢劫,其余的人犯有非暴力犯罪,如盗窃、欺诈和腐败。所有照片均调整为80cmX80cm,并控制亮度和灰度比,尽可能避免影响结果。研究中使用的照片样本。a组是罪犯,b组是非罪犯。
实验用4种分类器对样本进行检测,发现它们都能较成功地对罪犯和非罪犯组进行分类,准确率在86%以上。四个分类器的准确性。
武筱林和张熙进一步发现,罪犯和非罪犯在面部特征方面最显着的差别在内眼角间距、上唇曲率和鼻唇角角度这三个测度上。平均来讲,罪犯的内眼角间距要比普通人短5.6%,上唇曲率大23.4%,鼻唇角角度小19.6%。图B标记了三个不同的特征点。表4显示了犯罪组和非犯罪组在三个特征点的平均值和偏差值。
最后,他们发现计算机模拟出来的罪犯和非罪犯的“平均脸”比较相似,但罪犯间的面部特征差异要比非罪犯大。也就是,非罪犯群体间彼此长得更为相似,变化幅度更小。图C显示了罪犯的模拟平均脸。图D显示了非罪犯的“平均脸”。
“颅相学”、“天生犯罪人”:沉睡2个世纪的研究很多研究者一看到吴晓林的研究成果,马上就想到了西方十八、十九世纪曾经流行的“头盖骨相学”和“自然罪犯”理论。1870年,意大利监狱医生龙勃罗梭打开了意大利着名土匪头子维莱拉尸体的头颅,发现其头颅枕骨部位有一个明显的凹陷处,它的位置如同低等动物一样。这一发现触发了他的灵感,他由此提出“天生犯罪人”理论,认为犯罪人在体格方面异于非犯罪人,并认为犯罪人是一种返祖现象,具有许多低级原始人的特性。同时,他认为犯罪具有遗传性。切萨雷·龙勃罗梭的理论极具歧视性,一经发表就遭到各方攻击。此外,由于缺乏数据支持,切萨雷·龙勃罗梭的研究一直被视为伪科学。论切萨雷·龙勃罗梭的《罪犯》。
此后,反歧视的价值伦理在西方社会得到了进一步发展,关于外表和犯罪性的研究也逐渐沉寂。直到2011年,美国康奈尔大学的一个心理学研究团队发现人们仅通过观察一个人的照片判断他是不是罪犯的成功率相当高。“我也仔细阅读了他们2011年的研究,”吴晓林说,“但他们采用了传统心理学的实验方法。麻省理工学院技术评论说,我们在这个研究方向上迈出了新的一步,并与数据进行了交谈。”原本打算证伪,第一反应很吃惊对于“头盖骨相学”和“自然罪犯”的理论,吴玉林坦言,“无论从主流科学界的角度,还是从我个人的价值观和个人直觉来看,一开始都觉得这不靠谱。”但他认为,像康奈尔大学的心理学家那样使用传统的实验方法,以人为研究对象,必然会导致主观偏见和身体疲劳,于是他想到了用计算机来分析数据,并在量化的层面上进行造假。但出来这样的结果,武筱林感到很吃惊。他们早在一年前就取得了结果,但迟迟不肯发表,而是反复交叉验证,但始终没有推翻原始的结论。例如,在11月21日上传的他们论文的第二版中,他们做了一些修改。因为暗示罪犯的照片是警方提供的,而警方使用的摄像头在信号上可能与其他摄像头不同,所以他们故意在照片的光学信号中加入了很多噪音,以掩盖不同摄像头信号的差异。然而,前面的结论仍然有效,分类器仍然具有75%以上的准确率。此外,他们还特意重新核实了罪犯的照片,确认都是普通证件的照片,不是被捕后拍的照片。“所有算法出来的结果都相当一致,从技术层面来讲可靠性很高。”“我是来敦促你撤回手稿的。”外表与犯罪性的关联研究似乎是个潘多拉魔盒,在沉睡了200多年后打开,一样会遭受纷至沓来的批评。此前,吴晓林还向媒体展示了他收到的几封措辞强硬的邮件。一名留学在外的上海交大校友写到,“我建议你撤销这篇论文,并且上传一封公告,为不恰当的研究方法致歉。”理由是“这篇论文充满了极度的歧视和强烈的误导。我们人工智能领域的研究者不应当滥用技术,去做一些违反伦理的事情”。作者还强调:“这篇论文给上海交通大学的声誉带来了不好的影响。这对申请美国大学的上海交大学生来说,将是一场灾难。”另一封信则来自美国康奈尔大学的科研同行:“我是来敦促你撤稿的,因为这是一项可耻的工作。我们无法选择自己的唇部弧度、眼间距和所谓的鼻唇角角度。但犯罪者的问题在于行为,而不是长相。”外网上也有一些不友好的声音。《黑客新闻》的一位用户说:“我看总结的时候,以为是个笑话,但看完之后,发现是一篇严肃的论文。然而,这种研究需要犯罪学、心理学和机器学习方面的专家,而不仅仅是两个了解Keras的人。”有些数据隐私方面的专家也指出,“从这么小的数据样本里得到这么普遍性的结论,会给广大无辜群众带来大麻烦的。”国际隐私保护组织的理查德·泰南博士说:“作为个人,你无法知道机器是如何给你结论的。在小数据集上,算法、人工智能和机器学习可以建立任意和荒谬的相关性。这不是机器的故障。在不合适的地方应用复杂的系统是非常危险的。”“我们的研究也可以是反相貌歧视的依据”吴晓林觉得被贴上不友好的标签有点恼火。他说:“我个人的价值观其实就是反歧视。比如有些招聘广告公开要求长得好看,我就非常反对。”同时,他强调在科学上相关和因果是两回事。“罪犯趋向有这些脸部特征,也只能说两者之间有相关性,并没有说明里面存在因果关系。不是说长得一样就是犯罪,不是说天生一张犯罪脸。”“我们刚刚发现了外貌和一些社交行为之间的统计相关性。我们不关心也不能讨论里面的因果逻辑——也许有,也许没有——但我们不是这个领域的专家,我们没有这样做的知识、培训和经验。”从因果上来讲,也可能有这样一种解释:因为有些人长得异样,可能受到歧视和排挤,更容易走上犯罪道路。“所以我们的研究也可以是反相貌歧视的依据”。"核物理学家应该对原子弹造成的损害负责吗?"但当本站问及该如何看待社会伦理价值和科研之间的关系时,武筱林坦言这个问题很严肃也很复杂,他个人也难以回答。“为了人类社会更高的利益,科学家是否应该自律,而不是说追求知识、追求真理的人是无辜的,这种争议早已在全世界范围内展开,而人工智能也走到了这一步。是否会有一些禁区,研究人员摸不到,坦白说我也不知道。”“核物理学家该为原子弹造成的伤害负责吗?”这是武筱林抛回给本站的疑问。目前吴晓林不想被一些不理智的讨论打扰。他还在紧张地完善实验,因为批评家主要指出他们的样本量不够。“我们使用深度学习,这在现在也非常流行,比如谷歌的Alpha Go,它需要大量的样本数据。由于隐私问题,我们的数据仍然不够大。虽然在发表的文章中已经很大了,但还不够深度学习。”在经过完善后,他们计划将文章投到计算机视觉领域的顶级国际会议上去,并投向《自然》、《科学》这样的顶级学术期刊。但现在武筱林也在担心,公众舆论是否会影响到学术界对他们研究成果的接受程度。他期待更多的声音在学术上理性交流,即使他们用数据推翻自己的结论。吴晓林透露,这个领域已经大大拓展空。目前一些国际同行也在做类似的话题,这也是他们提前在arXiv上放文章保护自己优先级的原因。“大众积极的关注对我们的方向是好事,但不能误判误读。我们的研究没有得到任何私人或者司法部门的支持,也没有任何的商业目的。”