2019-01-28 17:44:00 来源:格隆汇
亚马逊开发的面部识别软件受用于美国区政府和联邦执法部门,是一个强力的打击罪犯工具。然而,上周四一份研究报告显示,该软件在一些基本测试不通过,包括分辨人的性别。
麻省理工学院的研究人员表示,亚马逊名为Rekcognition的面部识别系统在评估浅色肤色的面孔时结果较准确,测试浅肤色的男性结果表现最佳,但在约30%的测试中错误辨识皮肤较黑的女性性别。人们担忧警察在公共场所例如机场或学校使用此项人工智能技术,有可能因肤色不同导致有偏差的结果。
人工智能工程师说,这些出错的问题在于,系统训练的大量图像都严重偏向白人。然而,研究表明,在经过严格的审查和企业投资改善结果后,一些系统的正确率在过去一年迅速增长。
亚马逊对于这项研究结果提出异议,称研究测试的算法与FBI测试的面部识别系统工作方式不同,认为强制让某种软件算法选择特定的男女性别答案会产生误导结果,这也并非警察,工程师或其它使用者在使用这个面部识别软件的原理。佛罗里达州和华盛顿警察部门已就此展开调查。
监督人工智能和机器学习的亚马逊网络服务高管马特伍德(Matt Wood)在一份声明中表示,研究人员在测试他们的系统时基于“面部分析”算法,该算法可以检测和描述图像中人脸属性,例如人是否在微笑或戴着眼镜。相反,亚马逊的“面部辨识”算法用于匹配不同的面部图像,尤其应用在寻找逃犯或失踪儿童的情况。
伍德说:“如果用‘面部分析’算法来做辨识人脸测试,无论是什么应用(包括执法),都不能测出其‘面部辨识’的准确率。这个研究的测试方法并非系统的正确使用方法。”他还表示,测试是用未更新的软件进行,最近内部在最新软件上进行了同样测试,准确率有所提升。亚马逊在11月曾表示,系统已更新其面部分析和面部识别功能,能更准确地配对结果,并更准确取得的年龄,性别和情感特质等资料。
但独立研究人员认为,这项研究结果显示了亚马逊人工智能发展的严重问题。
去年,计算机科学家布奥拉姆维尼(Buolamwini)和添姆尼·格布鲁(Timnit Gebru)在IBM,微软和中国科技公司Face++开发的面部识别系统中发现了类似的性别分类错误,以及肤色深浅的准确性误差。
几个月后,IBM和微软都宣布他们已经改进软件算法,在性别和肤色上能得到更准确结果。研究证实,虽然准确性提高,但这些系统对于肤色较深的人面仍然不能准确辨认性别。
这些测试使用的人脸是来自欧洲和非洲中六个国家月1200名国家议会成员的面部图像进行。研究表明,亚马逊所有面孔辨识错误率为8%,IBM为4%,微软则不到1%。
乔治城法学院隐私和技术中心高级助理卡拉儿·嘉威(Clare Garvie)说道,从多方面来说,要求一个系统进行性别分类,让机器学习比进行识别更容易,因为识别使用的不仅是二进制,而是数以百万计的公式。
Garvie补充:“但亚马逊对于此研究具自我防御性,且不愿意仔细找出产品的潜在问题。事实上,承认一个行业已知的问题并努力寻求解决方案,这样才能(让微软和IBM)成为一个负责任的人工智能开发商。然而,无论亚马逊怎么回应,这个研究已被审查了很多遍,也已经引领了行业变革。”
美国商务部国家标准技术研究所评估了39个面部辨识系统的准确性,并表示近年来看见准确性的增9长。但是该评估是自愿参与的,亚马逊和谷歌等公司都拒绝参与。布奥拉姆维尼敦促亚马逊提交其辨别系统模型,参与国家的基准测试。她还提醒使用者注意系统结果偏差,并“立即停止在警察和政府监管等高风险环境中使用”。
人工智能的面部识别技术能精准地识别远方人群,这引发科技公司数百万美元的投资竞争,认为该技术可以加速警方调查,改善公共安全,挽救生命。
FBI反恐官员在去年11月的亚马逊网络服务会议上发表讲话,当局在2017年拉斯维加斯枪击事件中使用过亚马逊的辨识系统,以取得可观结果。
但是群众不仅对于系统准确性的问题存疑,更担忧技术被用于未取得人民同意下监视用途,威胁到公众抗议和自由言论的权利。公民权利和隐私权倡议者纷纷担心新技术对自由民主造成致命影响。例如,软件结果错误可能导致警察或执法人员对无辜的人做出暴力对待。
这项人工智能的技术软件也引发了美国硅谷与华府之间的对立关系,科技发展与隐私使用等的矛盾,政客要求政府立法保护隐私权。一些亚马逊股东和员工认为公司不应把软件转售给警方,其他公司的高管也敦促政府加紧管控该行业的发展。
微软首席执行官萨蒂亚·纳德拉(Satya Nadella)正在开发面部识别软件,但同时呼吁加强监管。布奥拉姆维尼也表示,面部分析技术的武器化和滥用的可能性不容忽视。
政府的监管规条远远追不上面部识别技术的发展速度,如今在机场,音乐厅和餐馆都能找到面部识别系统。未经检验的系统也以安全为由,将在美国各个学校,社区中心扫描所有的父母,儿童和访客。
面部识别系统通过将图像分解到名为哈希(Hashes)的复杂数字代码来运作,这些代码可与其它图像的哈希庞大数据库快速比较。类似的人工智能技术用于脸书的照片建议人物标签,苹果手机面部解锁或美国各地机场的旅客面部识别系统等等。
当面部识别或面部分析算法回报结果时,结果包括了对于辨识结果的可信程度,比如直接匹配的会有99%可信度,但模糊不清或不确定的配对的可信程度就较低。
(文章来源:格隆汇)
免责声明:本网站所有信息仅供参考,不做交易和服务的根据,如自行使用本网资料发生偏差,本站概不负责,亦不负任何法律责任。如有侵权行为,请第一时间联系我们修改或删除,多谢。
© 2018 今日中国财经 版权所有