从“董明珠事件”看信号灯人脸识别系统-虎嗅网

本文来自微信公众号：技术与商业（ID：April-News），作者：四月，原文标题：《热点解读：信号灯人脸识别系统之“董明珠事件”》。

“这大概是人脸识别（技术）被黑得最惨的一次。”

在“误识董明珠”事件背后，人们得以再次窥见人脸识别技术应用的局限性，尤其在环境复杂的室外和路口场景。

红绿灯路口人脸识别系统首先在2017年落地，以部分大中型城市作为试点，在这之后对于该套系统的可信度有多少、存在多大实际价值等追问一直没有停止……借此次事件集中探讨。

昨天（11月21日），宁波交警行人闯红灯曝光台的照片在网络社交平台火速流传：大屏幕中出现了知名女企业家、格力电器董事长兼总裁董明珠的照片，旁边还展示了她在“桥东违法闯红灯”。

对照该照片所处的场景和位置，可以发现是人脸识别系统出错，将喷涂在大巴车上的董明珠广告人像错当横穿马路的路人记录，闹了个大乌龙。

宁波交警对此回应称，这属于人像误识别，对此已经删除，技术人员已经对系统进行了升级、减少误识别率。

值得注意的一点，曝光台上识别到的该路人身份名称为“巨**”，这明显不吻合董明珠的真实身份，可见该套人脸识别出现的错误不止一处，其中包括：

一、将董明珠的照片识别为“巨**”。根据工商信息查证，格力电器董事长兼总裁董明珠确实叫“董明珠”，即在公安的人像底库中，董明珠的身份也应该显示为“董明珠”，但人脸识别系统却将其识别为“巨**”。

二、将移动的静态的广告牌人像识别为“闯红灯的路人”活体。

笔者根据公开报道统计，该套方案自2017年年初开始就已经在国内超过十余个城市地区铺设，全国多地交管部门都引入了类似系统已规范行人遵守交通法规，其中落地城市既包括深圳、上海等一线城市，也有西安、济南、宁波、武汉等二三线城市，以及宿迁等重点三四线城市。

但是，这些方案仅局限在部分市区和路口的落地，约为数十个至百个数量级，并未大范围地推广至城市级或者区域级。

比如，济南市自2017年5月3日实施人脸抓拍系统以来，一共抓拍了6213起行人、非机动车闯红灯违法行为。未来，济南将在全市约50个主要路口安装该系统，同步配套启用的还有实时曝光屏、闯红灯预警系统，以及机动车不礼让斑马线抓拍系统。

深圳曝光了从2018年3月8日至3月12日，在同一地点新洲莲花路口东侧发生的15起行人闯红灯事件。涉事行人都是在闯红灯时，被监控抓拍下来，再通过人脸智能识别，识别出涉事行人的身份信息，予以曝光。

该套方案的主要内容包括：

首先，红灯亮起时，启动人脸检测系统；

然后，摄像头检测道路上是否有行人越过停止线，并针对该行人的人脸进行拍摄，系统会自动抓拍4张照片，保留15秒视频，并截取他的头像；

最后，将照片载入公示的大屏幕，滚动播放。

针对抓拍后受是否进行身份识别可将该套解决方案分为两种类型：只抓拍不实时识别；抓拍并实时识别，连通户籍信息或者身份信息。

后者的应用场景难度比一般的动态布控系统更高。因为一般的安防应用场景，重点人员的数量通常比较少。但两种解决方案的最核心目的都是为了起到震慑作用，警示民众闯红灯行为可能带来的惩戒。

比如，对于行人及非机动车闯红灯行为，交管部门可能给予20元、50元的处罚，或者将该信息记录进个人诚信档案。从现阶段落地情况来看，大部分的红绿灯人脸监控系统均实现了抓拍和识别的联动。

根据央视新闻等公开资料显示，该套系统可实现：

从抓拍到身份识别整个过程只需10秒钟，人脸识别准确率超过90%。

（上海）交警总队科技处民警戚悦介绍，这套系统不仅能够实现抓拍取证，还能识别违法人员的身份信息。即使在夜间也能清晰成像。一般情况下驾驶人戴头盔、墨镜或口罩等干扰，也不影响图像与后台数据库比对。

被“打脸”的是谁？

对于该问题的第一个争论焦点便落在这套人脸识别系统采用的是哪家供应商，哪家AI公司提供的技术支持？

首先，谈到人脸识别领域的AI公司，四小龙（商汤、旷视、依图、云从）最先躺枪，依图的算法被认为算法精度最高。

本周，美国国家标准与技术研究院（NIST）公布的全球人脸识别算法测试（FRVT）结果，依图科技以千万分之一误报下的识别准确率超过99%，继续保持全球人脸识别竞赛冠军，商汤科技摘得第三名和第四名。

商汤和旷视在政企安防市场分别占据一定市场，商汤曾参与深圳市智慧交通项目建设。此外，有知情人士表示，深圳市龙岗区深圳交警这套系统由云天励飞承建一部分，新闻中的摄像头上有他们的Logo。

“闯红灯这类项目有特定的部分公司‘擅长做’。”

“宁波属于江浙一带，那里应该是海大宇的地盘。”

其次，对于活体识别准确度不高的问题，基于此前防攻击的活体检测的手段和案例可以看到，主要可以从算法优化、物理硬件摄像头升级、主动配合等三种方式攻克。但是是否能够应用到室外复杂场景中的红绿灯上呢？

现阶段看来，该操作性基本可以否决。

一是目前针对活体检测的防御手段主要针对近距离的人脸识别和检测；

二是将普通摄像头升级至红外、3D摄像头的成本过高，尤其是3D摄像头；

三、要求行人主动配合的方式更加不可能实现，但加入运动检测的方法，针对前后两张图片做差分可能识别到运动的物体，但也可能误识到没有闯红灯的运动行人。

震慑之外，可信度有多高？

最后，也是最为核心的问题，结合技术能力与产品逻辑分析，在红绿灯路口进行人脸识别所检测到的数据结果究竟有多少可信度？

尽管行人和非机动车闯红灯同样是违法行为，但由于取证困难，一直以来管理和处罚都比较难。考虑到人脸识别被很多人认为是个成熟领域的问题，参考车牌识别的逻辑，于是有了红灯绿路口人脸识别的方案。

人脸识别主要包括两大类：a.人脸验证（1：1）；b.人脸识别（1：N）。

通过刷脸验证是否和身份证为同一人，可以设置一个阈值，比如有9成把握两者一致，就可以放行了。目前主流算法是通过卷积神经网络提取人脸及身份证人脸的特征，经过相似度比对确定是否为同一人。在一些公开学术人脸数据库榜单上，比如LFW人脸验证上达到了99.83% （2018.3）的精度，已经超过了人类。

然而在大规模人脸识别中，挑战依然存在。

路口的应用场景就属于后者。目前公开的、最大的人脸识别数据库是MegaFace，达到百万级别，是目前全球最大的公开人脸识别测试集，也是目前最为权威热门的评价人脸识别性能，特别是海量人脸识别检索性能的基准参照之一。

这项赛事中有项挑战是在百万级别人脸数据中进行识别测试。目前排名第一的算法在此项测试中达到98%（2018.3）的精度（值得注意的是，作者对数据做了处理，这是处理后的精度，不做处理的话，算法精度在83%左右）。

识别闯红灯这套系统要在亿级甚至十亿级规模的干扰里达到报道里声称的90%的rank1识别率，可信度不高。“10^9的样本是非常挤的，即便在一个完美的特征空间里都未必能取得90%的rank1识别率，更何况还有光照、姿态和路人戴墨镜等问题。”相关研究员分析。

那么，这套系统在业务上是否存在减小搜索空间的可能？

实际上，在很多机器代替人力的场景通常都会保留人工干预的空间。例如可控环境下的人脸识别已经可以在非常小的误识率（FAR）的情况下取得比较理想的准确率（TAR）。在涉及安防这些不能犯错的场景中，系统还是会选择把困难样本交给人去处理。

说到底库为16亿人像，比对的难度并不是问题。数据库和比对算法都是可以优化。简单来说，是在本地人占90%的情况下，把数据库限于本地人（本地人可能还有50%做行人的概率小于1%，例如婴儿宅男和开车族）。

参考电子警察，部分困难样本由人工来进行后台审核。

但是，电警审核一般是离线审核，比如这周拍的片子留到下周审核。而该系统有实时性要求，跟电警不太一样。另外电警审核难度不大，这套系统对人脸分类的准确度要求估计早已超过人脑极限了。

曾参与上海城市级安防布控项目的行业人士表示，在职的时候捕获率、识别率都不高。一天也没几张，按老东家的套路必然后台会审核的。审核是肯定会有的，目测审核的人力成本还是挺大的。只把抓到的人脸实时显示出来就行了，至于身份信息，还有很多人工要做才能确认的。

有参与该类项目的真身表示，政府采购都有极其严格PK流程和评判指标，可靠性是绝对不用质疑。我们的证件照底库是16亿。

“这套系统主要抓附近居民，结合地理信息，只检索附近几个小区，而且不一定要抓多准，只要能抓几个典型，威慑一下就好。”有行业人士认为，这类项目仅作为试点推行，目前人脸识别系统主要适合做跨摄像头的罪犯跟踪等，单纯抓人脸，摄像头的分辨率也的确不够看的，平均50*50像素大部分厂商都无法做到。

“这根本不是识别率的问题，而是闯红灯这种场景根本不适用人脸识别。”有从业者提出质疑。

一是技术准确性影响无法作为证据使用。这项技术是1：N的人脸库检索匹配，即便出来的结果也只是给出相似人脸案例，并不能保证100%准确，在法律上是无法作为证据使用，只能列为嫌疑。而摄像头在抓拍的过程中，受到角度光线移动速度等影响，采集的质量不如对着地铁扶梯抓拍实在。

二是海量检索的时间、及人力成本太高。如果非逃犯，用来做违章过滤后，还需要进行进一步的人工排除，组合其他摄像头位置进行组合匹配，再进行进一步确认，人力成本太高。

安防从业人员认为，这个东西是否有意义已经不是简单的技术问题了。

一方面工程角度有太多难题，人脸识别最大的难点就在相机拍摄环境，即光线变化，角度等，其次就是面部特征的变化可能性太大。

另一方面是算法要满足室外、一次/多次拍摄等要求，即使在行人再识别（person re-id）也没有达到非常理想的程度。

结语

从海量的（全球，或者全国，或者全市）样本中，去筛选这一个闯红灯的人。精度要达到多少才能满足要求呢？

比如从百万级ID照片中，识别这个闯红灯者的照片，精度即使做到99.9%，那么平均还有上千人被误判，或者说，只能筛选出一个包含上千个体的集合。但是针对行人检测的数据库搜索是10亿级别的，如果只考虑一线城市，至少也是千万级别的。

而现在，这个准确率只有90%。

人脸识别技术并非万能，即使在舞台最大的安防产业，人脸识别技术所能发挥的角色也有其限制。

本文来自微信公众号：技术与商业（ID：April-News），作者：四月。