人脸识别技术将改写人类社会的游戏规则，这事会率先发生在中国

虎嗅注：细思恐极。通过人工智能来实现的人脸识别技术，已经可以区分出直男和弯男，用来识别在公共卫生间偷拿厕纸的人（别笑，这事北京市政正在做！）；而只要有你的一滴血，就能借助基因组数据还原你的长相。

你也许不知道的是，中国在人脸识别技术商业应用方面，已经走到了世界的前列。

这些事实对于我们到底意味着什么？以下三篇文章会提供一些答案。

为了给虎嗅会员寻找全球的好内容，虎嗅正式和《经济学人·商论》展开合作，每月向虎嗅会员提供两篇其付费专享内容，本文由《经济学人·商论》十月刊人脸识别技术专题三篇文章《不露声色》《构造脸谱》《人脸识别-产业复合体》合并而成。

以下是三篇文章全文：

不露声色

用人工智能识别性取向

现代人工智能（以下简称AI）深受推崇。归根到底，就是因为它那从大量数据中发掘模式的超人能力。Facebook已利用这种能力绘制出空前详尽的贫困地区地图，它使用的AI系统学会了如何在卫星图片中辨认人类居住区域；医疗研究人员训练智能手机中的AI程序来检测癌症病变；谷歌的一套系统可以准确猜出照片拍摄的年份，只因为该系统看过的照片数量之多非人力所能及，因而能发现人类无法察觉的模式。

AI发掘模式的能力正被用于更为私密的事情。斯坦福大学的米哈尔·科辛斯基（Michal Kosinski）和王轶伦的研究显示，机器视觉可通过分析人脸来推断性取向。他们认为，软件是通过检测面部结构上的细微差异而做出推断的。科辛斯基表示，只要使用恰当的数据集，也许还可以训练类似的AI系统来识别其他私密特征，如智商或政见。人类无法发现人脸发出的这些信号，并不意味着机器也识别不了。

这项研究的详情即将发表于《个性与社会心理学期刊》（Journal of Personality and Social Psychology）。

研究使用的数据下载自美国一家公开会员资料的热门约会网站，包含36,630名男性的13,0741张照片，以及38,593名女性的170,360张照片。研究人员首先利用基本的人脸检测技术，在所有照片中挑选出单张人脸的大小和清晰度可满足分析需要的照片，最终选出14,776人的35,326张照片，其中包括同性恋和异性恋、男性和女性，比例均等。

数字乾坤

接着，这些图片被输入到另一个名为VGG-Face的软件中，它给每个人都分配了一长串数字，作为其“脸纹”。下一步是采用名为“逻辑回归”的简单预测模型，探寻“脸纹”特征与其主人性取向（按约会网站上公布的情况）之间的关联。当所得出的模型分析它之前没见过的人脸数据时，区分同性恋和异性恋的能力远高于人类。

面对随机显示的一张男同照片和一张直男照片，该模型的辨别准确率为81%。当显示同一人的五张照片时，模型的准确率达91%。在女性数据上，模型的表现较为逊色，凭一张照片辨别性取向的准确率为71%，五张照片时的准确率为83%。两种情况下，其表现均远超人类的区分能力。面对同样的照片，人们对男性性取向的识别率为61%，对女性性取向的识别率为54%。有研究显示人类从他人面部特征辨别性取向的能力仅略胜于瞎猜，上述数字印证了这一点。

科辛斯基和王轶伦为该模型的表现提供了一种可能的解释。胎儿在子宫中发育时，会暴露于各种不同水平的激素（尤其是睾丸酮）环境中。目前已知激素水平会影响到面部结构的发育，而它们对性取向可能也有类似的作用。研究人员表示，系统可以从面部结构获取有关性取向的细微信号。通过使用其他技术，研究人员发现该程序在识别男子性取向时最留意观察鼻子、眼睛、眉毛、面颊、发际线和下巴；对于女性，程序则更关注鼻子、嘴角、头发和领口。

这项研究有其局限性。首先，约会网站上的照片很可能会特别彰显个人的性取向。91%的准确率是有前提的——已知显示照片的两名男子中有一人是同性恋。在实验室之外，准确率会低得多。为展示这一弱点，研究人员随机选取1000名男子，每人至少有五张照片，但其中男同和直男的比例更接近于现实世界的情况——每100人中约有7人为同性恋。在被要求挑出100名最有可能是同性恋的男子时，系统选择的人中只有47人是男同。这表明，在系统看来，某些直男比真正的男同更像同性恋。

然而，当要求系统挑选出它最有把握是同性恋的十张脸时，它选出的十人中有九人的确是同性恋。假如目标是从一大群人中挑出少数很可能是同性恋的人，系统似乎是可以胜任的。重点并不是科辛斯基和王轶伦创造出了能可靠识别性取向的软件——这不是他们的目标，而是他们证明了这样的软件已能够实现。

计算他人隐私

科辛斯基并非第一次涉足争议性研究。他之前发明过基于Facebook数据的心理测量分析方法，利用人们个人资料中的信息估测其个性。去年美国总统大选时，特朗普的竞选团队就采用过类似的模型来定位目标选民，这种方法引来了批评。

科辛斯基表示，他做这项研究是要演示机器视觉的威力，并使政策制定者对此有所警惕。这种威力会令个人隐私“不可避免地”被进一步侵蚀，而人们必须要了解这种危险。配偶也许会想知道性取向识别软件会如何判断自己的伴侣（搜索关键词“我丈夫是不是……”时以“同性恋”结尾的几率比“出轨了”高10%）。在同性恋不为社会接受或被视为非法的地区，这样的软件可能会造成严重的安全威胁。科辛斯基竭力强调自己并没有发明什么新技术，只是把互联网上任何人都可以取得的软件和数据结合起来而已。他请《经济学人》对其使用的约会网站保密，以阻止他人效仿。

诚然，任何人若想复制科辛斯基的研究、通过人脸特征推断私密特质，都会在把实验室技术应用于外部世界时面临重大挑战。但不断增加的数据量和不断改进的算法会帮助他们。“假以时日，他们定会胜出。” 卡内基梅隆大学的亚历山德罗·阿奎斯蒂（Alessandro Acquisti）说道。他已证明，运用人脸识别技术和网上信息就能查出一个人的社保号。对那些有秘密要隐藏的人来说，这一切都是坏消息。

构造脸谱

研究人员凭借基因组信息生成人脸图像

生物学家克雷格·文特尔（Craig Venter）是“人类长寿”公司（Human Longevity）的总裁，这家位于圣地亚哥的公司正在建造世界最大的基因组数据库。文特尔是个颇具叛逆色彩的人物。上世纪90年代后期，他宣称由公共资金支持的人类基因组测序国际合作项目使用的方法不对，并自行开发了一套更便宜快捷的方法。而他最新的搅局之作是从基因组数据预测一个人的长相。

人类长寿公司已为45,000个基因组测序，大部分来自参与临床试验的患者，同时也取得了相关的体貌特征数据。该公司用机器学习工具分析这些数据，然后预测基因序列与体貌特征的关联。研究工作取得了进展，公司已经能对未曾见过的人生成类似照片的肖像画。

基因预测图与实际人像

上月初，文特尔及其同事在《美国国家科学院院刊》（Proceedings of the National Academy of Sciences）上发表论文，描述了这个他们称之为“基于表型的基因组鉴别”的过程。研究人员为不同年龄、来自多个族群的1061人做了基因组测序。他们还拍摄了研究对象的脸部高清三维影像，并记录其眼睛和皮肤的颜色、年龄、身高和体重。这些信息被用作“训练集”，来开发一套能根据基因推断外貌的算法。

研究团队将此算法应用于未知基因组，所生成的人脸图像中，十张里有八张能与真人照片匹配。但当测试仅在单一种族中进行时，由于研究对象面部差异减小，准确率就不太出色了，十张图片中仅五张与真人相似。约一年前，该公司使用同一算法，通过基因组测出本文作者在20岁时的样子。所得人像图片与本人当年的照片并排比较，读者可自行判断两者是否足够相似。

批评者迅速在社交媒体上对研究成果提出了异议。人类长寿公司的前雇员杰森·派珀（Jason Piper）认为，“人们的容貌与所属种族的平均样貌接近，所以每个人都和预测出的样子差不多”。然而，对文特尔有利的一点是，这项成果仅仅是基于较小范围的人群得出的。对机器学习技术而言，数据集越大，结果就越准确，运用数以万计的基因组可以大大提高预测准确率。

根据基因组生成人脸图像有多种可能的用途，尤其是对于法医学。行凶者遗留的任何基因物质，如血液或体液，都可能用于重建其脸部形象。这能让警方“看到”谋杀、攻击及强奸案件中疑犯的面目。该技术也有助于识别因遭焚烧或肢解而无法辨认的受害人的身份。假如仍然可以获得合适的基因样本，悬案也许可以重新开案调查。

正如文特尔随即指出的，这种技术还有其他影响，包括对隐私的冲击。他认为，基因组信息如今必须被视为个人信息，即便它们是以匿名字母串的形式呈现——一些国家目前就采用这种形式。他警告，仅凭目前发布在网上的有限的个人基因信息，例如在DNA测试服务网站23andMe上公布的那些，便可能构建出其面容图像。

这继而又引发了另一种可能性，即人们可能不再愿意为公共基因测序项目提供自己的基因信息，尽管这类研究有助于对抗疾病。假如可以通过基因组推测容貌，那么一个人的外貌随后就可与网上的真人照片匹配。这可能意味着人们的基因序列及所有缺陷都可与其公开身份联系起来。

基因和面容之间的关联是双向的。正如基因组可被用作构建人脸图像，面部特征也能显露遗传疾病。据估计，30%至40％的遗传性疾病会导致脸部或头骨形状发生变化，在某些情况下，经验丰富的医生只需观察病人的面部便可诊断病情。那何不训练应用程序来完成这样的工作呢？

面诊师

已经有公司在这么做了。莫蒂·斯尼伯格（Moti Shniberg）和利奥尔·沃尔夫（Lior Wolf）在波士顿创立的创业公司FDNA开发了一款智能手机应用Face2Gene。斯尼伯格之前创建的公司被Facebook收购，专门开发照片标记功能，从上传到该社交网站的照片中识别出用户。FDNA的这款应用让医生拍下一张病人的照片，将照片连同病人的身高体重及临床数据传到网上，然后由该公司的算法根据在线数据库生成一份清单，列出病人可能患有的疾病。该应用可以访问一万种疾病的信息，其中能用人脸识别做出诊断的目前有2500种。

每个诊断都附有一个概率数字，表示该应用的预测正确率。程序还会列出已知可能导致该疾病的基因突变，帮助分析患者的病情。FDNA的首席执行官德克尔·季博曼（Dekel Gelbman）估计，130个国家的医生和研究人员正在使用该应用。患者的数据经匿名和加密处理，被安全地存储起来。

跟文特尔的研究一样，面部研究人员可用的数据量越大，其研究的价值就越大。牛津大学的克里斯托弗·奈拉科尔（Christoffer Nellaker）设立了名为“智慧女神与我” （Minerva & Me）的网站，健康人士或患者都可以上传自己的照片到该网站，并授权各项研究使用这些照片。他还设立了名为“智慧女神联盟”（Minerva Consortium）的社团网络，鼓励人工智能研究人员分享数据。

马里兰州贝塞斯达市（Bethesda）的美国国家人类基因组研究所（National Human Genome Research Institute）的马克西米兰·穆恩克（Maximilian Muenke）和华盛顿特区美国国家儿童健康系统（Children’s National Health System）的马吕斯·林古拉鲁（Marius Linguraru）及其同事们也在努力扩展这方面的研究。他们已发表一系列研究成果，运用以非洲、亚洲及拉美患者的照片训练出的人脸识别算法来辨别不同的遗传疾病，准确率超过90%。许多贫困国家没有昂贵的产前检查来筛查遗传疾病。比如，在欧洲和美国，患唐氏综合症的婴儿通常在产前就能筛查出来，但在贫困国家，许多唐氏婴儿在一岁前是无法诊断的。研究人员打算研发一款应用，帮助医生使用智能手机来识别数十种最常见的综合症。

人脸识别-产业复合体

人脸识别技术性能不断提高，价格持续降低，应用范围渐广

在旷视科技的北京总部里参观，仿佛身处“老大哥”的中央控制室。公司大堂中的摄像头瞬间就能辨认出访客，办公楼里其他各处也安装了类似的设备。这些摄像头捕获的一些图像显示在一面叫“天网”的视频墙上（得名于电影《终结者》中的人工智能系统）。在其中一幅图像上，一群员工在电梯门外等候，每个人的面孔都由一个白色方框围住，旁边打出这个人的名字。当被问道这样的设置会不会有些奥威尔小说的意味时，这家创业公司的CEO印奇只回了一句，“这能帮着抓坏人。”

就算印奇会想要仔细思索这一技术有何意味，恐怕也没那个时间。用他的话来说，旷视如今正忙于打造一个视觉计算的“大脑”。该公司于2011年创立（其名字“Megvii”是“mega vision”即“巨大的视野”的缩写），至今已取得长足的发展。全球超过30万家公司和个人使用该公司研发的名为“Face++”的人脸识别技术，Face++因而成为这类服务中的领头羊之一。去年12月，旷视科技融资一亿美元，估值达到近20亿美元，在或可称之为“人脸识别-产业复合体”的队伍中成为全球第一家“独角兽”公司。

这一领域的供应商出售用来识别人脸的硬件及软件工具，再将识别出的人脸与其他有用的数据关联起来。这个市场相当小，最乐观的估计也只不过几十亿美元，不过该技术已开始向更广泛的商业领域渗透。这背后的主要原因是人脸识别的精确度正在快速提升，因而走上了和语音识别相同的发展轨迹——后者正是在精确度突破了最后几个百分点、几乎达到100%之时，真正实现了腾飞。知名人工智能研究者吴恩达针对语音识别这样说过：“大多数人都低估了精确度达到95%和达到99%之间的差别。达到99%，游戏规则就变了。”

再者，智能手机也会为人脸识别的发展发挥作用，就如同亚马逊的智能音箱Echo为语音识别所起的作用——让这项技术为消费者所接受。在中国，已有数百万人在智能手机上“刷脸”来授权支付。苹果于9月12日发布的新款iPhone附带能够准确识别机主面孔来解锁手机的功能，即使在黑暗中也能操作。仅几周前三星推出的新款盖乐世Note也有类似的功能，但没有苹果的那么复杂。

将人脸识别技术分为两类是说得通的：一类是底层功能，另一类是利用此功能的各种应用。旷视科技的Face++属于第一类，同属这一类的还有另一家中国创业公司商汤科技、俄罗斯公司NTechLab、亚马逊、IBM和微软提供的类似服务。这些公司提供的人脸识别功能都属于云计算服务。旷视的客户可以上传一批照片和人名来训练算法，之后算法就可以识别出这一批人。企业也可以将人脸识别功能与自己提供的服务结合起来，例如管控对网上账户的访问。

旷视和商汤的服务大体上是建立在良好的数据之上。在中国，居民到16岁会办理一张带照片的身份证件，旷视和商汤能够访问包含七亿人身份照片的政府数据库。各个政府部门也是有价值的客户——全国有数亿个监控摄像头，其中能识别人脸的摄像头将会越来越多。在深圳，这一技术被用于识别乱穿马路的行人，这些人的名字和照片会显示在一个屏幕上。在北京，市政部门已开始采用该技术来识别在公共卫生间偷拿厕纸的人（该系统还会防止人们在九分钟之内拿取的卫生纸超过60厘米）。

商业应用（通常是在其中一家云计算服务的推动下）普及的脚步还要更快。9月1日，与阿里巴巴有关联的蚂蚁金服首次在杭州一家实体店中安装了“微笑支付”系统：在肯德基的绿色健康餐厅KPRO，消费者只需注视一个屏幕就能付账（见图）。连锁便利店小麦也表示将会在顾客进店时扫描他们的脸，为的是研究他们的行为。几家中国的银行如今让用户能在使用ATM机时刷脸证明身份。

西方国家远远落在了后面。一些行业早就采用了一种比较基础的人脸识别技术，比如赌场希望以此将声名不佳的赌客拒之门外。不过使用这项技术的主要是大型互联网公司——虽然不无谨慎。Facebook在这方面走得最远，它让用户在照片上标识出朋友，这样公司的算法就可以在其他照片上将这些人识别出来。谷歌运用这项技术，将用户上传至其图片服务器上的照片分组。亚马逊的新款家用音箱Echo Look还有一个摄像头，很可能会用来做人脸识别。

其他的公司正在试水。捷蓝航空（JetBlue）和其他一些美国航空公司已采取初步行动，将旅客的脸和护照照片作比对，目标是取消登机牌。除劳埃德银行（Lloyds Bank）之外，其他西方银行也计划效仿中国的银行，让客户能够刷脸登录账户。在印度，网约车公司优步的一个系统要求司机在倒班上岗之前先自拍一张照片，此举应该可以减少未注册司机冒充注册司机的情况。芯片制造商英伟达计划在位于加州的新总部引入人脸识别系统。

能够帮助提高销售额的产品也很有前景。例如，摄像头可能会识别出值得给予特殊待遇的忠实顾客和VIP会员，也许还会探测到购物者不满的神色，然后派员工上前服务。世界最大的零售商沃尔玛据说正在开发一个人脸识别系统以改善客户服务。

随着这些服务日渐推广，人们已开始想方设法对抗它们，这或许也是意料之中的事。以色列创业公司D-ID（公司名意为“de-identification”，即“去身份识别”）开发了一种软件，可轻微修改照片，使之无法被算法识别。如此一来，人们在分享带有自己脸部的照片时就不用担心照片会被用于识别自己的身份。其他人想出了一些技术含量较低的办法来防御高明的监控系统，例如戴上那种镜框上有令人眩晕的图案的眼镜，或者干脆戴面具或化妆。

然而，这类行话称之为“敌手攻击”的举动不大可能会阻止人脸识别技术被广泛应用。旷视的印奇预计这项技术将会成为一种日常商品，因此他已定下了更高的目标。眼下他正引领公司的计算机视觉“大脑”去攻克更加复杂的任务，例如解读人类的行为和辨认物品。

印奇的长远规划是让公司成为一家“算法工厂”，为计算机视觉服务提供各种模块化产品，其他公司可对这些产品加以组合再组合，以开发出越来越高级的服务。不管旷视科技的这个宏图大志能否实现，它出售的那些技术都将广泛传播。

评论

最新评论