“Boss直聘引发的血案”后思考，AI技术能让招聘这事变得更好吗？-虎嗅网

文／王向导（仟寻招聘创始人）

最近，Boss直聘因为求职少年李文星之死被媒体吵得沸沸扬扬，前者被指责在账号和职位发布环节上审核不严。那么，Boss直聘真的审核不严吗？作为同业的笔者早年间有尝试过他们的产品，很快就被封号了，所以其实他们还是审核的很严的:)

因为自己在招聘这个行业中创业，所以也特别关注各种新的模式。Boss直聘在起步的时候，通过大胆启用大胸美女，在望京吸引了好一波程序员，做了一个非常巧妙的冷启动，形式也是比较奇特新颖的，这点值得创业公司学习。

Boss直聘，顾名思义，产品设计的初衷是希望候选人可以和Boss单聊的，可是一般超过15个人的公司就会设有专职HR岗位，所以也许那一头和你聊天已经不是Boss而是HR。最有意思的是，大家就算在这类应用上认识了，还会马上希望去加对方的微信，随后这种招聘行为便转移到了微信上面。

因此笔者认为这种模式本质上还是一个找工作的平台，变现模式也并无特别之处，只是形式上稍作了一些改变。不过，在这个野蛮生长的年代，Boss直聘比起传统招聘网站已经算是给整个行业带来了一股新风。

那么另一个问题也就来了，在HR这个领域，单单模式上的创新就足以颠覆行业了嘛？

显然是不够的。经过了很长时间的思考，笔者认为，随着AI及相关新技术的高速发展，HR领域也必将是另一个受益于人工智能逐渐成熟的行业。

近来，我也看到不少HR公司有跟风之势开始大谈AI，试图通过这些新词汇给自己造噱头，就像当年谈什么HR大数据之类的，愿望是非常好的。

不过，我们还是先来看看脚下的现实。目前招聘领域的技术新进展主要集中在以下三个方向，分别试图解决三类问题：

第一种方向是对现有人才库的盘活，包括自动更新企业人才库，并基于新职位做库内最佳候选人的推荐。这试图解决的是人才库浪费，就是那些所谓把“人才鱼塘”重新激活的问题。

第二种方向是自动化人才甄选，包括自动化笔试、面试以及基于聊天机器人的甄选工具。这试图解决的是人才甄选的效率问题。

第三种方向是激活被动求职者，包括基于社交网络、UGC内容、ChatBot和匹配算法的综合应用。这试图解决的是影响并转化被动求职者的问题。

下面我们逐一看一看这三种方向所涉及的新技术和其应用的现状。

一、人才库盘活

人才库盘活是近年来的一个活跃话题。这个方向上的应用，其最终理想的场景是，当HR向外部发布职位的时候，系统可以自动提示她，企业自有人才库里面已经有这n个候选人，满足以下两个条件：

1）候选学历、技能和经验与JD要求高度匹配
2）候选人在最近于招聘网站更新过简历

如此一来这位HR可以直接从这n个整整齐齐排序的自有候选人中依次查看联络，而不需要再依赖一般来说需要付费的外界渠道。对于职位和候选人数量庞大的大型雇主来说，这个理想场景，如果能够实现，那是非常具有吸引力的。因此不论是在硅谷还是国内，都有一些公司尝试这个方向上的产品研发。但是，如上文所述，这个理想场景需要基于两个前提：

1）基于JD和简历的文本匹配技术是否能够达到有效甄选的水平（比如讲误杀的候选人数量是否比成功匹配的候选人数量多得多）
2）候选人的简历数据作为匹配的主要输入，是否能保持充分地更新度

第一点是说，基于文本（简历和JD）的匹配技术（主要基于是自然语言处理NLP的算法）在充分的数据量（简历和JD）和人工干预（训练集）下，是否能使得系统（机器学习过程）输出近似于人类选择的结果。这种结果的近似度，就是衡量所谓AI的效度。

那么这种近似度怎么衡量呢？一种简单的方式，就是针对同一个职位和对同一批简历，同时请系统和本公司的一个HR委员会进行筛选排序，然后对比两者的结果。

举例来说，假设总共1000份简历，HR和系统都选择了其中的50份，那么这50份里面有多少是重合的？这个重合度就是机器判断的效果的一个主要衡量。如果重合的有45个，那么就是极为有效，近似自然误差；但是如果重合的只有10个，甚至个别，那么这个系统就基本无效，因为他误杀的简历比他推荐的多得多。

这里的挑战就是，我们不知道基于雇主有限的简历和JD语料，匹配有效性的极限是多少。比如说投递给各个岗位的，合格和不合格的50万份简历，能否构成一个足够有效的语料库？同时，雇主能够承担多大成本的人工标签工作？在现实的条件下，这些有限的语料和人工投入是否能够导出一个有效的AI推荐系统？

笔者带着同一个问题询问过Recruit研究院的CEO Alon Halevy教授，也请教过欧美市场最大的求职网站Indeed.com的总裁Chris Hyams，这两家机构拥有世界上最大数量的JD和简历数据，他们一方面对人工智能的在HR领域的应用保佑希望和期待也在践行，另一方便也保留一个成熟而且务实的观点。他们的回答都是有所保留的。他们有提到以下几点：

第一，目前的AI匹配技术仅仅在少数一些职位上达成足够高的可用性，比如说卡车司机。（卡车司机在美国是一个庞大群体，且其能力和要求较容易被模型化。）

第二，他们对AI匹配技术的预期是从1000份简历中剔除800份，而不是选出50份。选出50份的方式，主要还是靠更精细的关键词组合搜索。

第三，即使无限的机器学习过程使得某一家雇主的某一批职位能够逼近有效的机器筛选，这种筛选算法也无法在不经过新的训练过程的情况下，简单地推广到其他职位，更不要说其它雇主（原因之一是，同一个JD，不同的雇主其实要求是不同的，招聘需求有很多文本之外的“潜规则“）；所以跨公司的，平台性质的普适匹配算法在可预见的未来是不现实的。

综上，人才和机会的AI匹配显然具有巨大的潜力和价值，但其最终的商用，也面临技术上的巨大挑战。笔者有点出乎意料得发现，即使是世界上最领先的招聘技术公司目前都无法确定这条道路如何才能抵达彼岸。仟寻MoSeeker实际上也正在积极与Recruit研究院以及Indeed.com的产品和研发团队合作，希望能够在有限的应用场景下先实现业务上的闭环，再逐步扩展开来。

除了匹配的效度以外，人才库盘活的第二个前提是候选人在各处的简历是否能够在库中保持更新。原因是显而易见的：不更新的简历不是一个可靠的匹配算法输入源，不能有效反应求职者的当前意愿。

笔者和Recruit Institute of Technology CEO Alon Halvey博士、前Google Data Research负责人以及仟寻联合创始人戴顺在位于硅谷山景城的RIT办公室

这一点也有实现上的难度。这里的难度倒不在技术上，而在法律法规上。

中国候选人更新简历的地方主要是在前程无忧、智联招聘和猎聘等求职网站上。而这些网站并不对外开放其简历数据库，且明确规定了获取其数据的合法方式。这意味着目前市面上所有的所谓“跨平台一键简历检索(Sourcing)”和“企业人才库简历自动更新”由于招聘网站的频繁反爬升级，经常出现各种体验糟糕的“服务故障”。

笔者和数个三大招聘网站的高级管理层曾经也有过关于这种生意模式的深入探讨，他们认为这种方法实际上从商业模式的本质上来说是属于“见不得光的生意”，不可持续，对于雇主来说账号的安全也存在很大的风险，因为雇主一旦在第三方的网站上面提供了用户名和密码信息等，是否被明文存贮都是未知的。

举一个实际的例子，这类网站经常会把用户的账号来拿在非工作时间、比如深夜2点开始爬取求职网站的数据库，一旦被扫描侦测到也会对雇主的账号进行封禁。

这就引出了另一个话题：笔者从多家使用过该类功能的雇主了解到，由于三天两头出各种问题，有的老板觉得好，但是干活的Recruiter（招聘专员）基本不愿意用，导致买了一年的服务往往过了没几天就束之高阁，也没有人再愿意用了；另一方面这些功能都是基于一个有明显法律瑕疵的数据获取方式，很多公司都要偷偷地避开合规部门的过问和审核。

但是，数据获取问题其实还不是最主要的法律问题。有一个更要命的问题，就是我国在个人信息保护方面的立法。这包括即将颁布的《个人信息保护法》，以及今年6月1日刚刚生效的两高《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》。《解释》中明确了：

第一条：刑法第二百五十三条之一规定的“公民个人信息”，是指以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息，包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等。

第三条：未经被收集者同意，将合法收集的公民个人信息向他人提供的，属于刑法第二百五十三条之一规定的“提供公民个人信息”。

第四条：违反国家有关规定，通过购买、收受、交换等方式获取公民个人信息，或者在履行职责、提供服务过程中收集公民个人信息的，属于刑法第二百五十三条之一第三款规定的“以其他方法非法获取公民个人信息”。

简单来讲，公民同意用户协议并将个人隐私信息授权给招聘网站是符合法律的；但是公民并没有授权一家雇主，使用某种软件工具，去采集、保存、分析他储存在招聘网站上的个人隐私数据（包括住址、联系方式、履历等，而且候选人实际上原先可以对指定的公司不显示更新以保护自己的隐私意图）。

简历到底是否属于刑法中定义的“公民个人信息”呢？答案是明确而且肯定的。去年发生过一起案件，智联招聘的两位前员工和他们的一位客户的人事经理（注意，这是一位人事经理！）非正常途径获取智联招聘数据库中的15万条简历信息进行倒买倒卖，智联前员工连同这位人事经理一起被判处3年6个月至1年6个月的有期徒刑。【1】

无独有偶，美国实际上在保护公民隐私的立法上也相当严格，美国招聘行业新秀TalentBin，也因为爬取数据并且出售给客户最终被告上法庭，法院最终作出裁决需要网站对未经授权并使用其信息的候选人进行赔偿。【2】

综上所述，因为职位描述(JD)/简历(CV)匹配技术的不成熟，以及更重要的，法律法规上的红线，“人才鱼塘盘活”目前看来似乎还是一个现实中荆棘遍布的良好愿望，当法规越来越明确，HR在使用这类产品的时候也会越来越谨慎。

二、自动化测评

典型的自动化测评主要包括基于文本的自然语言处理（NLP）和基于人脸识别的视频面试技术。

基于NLP的测评又分为两种类型，包括开放性问题的文本回答，以及基于ChatBot（聊天机器人）对话的测评；机器则试图通过其文本回答中的语素分析来建模并且预测候选人的性格特征。而基于人脸识别的视频面试技术，分析视频面试时的语言表达、声调、表情和其他非语言因素，并进行建模且试图预测。这些甄选方式最主要的卖点是效率。即快速从大量面试者中挑选出值得下一轮人工面试的少部分候选人。

但是这些测评方式的效果（效度）如何，即这些测评工具的结果是否靠谱，目前还没明确的证据和结论。

有关这个话题，我们可以先看看全世界最大的数据公司Google是如何探索、并且得到了什么样的发现。

几年前，我们做了一项研究来验证是否在Google的每个招聘人员都特别擅长招聘。为此我们观察了成千上万的面试和几百个面试官，包括他们对候选人评分，也包括候选人最后在工作中的表现。我们的发现是：这些变量中间没有丝毫联系。总体上来说是随机的，只除了一个例外：有一个面试官的评价是特别准确的，因为他负责一个非常专精的领域，而他本人恰巧是这个领域全球领先的专家…

对于招聘过程而言，我们发现智力测试（Quiz）完全是浪费时间。一架飞机里能塞满多少高尔夫球？在曼哈顿有多少加油站？完全在浪费时间。这些题目不会帮助预见任何事。它们的功能主要是让面试显得“聪明“。

反而，最靠谱的还是结构化行为面试，在这类面试中有一系列连续的怎样评价候选人的指标，而不是仅让每个面试官自由发挥。

行为面试的作用还在于——你给候选人的不是一个假设性的问题，而是一个实际问题，比如说“告诉我你的一次解决分析性难题的经历“。行为化面试的有趣之处在于当你让别人讲述自身经历时，当你反复询问时，你会得到两方面的信息。一个是你将看到候选人是怎么应对现实世界的处境，另一个你会得到的珍贵的”元信息“（Meta Information）是对候选人来说什么是困难的。【3】

Google曾经因只雇佣30岁以下的候选人而闻名，使用智力测试来识别顶尖编程人才，信赖学术资格证书，尤其青睐有名校背景的候选人。

而现在已经不再是这样：

通过数据挖掘，我们发现的一件事是G.P.A.是一项无效的招聘指标，测试分数也是无效的——除非候选人是刚毕业的新人，那么会有一点点联系。众人所知，Google过去会询问每个候选人的G.P.A.和测试成绩，但是现在我们不会再这样，除非候选人刚毕业不久。我们发现成绩单没有预测性。

有趣的是在Google公司没有接受过大学教育的员工比例也在逐年上升。我们有14%的团队成员没有上过大学……学术环境是人为的。在此环境中取得成功的人多少经受过相应的训练，他们能适应这种环境并取得成功。在本科及研究生时期，我的一个困惑是你知道教授在寻找一个特定的答案。你能明白这些，但更有意义的是解决一个没有明显答案的问题。你需要乐于解决没有明显答案的问题的员工。

那么在Google里是怎样运用著名的数据分析法来进行招聘的呢？如你所期待的、具有条理性。以下是来自杂志《Atlantic》的一则故事：

在2006年的夏天，Todd Carlisle，一个拥有组织心理学博士学位的Google分析师，设计了一份300题的问卷让每个员工填写……一些问题是封闭性问题：你曾经创造过世界纪录吗？一些则要求员给自己打分：请给自己的工作风格偏好打分，独立工作型（1分）还是团队工作型（5分）。还有一些很琐碎的问题：你养了什么类型的宠物？

Carlisle处理这些数据并将其与员工表现评估比较。他尝试寻找其间的规律联系来解答是什么特质造就了优秀的Google员工。这和另一个让人力运营部高级副总裁Laszlo Bock感兴趣的问题有异曲同工之妙: 什么特性能帮助预测候选人是否会成为优秀雇员？

Google根本上尝试将Google搜索的要求运用到人力资源过程中：它需要一套能在成千上万候选人中过滤筛选的搜索算法——Google的员工录用率约为0.2%，是哈佛大学录取率的1/25——拒绝掉一批顶尖的候选人。但在大量问答题及数据处理后，我们发现最好的表现预测因素不是G.P.A.，或宠物类型，或针对某问题的答案，“钟表的指针一天会重合多少次？”唯一的最佳预测因素是：根本不存在（Absolutely nothing）。

这个Absolutely nothing的回答让我们看到，至少在Google的案例上，通过采集甄选环节的各变量进行建模，以预测候选人表现的努力是失败的；也就是说仅仅依靠笔试/面试中各种量化指标，还不足以对候选人甄选做出有效的判断。Google前人力运营高级副总裁Laszlo Bock继而说道：

… 我认为大数据在人才甄选上的价值有一个限度，因为它总是需要人类判断的元素。我不认为我们最终会取代人类判断、人类灵感和创意，因为，归根结底，你还是要问这样的问题：OK。系统这样告诉我们，但是这真的是我们想要做的吗？这个系统的结论是正确的吗？【4】

回到我们自动化测评的话题。如果Google经过一个庞大内部研究最后的结论是，大数在人才甄选上的价值仍旧有限，那么目前市场上的这些层出不穷的“AI黑科技”，比方说基于自然语言处理的甄选方式（比方说，通过判断候选人的写作或是语音回答中的用词和语调是否“正面积极”来判断其个性，继而预测其工作表现）或是基于人脸识别的方式（比如说，分析面部微表情和眼神反应，继而somehow预测其工作表现）是否真的能够以“一招鲜”的方式，完全取代人类判断呢？真心但愿如此，但我想我们还需要更多的证据。

实际上，一家在HR科技上非常勇于创新的全球性雇主，今年正在采用一种魔术般的基于表情捕捉的视频面试工具进行校招的初筛。但是很有趣的是，在进行这种AI筛选之前，这家雇主实际上决定把第一轮的简历投递全部交由仟寻MoSeeker平台完成，并在仟寻平台上从数万份申请中人工筛选一小部分，再交给这个按件收费的视频面试工具做它的魔术AI工作，以免浪费金钱。看来我们睿智的HR，还是相信人类智慧多一些呀！

在最近“奇点临近” 、“机器取代人类”、“AI带来失业”之类的论调下，或许这倒是一个好消息。也许“AI黑科技”能够逐步辅助HR们的日常工作，但是还是有一些关键的工作，在短期内似乎很难被机器所取代。在新技术的应用上，我们一方面相信技术并为新技术所带来的愿景所欢欣鼓舞，另一方面，我们关注商业应用的实际结果，并基于结果不断进行Reality Check，小步快跑，迅速调整，坚持不懈。

三、被动求职者激活

第三种方向是对被动求职者的激活。

根据LinkedIn和中华英才的数据，在中国，80%的候选人是被动求职者。也就是说，会主动发起一个求职行为的候选人，只占到所有候选人中的20%。同时，这20%也往往是价值相对较低，职场经历相对较少的人群。

中国的招聘市场每年大约有1000亿人民币的规模。但是所有线上招聘提供商一年的收入加在一起只有50亿，只占到整个市场的5%。另外95%的交易都发生在各种线下渠道。也就是说，20%的被动求职者（会上各种招聘网站的用户）只能贡献5%的市场价值。同时雇主也不断抱怨招聘网站的效果越来越糟糕。

LinkedIn之所以能够以262亿美元的价格被微软收购（几乎十倍于在纽交所上市的中国最大的招聘网站前程无忧），是因为在全球的很多地区，LinkedIn把被动求职者一网打尽。

在美国，每三个人中就有一个是LinkedIn的用户，也就是说除了家庭主妇、学生儿童、退休人士以外，几乎所有职场人都可以在LinkedIn上被找到。这使得原本的分散在各猎头公司数据库里的庞大匿名求职者群体变得触手可及。

LinkedIn在北美和欧洲给企业带来的价值是——通过我你能找到几乎所有人。那么这些人来不来你们公司应聘，就是你雇主吸引力的问题了，所以LinkedIn另一个强调的点就是对你的目标群体加强雇主品牌宣贯。

有意思的是，中国由于其国情，有一个国人自己的互联网生态。纵然LinkedIn是少数几家在中国运营的世界十大网站，LinkedIn在中国也不能算是成功的。LinkedIn在中国仍旧主要是外企员工会使用的平台，即便使用，活跃度和LinkedIn在美国也不可同日而语。这里面有很多原因使然，其中几个主要原因或许是：

1）中国人的实用主义民族习惯：相比从小受到《圣经》熏陶，倾向于相信“神造万物，各按其时成为美好”的西方人，中国人不太在意每一样工具被创造出来时候的目的是什么。相比工具主义理念盛行的西方人自动地用Facebook去联络熟人朋友，用Twitter转发新闻，用Instagram拍照上传，WhatsApp进行即时通讯，用LinkedIn管理职场关系；实用主义思维下的中国人倾向于，如果一个工具能解决所有问题，那就都用它得了。因此，中国的社交媒体基本上就是一个词：微信。加LinkedIn没有问题，但是最好加了LinkedIn之后再加一下微信：咱们微信上聊。

2）中国人对陌生人社交的天然不感冒。对于在海外生活过，或是偶尔走出国门瞧瞧的朋友们来说，一个感受就是中国陌生人之间的信任成本非常高。因而在美国，将履历向大众公开，并和陌生人通过LinkedIn建立有效联系，一起出去喝一杯，是一件挺自然的事情；但是在中国，这就比较不寻常，比较不习惯。笔者认为这也是为何LinkedIn在中国没有发展那么迅速的原因之一。在中国，成功的陌生人社交，好像只有荷尔蒙社交。

因此LinkedIn在中国似乎总是处于一个叫好不叫座的情况。LinkedIn据称在中国有千家客户，根据HREC智享会在2016年的调研报告，其中似乎只有10%的客户会检测其使用效果，而剩下的90%，主要是把LinkedIn作为一个新的渠道进行没有明确预期的尝试。

话题收回来。因为中国不存在一个连接广大被动求职者群体的平台，（或者说这个平台实际上就是微信：根据企鹅智库的数据报告，平均来说，实际上微信朋友关系中超过60%的每月新增朋友都是泛职场关系；换句话说，你的老朋友和老同学不会每月再增加，增加的一般都是工作相关的关系。微信已经越来越成为一个职业社交工具，而不再是纯粹的熟人社交工具）导致这个品类在中国实际上是一个空白，也导致雇主不得不仍旧往往依赖于第三方猎头机构才能有效触达大量较为资深的专业人士。

有没有什么办法可以让这些被动求职者聚集到一处，并且不断主动访问呢？

这是我一直以外试图解决的问题。这个问题牵涉到社交网络、推荐算法、内容制造、ChatBot技术等一系列技术的综合运用。对被动求职者的触达和激活，意味着技术不再是仅仅去匹配一小部分的主动求职者，而是帮助雇主把视野扩大到全体人民的范围。

【1】   智联招聘卖简历案终审主管获刑三年半，新浪财经 http://finance.sina.com.cn/chanjing/gsnews/2017-07-12/doc-ifyhweua4920510.shtml
【2】   （https://topclassactions.com/lawsuit-settlements/closed-settlements/485608-talentbin-candidate-profile-class-action-settlement/）
【3】   “In Head-Hunting, Big Data May Not Be Such a Big Deal,” by Adam Bryant, New York Times, June 19, 2013. http://www.nytimes.com/2013/06/20/business/in-head-hunting-big-data-may-not-be-such-a-big-deal.html
【4】   “The Science of Smart Hiring,” by Derek Thompson, The Atlantic, April 10, 2016: http://www.theatlantic.com/business/archive/2016/04/the-science-of-smart-hiring/477561/

笔者系仟寻MoSeeker创始人兼CEO、长江商学院EMBA、中欧创业营5期、腾讯青腾大学2期学员。关于招聘这个行业，大家可以通过 dow@moseeker.com 或者关注微信公众账号“仟寻招聘”与笔者取得联系。