把共和党当纳粹?谷歌的算法也会有疏漏
2018-06-11 13:09

把共和党当纳粹?谷歌的算法也会有疏漏

虎嗅注:算法可以代替人工吗?在敏感信息上,算法还是不如人工筛选稳妥。由于搜索机制问题,谷歌将纳粹信息放到了不恰当位置,导致了一起乌龙事件,甚至可能演变成一场政治风波......


本文来自微信公号“硅谷密探”(guigudiyixian),作者:硅谷密探,原标题:把共和党当纳粹?谷歌:这个锅我们不背!虎嗅获授权发表。


这两周硅谷最不受人待见奖估计要颁给谷歌了。上周早些时候,如果使用谷歌搜索 "California Republican Party" (加州共和党),跳出来的搜寻结果在思想倾向一栏的第一位赫然写着 “纳粹主义”。


图片来自网络,版权属于作者


对,你没看错,就是在谷歌搜索结果的首页右侧的“知识栏”(Google’s Knowledge Graph),美国共和党被冠上了“纳粹思想倾向”的帽子。这一下就惹毛了美国共和党的7000多万选民。


本周还要颁出的“最佳冤大头”奖,也花落谷歌。


图片来自网络,版权属于作者


谷歌:我比窦娥还冤呀! 这是有人在维基百科捣的鬼!我们不过是把维基百科的信息呈献给大家。我们也是受害者!


谷歌立即删除了网站上相关不实内容。


然而,一波未平一波又起,随后,谷歌又被爆出在其搜索页面发现了一张被恶搞的照片。照片中,加州共和党参议员、川普支持者Trudy Wade的头像下方被加入了红色粗体字BIGOT(“一家之长”)字样。




这到底是怎么一回事?难道真的是谷歌自己的搜索算法失灵?还是其中另有阴谋?美国加州大选正热火朝天地进行,谷歌给共和党闹的各种幺蛾子到底缘何?咱们今天就去探探究竟!


故事的来龙去脉


在谷歌搜索把共和党标注了“纳粹主义”后,美国共和党人不淡定了!


谷歌你这么做实在“太丢脸”了!加州共和党党魁Kevin MaCarthy 首先跳出来。




紧接着川普总统的儿子发推特谴责谷歌歧视保守派,比Instagram还不要脸!据说当年Instagram给太子爷的照片加了个“此人有害,可能致死”的标签。一直怀恨在心的小唐纳德这下终于可以一石二鸟把俩公司都给怼了!


(川普儿子:停止歧视保守派!)


谷歌赶紧回应Kevin MaCarthy的推特,表示自己真是冤啊!我们网站顶多是抓取了维基百科的条目信息!是有人在维基百科上故意做了手脚,导致我们即时获取的信息出现了“纳粹”的字样。


那么谷歌到底是在哪个环节出了差错呢?


我们都知道谷歌的搜索机制分三步。第一步,抓取其他网站的信息。第二步,谷歌内部检查机制快速检查内容。第三步,利用谷歌自己的算法,把最为相关的信息展现给使用者。


而此次问题的关键所在,就是谷歌搜索第二步检查机制的疏漏。


谷歌回应,谷歌在整个事件中对于网站信息并没有任何手动更改。这是一起“借刀杀人”事件 —有人蓄意破坏维基百科内容从而导致谷歌搜索结果出问题。


但谷歌也有错。由于谷歌系统中错误检测机制的疏漏,没有及时报告并删除错误信息。


(谷歌:我们没有人为改内容,是错误检测机制出了错。这种情况只是偶尔发生。)


而同时,维基百科与维基百科基金会( Wikimedia Foundation )也在谷歌发声后,回复:


“虽然维基百科上大多数的内容是详实的,但是也有一些不够准确。有时候,一些信息或者已经过时,或者没有来源,当然人为蓄意恶搞也是有的。这就是为什么我们总是鼓励用户随时去检查我们的引用链接。”


为何谷歌要抓取维基?为何要将结果显示在页面上最突出的位置?这就要从谷歌的发家史说起了。


小探曾采访过Wikipedia的创始人之一Larry Sanger(回看密探独家采访文章《创立了维基百科的人,竟然要维基百科?》)。Larry讲述了维基百科刚成立不久,在同一时间兴起的谷歌就开始“勾搭”维基了。


图片来自网络,版权属于作者


当时谷歌在搭建自己的搜索引擎时,常常直接把维基百科的词条信息用于自己的内容中,并附上链接。当时谷歌有专门负责“跟踪”维基平台的工作人员,每天都会把维基的文章更新到谷歌自己的系统中。据 Larry 回忆,当年这段谷歌抓取维基百科信息的故事曾传为笑谈。


“很多人都说是维基百科造就了谷歌”,作为创始人之一的Larry如是说到。


谷歌吃水不忘挖井人,它也为维基百科的发展助了一臂之力。


从2015年起,谷歌将自身的搜索算法更新,将维基百科信息的排名前置。这导致了两个结果:首先,维基百科的地位被提高;其次,其他网站想要被前置也要学维基百科的信息呈现模式。


维基百科的另一位创始人Jimmy Wales 曾提到,平均每年,维基百科60-70% 的信息流量(traffic)来自谷歌。维基百科一直都是谷歌搜索结果的前三名,并且通常都是首位。搜索结果首位就意味着会有36.4%的点击量,而前三则会有58.4%的点击量。


可以说,维基百科也会受益于谷歌的“抓取”。并且,虽然维基百科是非营利性质的,但是谷歌公司,以及其两位创始人,每年都会向维基百科基金捐助数百万美金来支持其运转。


但事实上,二者合作的真正赢家还是谷歌。大家看到的谷歌搜索结果页面右侧的“知识栏”,实际上就是谷歌获得广告收益的渠道之一。




这个占据了20%页面内容的大“豆腐块”,通常来自维基百科的内容抓取。但实际上其潜在价值要超乎你的想象。


据小探的一位在谷歌做广告销售的朋友透露,一般来说,当你点击进入一个普通商业词条时,谷歌通常会有5 - 20美金(约合人民币30 ~120多元)的收益;而当你每点击一次律师事物所词条时,谷歌则会收到来自合作方高达100美金(约合人民币600多元)的收益!


而很多时候,用户都是误打误撞从右侧的“知识栏”点击进入了一些商业用途的网站。


可以说,谷歌与维基百科已经成为了“形影不离”的好朋友。


维基百科自诞生以来就是以内容“人人可改”而受广大用户欢迎。但是,改是改得容易,改得对不对可就不能保证了。由于维基百科是非营利项目,没有官方审查人员,审核、编辑等工作靠的都是志愿者们。因此,出现错误也很常见。这也是为什么维基百科在回应此次谷歌“纳粹门”事件时所说的那样 - 没办法呀。


还有媒体表示,维基百科的公信力实际上是被谷歌高估了。维基百科实际上就是一个社区论坛网站(Community Conversation),很多内容的确切性有待商榷。


比如,如果你在谷歌上搜索关于心脏病的信息,谷歌不会引导你去关注美国心脏协会(American Heart Association)的医学内容,而会让你先看到维基百科上的信息。一旦维基百科上有不确切内容时,这对一个病人的负面影响是难以估计的。


而此次“纳粹门”事件中,恶搞者正是发现了维基百科的这条软肋,以及谷歌错误检测机制不完备的这个漏洞,从而得以成功下手。


屋漏偏逢连夜雨


对于此次信息错误,维基百科还表示:“感恩错误,因为这给我们一个可以更正事实的机会!”


估计谷歌就没那么感恩这次错误了,因为人家接下来又犯了一个类似的错误。


谷歌搜索结果中,共和党参议员Trudy Wade的照片中被加入了红色粗体字BIGOT(“一家之长”)字样。这再一次激怒了共和党民众。


这一次,谷歌的解释还是:此时真的跟我们无关!这张图片源自一个学生的博客,但是上传人的信息未知。


随后,谷歌立即删除了此图片。


(谷歌:我们道歉,但是图真的不是我们改的。不知道哪个人把一张学生博客里的图片放了进来。)


同时,谷歌希望大家都能够通过谷歌官方验证身份后再上传图片,从而避免此类事件的再次发生。


(谷歌:请先验明正身再上传图片)


但是,小探好奇,这类事件真的可以避免吗?为此,小探采访了一位搜索引擎方面的工程师老S。


根据老S的理解,谷歌在两次事件中,并没有技术层面的错误。虽然在第一次Bug中,谷歌表示自己的错误检测机制出现了问题。但是,就目前的技术水平来看,想要做到机器识别所有恶意、不正确信息,根本不太可能。这是因为,谷歌在抓取维基百科的信息时,要随时抓随时用,目前还没有一种算法能够即时识别不正确信息并提醒管理员更正。


目前,很多错误检测机制还需要人工的辅助。换句话说,人工举报是最好的避免犯错的方法


那就靠人力呗?小探表示好奇。


“除非能雇佣200万个人来每天逐一检查”,老S一脸无奈地表示。


这样看来,谷歌真是冤啊!


不过,谷歌搜索引擎出的bug真不是第一次了。大约十年前,2009年1月31日晚上,谷歌搜索的搜索引擎的结果全部出现一条警告语。“该网站可能含有恶意软件,有可能会危害您的电脑”(This site may harm your computer)。其间,Google的网站管理员中心无法访问,并显示“服务器故障”(Server Error)。整个系统故障持续了40多分钟。


图片来自网络,版权属于作者


之后,谷歌在官方博客中证实,这是一次人为失误。谷歌当时一直在和一家非营利组织StopBadware.org合作。这个组织会对各个网址进行是否存在恶意软件的信息标注,并制成一份“恶意网站”名单。由于这个名单是人工审核并添加的,而员工不小心把名单上的恶意网站多添加了一个地址“/”,从而导致所有包含“/”的网址皆被认为包含可能伤害计算机的软件。


看来,谷歌你以后只能自求多福了!


真相真的只有一个?


虽然谷歌已经多次道歉并删除了不实信息内容及图片,但是共和党人们对于谷歌依旧不依不饶。


最主要的一点原因就是目前正是加州大选如火如荼的季节。而加州,作为美国第三大州,世界第五大经济独立体,在美国的政治影响力举足轻重。而此次谷歌出的两个Bug,恰好就在加州大选初选开始的前一周。共和党人的愤怒,自然不足为奇。


6月5日,加州大选初选开始。从此次初选结果来看,民主党的票数虽然领先,但和共和党的差距并不大。目前来看,我们并不知道谷歌的这两个乌龙事件是否影响了此次选举。


(共和党竞选人获得约125万张选票,民主党候选人获得约160万张选票;途中红色为共和党选取,蓝色为民主党选区)


传统上,加州一直是蓝营民主党的天下。尤其是在硅谷,左翼势力十分强大,而“政治正确”的倾向愈演愈烈。这也是支持川普的著名投资人彼得蒂尔(Peter Thiel) 搬离硅谷的原因之一。


在科技大公司,政治正确近年来也成为了人们诟病的对象。谷歌去年由于开除了一名言论不当的员工,公司内许多右翼势力员工就准备发起示威游行 。虽然最后不了了之,但我们已经看到了即使是科技公司,也不能和政治完全撇清关系。


希望此次谷歌闹的乌龙事件,不会是又一场政治风波的序曲。


不过,反正我们吃瓜群众也用不了谷歌,有啥风波我们也不用怕……

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定