你不愿意摊在阳光下的秘密,谷歌都知道
2017-07-21 15:17

你不愿意摊在阳光下的秘密,谷歌都知道

虎嗅注:人心里都藏着秘密的一面,甚至在面对匿名调查时,我们也不会交出完全诚实的答案。但这并不代表我们的秘密就没人套得出来。当百度、谷歌之类的万能工具沉默地向我们打开方便之门时,我们就会毫无顾忌地将心中的疑问、欲望、阴暗……都和盘托出,并在虚拟世界中留下擦不掉的痕迹。将这些痕迹汇总在一起,就得到了一份最为真实可靠的“人性调查报告”。虽然面对人性的真实时会让人感到极为不适,但数据科学家 Seth Stephens-Davidowitz 却认为,了解真相恰恰是解决所有问题的第一步。

 

原文原载于《卫报》,原标题为 Everybody lies: how Google search reveals our darkest secrets,作者 Seth Stephens-Davidowitz,虎嗅编译(有所删减与浓缩)。


编译者 | 成长的人生


真相是人人都说谎。谁都不会实话告诉别人,自己在回家路上喝了多少酒;不会说出周身衣履的真实价格;也不会让别人知道自己压根没读过某本书……没病的时候请病假;对转眼就会忘的人说“常联系”;不爱的时候说“爱你”;已经重度抑郁了还说“挺开心”……对人对己,我们都不诚实。

 

甚至我们已自欺欺人到在接受匿名调查时也不说实话了。不信来测:


  • 考试时你做过弊吗?

  • 幻想过杀死某人吗?

  • 以及,你有没有因受怂恿而撒过谎?

……


果然,果然,许多人都没有交实底儿。原因简单得很,只要面对的是他人,我们就希望看起来形象良好。这种心态被称为“社会期许偏见”(social desirability bias)。

 

其实早在 1950 年就有报告指出:由于调查对象常怀有上述心态,匿名调查这种手段已经不再可靠了。如今六十多年已经过去,这一结论还成立吗?

 

当然成立。这六十多年改变了整个社会的价值观,却没有改变人们时刻想伪装自己的习性。就如最近,有人针对马里兰大学学生做了份匿名调查,将学生们给出的答案与学校官方提供的记录做了对比,结果令人大摇其头:实际情况是,足有 11% 的人以低于 2.5 GPA 的成绩毕业,但承认这一点的只有不到 2%;只有 28% 的人去年曾向母校捐过款,但在调查表这一栏上打钩的人却有 44%。


一个真相是:接受调查时环境越私密,人们越诚实。因此,在“所得结果真实度”的排名上,网上调查要高于电话调查,电话调查要高于面对面调查。但注意了,凡是涉及到敏感话题的调查,没有一个结果是不掺水的。原因很简单:只要有双眼睛在窥探,就没人乐意和盘托出!

 

这种情况下,我们到底该如何获悉人们真正的想法和行动呢?答案是:靠大数据。有些线上资源已经成功地挖到了人们素日不愿承认的隐情,譬如,谷歌搜索就是其中的佼佼者。

 

面对这个从无喜怒的 Google 标志,人们纷纷放心地埋首于此,竞相输入着心底的绝密。说来好笑,本来 Google 的诞生是为了方便人类了解世界,不是为了方便研究人员了解人类,但结果,我们还是成了显微镜下的样本——因为搜寻答案时留下的蛛丝马迹,我们变得昭然若揭。

 

过去四年来,我一直在分析谷歌收集的、那些浩如烟海又无名无姓的数据。精神病、性怪癖、流产、宗教、健康……二十年前还无从谈起的数据存储,让人类的另一面在我眼前日益昭彰。如今我已然确信:谷歌历年来收集的搜索痕迹,是所有关乎人类心理之资料的收集结果中,最重要的收集结果。


关于性的真相

 

多少美国男性是同性恋?这是性学研究常常触及的话题,也是最难回答的问题。上世纪四五十年代,知名性学家阿尔弗雷德·金赛曾根据那些反复以服刑者和性工作者为采样对象的调查报告,估计称约有 10% 的美国男性是同性恋。如今的心理学家们认为,金赛以上述方式取得的数据并不准确(或许吧);根据他们通过新型调查方式取得的结果,美国仅有 2%——3% 的男性是同性恋。但他们忘记了,“性取向”是个敏感话题,不管采用的调查方式多么私密,人们都可能在这一话题上撒谎。

 

而谷歌不会帮任何人打幌子。它用它长期收集的数据告诉我,在所有指向男色内容的搜索结果中,估计有约 5% 都属男同之类。虽不敢说这个数字就代表了美国男同在人口中所占的实际百分比,但以它作为估计结果,想必还是靠谱些。


换言之,成千上万的男同还隐藏着这一身份。他们不会在 Facebook 上坦露,不会在匿名调查中承认,甚至,他们会带着这重身份与并不知情的异性成婚。这就解释了为何你在谷歌搜索框中输入字段 Is my husband ... (我丈夫是不是……)之后,第一个跳出来的补充词是 gay。实话告诉你吧,在针对该字段的补充词中,“gay”的点选率比排名第二的“cheating”(欺骗)要高 10%,比排名第三的“an alcoholic”(酒鬼)和排名第四的“depressed”(抑郁)更是高出数倍之多。


一目了然


谷歌搜索知道的远不止这些。近来一些调查报告显示,美国人每年用掉的安全套比商家们卖掉的还多(哈?),仿佛他们在性生活上的活跃度果然与其祖国的“浸淫文化”相匹配。但实际情况呢?谷歌搜索只用几个黑漆漆的数字就让人明白了:原来,许多人——尤其是男性,根本不像某些报告标榜得那样贪欢,而是频频拒绝性生活,引得诸多女性纷纷向谷歌诉苦:为什么我的男票不再热衷与我共赴云雨了?

 

原因当然多种多样,但其中不可忽略的一条是:不少男性因“大小”和“长短”问题而自觉压力山大,最终当了床前逃兵。

 

先说说“大小”。谷歌搜索显示,男性对性器官的关心要超过对其他任一身体部位的关心;他们对“如何增大阴茎”的搜索频率,要远远高于对“如何换轮胎”、“如何给吉他调音”的搜索频率。在借助谷歌了解类固醇的危害时,他们最关心的不是摄入这类物质会否有害健康,而是会否令阴茎缩小。还有,在涉及到“年龄增长对人的影响”这一话题时,男性对谷歌提的最多的问题不是“变老会如何影响我的健康或心智”,而是“我的 JJ 会否随着年龄的增长而萎缩”……

 

很抱歉,谷歌说:女性真的、真的、真的不太在乎所谓的大小。她们咨询尺寸之类问题的频率,是男性们咨询这类问题之频率的1/170。

 

再说说“长短”。在性方面,男性向谷歌讨教得第二多的问题是:如何尽量延长性爱的时间。真尴尬,这次他们又没关心到点子上去——根据谷歌出示的数据,女性对“如何让对方尽快达到高潮”的搜索量和对“如何推迟对方高潮来临”的搜索量几乎相当。

 

所以明白了吗?男性一门心思想向女性证明的,未必是她们真正想要的。因此,又何必自苦呢?


关于仇视与偏见的真相

 

人们耻于公开的秘密何其多啊,性事方面的种种不过是九牛一毛罢了。

 

现如今在美国,谁要是胆敢因某人的种族、性取向或宗教信仰而冲此人说三道四,就很有可能吃官司。你或许认为这代表了社会的进步,但实际上这只是大众表面上的“从良”罢了。许多美国人明里不敢暗里敢,不然,谷歌也不会留下那么些对他们不利的证据了。

 

根据谷歌忠实的记录,美国人已经形成了对诸种族的刻板印象,认为黑人“粗鲁”,犹太人和穆斯林“罪恶”,至于亚洲人和基督徒,最起码也该贴上“愚笨”的标签。这种种怨恨平日里只是在台面下郁积着,如果哪天上述种族中的某人,譬如一位穆斯林,用行动验证了美国人对其印象的“正确性”,那么这种怨恨便会如暗火遇到干柴般迅速燃烧起来,直至大范围引爆。

 

还记得 2015 年 12月发生在圣博娜迪诺的那场惨烈的枪击案吗?事发后,两位穆斯林的名字一经公布,字段“kill Muslims”(杀死穆斯林)的搜索率就飞速上升,先是在事发地加州荣登榜首,后又在全美范围内迅速爬升,很快便与“马蒂尼酒配方”等日常热词的搜索率旗鼓相当了。

 

事发四日后的当晚,总统奥巴马在黄金时段向全国民众发表电视演讲,称希望国人相信政府既能遏止恐怖主义,也能抹去大家对伊斯兰的恐惧;同时他还表示,保持宽容与忍耐实乃必不可少。那场演讲雄辩有力、动人心弦,事后自然受到了诸多媒体的一致赞扬。这似乎标志着:奥巴马的这番慷慨陈词足有力挽狂澜之效。然而事实又如何呢?


一场事与愿违的演讲

 

谷歌搜索的数据毫不留情地掴了我们一耳光。它告诉我们:奥巴马演讲结束后没多会儿,民众在进行对穆斯林相关搜索时使用“恐怖分子”、“邪恶”、“暴徒”等字眼的频率就比平时翻了一番;与此同时,对“如何帮助叙利亚难民”这一问题之答案的搜索频率则比平时下降了 35%……换句话说,奥巴马的演讲虽然毫无过失,但取得的效果却是事与愿违——他不但没能平息众怒,反倒把火儿拨得更旺了!

 

原因很简单:奥巴马采用了说教的方式。这种方式,对于胸中郁积了种族偏见长达几百年的美国人而言,似是大忌。就拿已经从台面上消失了很久的讳语 nigger(黑鬼,下层人)来说吧,这么多年来谷歌搜索一直在用它的忠实记录告诉我,美国人一直没把这个词从心里抹去。迄今,“nigger jokes”(黑鬼 笑话)每年的搜索量比“chink jokes”(中国佬 笑话)、“kike jokes”(犹太狗 笑话)之类要高出十六七倍。更难以启齿的是,每当有以黑人为主角的新闻曝出后,“nigger”的搜索量都会出现突涨。

 

这实在撕开了蒙在美国人潜意识上的一张画皮。当绝大多数美国人都否认自己有种族偏见时,当林林总总的测试都无法说服他们直面内心的偏执时,当针对黑人的不公待遇已经弥散各行各业但所有人都习以为常时,至少有一点他们还无法抹煞,那就是他们自己留在谷歌搜索上的数据。


在谷歌眼里,看不见男女平等

 

切莫以为偏见仅局限于种族之间。或明或暗,或浓或淡,它其实充塞各处,甚至充塞于最亲密的亲子关系之间。

 

譬如那些年幼的女孩儿们。她们居然承受着来自父母的偏见。

 

父母们总巴望着子女有某一方面的天赋,这是人之常情。但奇怪的是,他们“望子成龙”的心却总比“望女成凤”的心要炽烈。根据谷歌搜索记录的数据,“Is my son gifted”(我儿子有天分吗)的搜索量比“Is my daughter gifted”的搜索量差不多要高出一倍半。怎么,难道在幼年时代,男孩子普遍比女孩子显得早慧吗?恰恰相反。在生命的早期阶段,相较于同龄男孩儿,女孩儿往往拥有更大的词汇量,也更会使用复杂的句子。而且据统计,在美国初级学校里,被各类特长计划录取的女生要比男生多出 9%。可没用。父母们照旧对男孩儿的智力发展更上心。

 

那么,什么时候他们才会显出对女孩儿的格外关心呢?答:在注意到她们的外貌时。在谷歌上,“我女儿是否超重”的询问率要比“我儿子是否超重”的询问率高出大约一倍,可事实上,虽然美国女孩儿的超重率高达 28%,但美国男孩儿的超重率却足有 35% 呢!

 

开明人士或许会以为,这种父母针对子女的性别偏见只在保守地区才尤为常见。但我却没发现什么证据能支持这一猜测。我只怕,这种偏见早已无处不在、根深蒂固到我们想都不敢想了。


黑暗的事实对我们有什么用?

 

我不能对这些数据中隐藏的黑暗视而不见。因为它是事实,是真实世界的另一面。

 

但即便是这样的事实,也能反过来成为我们改变人生、改变世界的工具。

 

首先,知道自己并非独处危境、或并非独染怪习,是一种安慰。就好像小时候,老师会想尽办法鼓励你提问题,但是你(像我一样)听而不闻,只是一言不发地坐在那,怎么都不敢开口。你觉得自己的问题太愚笨太肤浅,比不上别人的高深。现在好了,透过谷歌数据你完全可以看到:原来他人的头脑中也流泻着这样那样“不够高明”的问题。

 

第二,这类数据能向我们敲响警钟,告诉我们有人在受苦。从谷歌获知哪些州的隐匿男同更多后,人权运动组织(HRC)就找到了我,劝说我与他们合作,以帮助相关人士尽可能走出隐匿的状态。

 

也就是说,有了谷歌数据的帮助,该机构的资源更好地实现了有的放矢。

 

第三,这类数据最大的价值是:它能帮助我们从发现问题走向解决问题。回到奥巴马 2015 年底的那场演讲吧。记得吗?他的每一句说教都适得其反,但其中有这么一句话,却起到了他想要的效果:“美国穆斯林是我们的朋友、邻舍、合作者,也是我们运动场上的英雄。此外,他们还是我们的男兵女将,是随时准备为国捐躯的人!”

 

根据谷歌搜索的记录,奥巴马这句话刚说完,在“穆斯林”这一字段下,一年多来第一次出现了正面补充词点选率超过负面补充词点选率的局面,其中“运动员”一词的点选率更是在榜首维持了整整一天。

 

这个结果告诉我们:试图去说教愤怒的人群,只会挑旺他们的怒火;如果你肯巧妙地引动他们的好奇心,将他们不曾留意过的信息送入他们的视线,就可能引导他们的思想转向积极。

 

结语

 

确实,透过谷歌及其他网上信息源我们能探入人类心理最黑暗的角落。这种黑暗有时的确让人难以面对。但同时,这样的探究也能让我们受益。因为我们可以从数据中抽丝剥茧,然后找出击溃黑暗的办法。

 

也就是说,这世界问题丛生;而收集这些问题背后的种种数据,正是解决问题的第一步。


本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP