特朗普:谷歌一下,净说我坏话
2018-08-29 11:05

特朗普:谷歌一下,净说我坏话

虎嗅注:特朗普真的不高兴了。他发推特抱怨谷歌“压制右翼媒体新闻”,在“特朗普”的搜索结果中出现的都是些像CNN一样的“假新闻媒体”。谷歌方则回应称自己的算法没有问题,不会对搜索结果进行排名以操纵政治情绪。谷歌的算法是什么样的?媒体机构为了提高自己在谷歌上的曝光率,又会有什么样的行为?


本文转载自微信公众号“新智元”(ID:AI_era),作者:克雷格、肖琴、大明。


特朗普怼上了谷歌。


昨天,特朗普发了条推特,引爆了美国媒体,大意是:


用谷歌搜“特朗普新闻”,结果只显示CNN这些“假新闻媒体”的观点或报道,而共和党、保守派以及“公平媒体”被拒之门外。


特朗普还引用的一组数据:在“特朗普新闻”的搜索结果中,96%的都是左翼媒体,而保守派的出版物却被压制,非常不公平。



换句话说,特朗普认为,谷歌操纵了新闻,所以“几乎所有的新闻和故事都是坏的”。


谷歌是否正在操纵算法,优先考虑来自左翼新闻媒体的搜索结果?


Google一下,净说坏话


特朗普的推特不是乱喷,他指出的“96%”的数据,出处来自一个名为PJ Media的一项调查(其实PJ Media是右翼网站)


在这项调查里面,Google输入“特朗普新闻”,搜索结果第一页出现的媒体除了CNN外,其他左翼网站还有CBS,Atlantic,CNBC,纽约客,Politico,路透社和今日美国(此列表中的最后两个网站可能被认为比其他网站的立场更中立)


搜索结果的第一页上没有出现任何一个右翼网站。


而前100个结果,情况变得更糟。


CNN出现频率最高,高达21次,几乎是第二名《华盛顿邮报》(11次)的两倍。其他左翼网站出现频率也很高,分别是NBC(11次),CNBC(8次),Atlantic(5次)和Politico(5次)。


排在前100名的中的右翼网站只有《华尔街日报》和Fox新闻,分别为3次和2次。


PJ Media没有出现在前100个搜索结果中,其他一些右翼新闻网站,如National Review, The Weekly Standard,Breitbart,The Blaze,The Daily Wire,HotAir,Townhall,RedState等保守立场网站均未进入前100名,除了上面列出的《华尔街日报》和Fox新闻。


以下是前100个搜索结果中最常出现的网站:


Google搜索“特朗普”返回的结果来源(图片来源:PJ Media)


如下图所示,在用谷歌搜索“特朗普”时返回的文章中,来自CNN网站的文章比例格外高,占总数的近29%。而事实上,搜索结果中,左翼网站文章占总数的比例高达96%。


Google搜索“特朗普”返回的结果的来源比例(图片来源:PJ Media)


换了不同的计算机,使用不同的帐户多次执行了搜索,Google都返回了类似的结果。虽然这个统计方法不是很科学,但结果表明,谷歌搜索确实存在对右翼内容的偏见。


除了网站之外,美国媒体人Sharyl Attkisson曾制作一份媒体偏见图,这份图表也被PJ Media引用,具体如下图所示。



有趣的是,Sharyl Attkisson曾在CNN工作三年,但她后来发现,CNN有专门的“白宫批评组织”,因此,她认为媒体在很大程度上是批评白宫的,但她认为媒体应该作为一个推动叙事的无偏见的仲裁者,于是才有了上面这张“媒体偏见图”。


谷歌回应:每年改进算法,没有政治偏见


特朗普的一番推特炮轰后,白宫表示将调查“算法偏见”,白宫的一位经济顾问也表示,政府正在“看一看(We're taking a look at it)”监管的可能性。但白宫和特朗普都没有详细说明他们将用什么法律理由来调查谷歌。


国会消息人士说,特朗普可能很难找到一种方法来向谷歌调查新闻搜索结果,国会不太可能通过任何适用的法律。并且,美国联邦通信委员会在废除网络中立规则时放弃了对在线通信管理的管辖权。


谷歌随后也回应了特朗普的评论:


当用户在Google搜索栏中输入查询时,我们的目标是确保他们在几秒钟内收到最相关的答案。搜索并不用于制定政治议程,我们也不会将结果偏向任何政治意识形态。


每年,我们都会对算法进行数百项改进,以确保他们能够根据用户的查询显示高质量的内容。我们不断努力改进Google搜索,从不对搜索结果进行排名以操纵政治情绪。


这则回应有理有据,听上去也理直气壮,但谷歌能挺多久没人知道。


因为谷歌显然在一定程度上控制了信息如何呈现给用户,只不过对许多人来说,问题是谷歌对这一过程的干预力度有多大。


谷歌的算法,尤其是搜索算法,是一种主算法(master algorithm),可以实时地应用到每次搜索查询中。尽管算法本身经常随着谷歌的调整而发生变化,但它在每次搜索时的应用都是相同的。


如果搜索结果因人而异,那可能是因为用户使用的浏览器是隐身模式,这会删除 Cookie和其他第三方跟踪软件。或者他们搜索时所处位置不同,触发了谷歌返回本地结果。


美国东北大学计算机科学教授 Christo Wilson研究谷歌的搜索实践已有 6 年,他的研究涉及到比较不同条件下的谷歌搜索结果——例如,让一组测试人员匿名使用谷歌搜索,而另一组在正常模式下使用谷歌搜索。在其他研究中,Wilson让一组人登录 Fox News,另一组人事先浏览 CNN 新闻,然后进行同样的谷歌搜索。


“我们从未发现很大的差异。事实上,你的搜索历史只会影响大约 10 分钟,甚至对大多数查询来说搜索历史毫无影响。”


他解释说,这可能是谷歌对新鲜度 “偏见” 的结果。这可能也是特朗普所经历的。Wilson说:“特朗普搜索得到的结果和每个人搜索同样的关键字得到的结果都是一样的,至少在美国是一样的。”


Google搜索结果如何排序是最头疼的部分,目前还是PageRank算法


谷歌的算法是怎么实现的?


从较高的层面看,谷歌搜索引擎基于一长串的网站。谷歌使用 “爬虫” 的自动化软件从这些网站中收集信息。爬虫程序会收集互联网上网站的关键词和其他数据,已经有数十亿网页被通过这种方式分析。


谷歌官网对其搜索算法的说明:


您需要的是答案,而不是数十亿个网页,因此, Google 排名系统会对 Google 搜索索引中的数千亿个网页进行筛选,以便瞬间就能为您提供实用且相关的结果。


这些排名系统由一系列算法组成,而这些算法用于分析您要查找的内容以及要返回给您的信息。在改进 Google 搜索以使其更加实用的过程中,我们优化了这些算法,以便更精确地评估您的搜索内容和结果,从而改善我们的各项服务。


以下是 Google 使用搜索算法从网络中返回实用信息的一些方法:


  • 分析您的关键词


  • 与您的搜索内容相符


  • 为实用网页排名


  • 考虑具体环境


  • 返回最佳结果


当用户输入搜索查询时,谷歌会接受他们的请求,并在其记录中查找任何匹配项。然后它面临另一个问题:如何排列所有的结果。


这就是谷歌搜索引擎中更加主观的部分。它要考虑超过 100 个因素——从用户所在的位置到某个网页最近更新的频度——这些因素决定了某个结果可能出现在多前的位置。


此外,谷歌搜索著名的 PageRank 算法是由其共同创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)开发的,该算法在确定给定来源的权威性方面起着重要作用。


谷歌官网对其搜索排名的说明:


为了帮助将最符合需求的网页排在靠前的位置,我们还编写了算法来评估这些网页的实用性。


这些算法会分析数百种不同的因素——从内容的新鲜度,到您的搜索关键词的出现次数以及网页能否提供出色的用户体验——以尽力呈现网络所能提供的最有用的信息。


为了评估内容在相关主题方面的可信度和权威性,我们会寻找那些看起来在类似查询中受到大量用户青睐的网站。如果与该主题相关的其他知名网站链接到了相应页面,则可充分说明此页面上的信息具有较高的品质。


谷歌高管们在讨论谷歌软件的具体细节时犹豫不决,因为他们担心这会鼓励那些想要玩弄算法的人。特朗普批评的一个核心方面就是,谷歌最初的分配权值的方式就是错误的。


但是,谷歌搜索排名团队的负责人 Pandu Nayak 说,谷歌会与普通人一起测试自己的搜索结果,以确保搜索引擎能够达到它的意图:提供相关且权威的结果。


“我们已经制定了一系列关于‘权威’的意义的详细指南,”Nayak 表示,“这份指南长达160 页,已经在网络公开发表了好几年,它就是我们对提供相关且权威结果的意义的表述。”在参与评估过程之前,评估者必须对其进行研究,并通过测试。


谷歌用AI推荐新闻,媒体机构想方设法提高自己的出现率


再来看看谷歌新闻(Google News)。


谷歌新闻最近的改版已经使它变成了一个更加个性化的产品,它使用人工智能来满足用户的偏好。


这种方法引发了人们的疑问:是什么决定了 Google News 首页显示的结果,以及它的工程师对 AI 正在做出的决策在多大程度上是真正了解的?


在当前的机器学习研究中,一个一贯的主题就是 “算法是黑箱”——通常,确定算法决策原因的唯一方法是尝试从其结果逆向工程逻辑。


不过,公司和个人似乎都可以影响谷歌的搜索结果。


逆向工程在谷歌实际上已经成为一种作坊式工业,特别是在媒体方面。新闻出版方一直在努力寻找在 Google News 和 Google 搜索上争夺知名度的方法。例如,谷歌倾向于支持 “新近度” 或 “新鲜度”,鼓励像 “华盛顿邮报” 这样的公司用元数据关键字创建他们的网页,以便搜索引擎可以轻松读取。


谷歌当然有能力定制搜索结果,但定制行为往往比想象的要少。


专家表示,媒体机构想方设法提高自己在谷歌上的出现率,这是谷歌的成功和主导地位的副产品,而不是谷歌偏袒的证据。


“如果你是一个出版商,就不可能从与谷歌有关的任何互动中解脱出来,” 代表在线出版商的行业协会 Digital Content Next 的政府事务高级副总裁 Chris Pedigo 说。


谷歌别慌,特朗普已经把硅谷科技公司怼了一圈


在谷歌之前,特朗普曾在今年3月炮轰贝索斯的亚马逊,认为亚马逊的商业模式正在“逼死”美国的夫妻零售小店,还占了美国邮政系统的便宜,并且准备修改针对亚马逊的税收优惠。


当时特朗普也是连续发推特抨击亚马逊,让后者的股价在短短5天内跌掉一个京东。


除了亚马逊,硅谷的其他科技巨头比如Facebook、苹果以及Twitter都受到了来自特朗普或美国国会的压力。


出于安全和选举原因,Facebook和Twitter等公司被要求删除阴谋驱动的内容和仇恨言论,国会也要求这些公司监管外国宣传和旨在扰乱美国政治的虚假账户。


不久前,YouTube、Facebook、苹果和Twitter等封杀了美国阴谋论者Alex Jones的账户或者播客,但美国共和党的一些立法者也对社交媒体公司从一些保守派中删除内容表示担忧,并且已经召集Twitter的首席执行官在9月5日的众议院小组面前作证。


都是难兄难弟。


参考资料:

Trump claims Google is suppressing positive news about him and ‘will be addressed’

Washington Post

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定