游戏评分仍然重要,但它还能走多远?
2017-02-18 15:08

游戏评分仍然重要,但它还能走多远?

Metacritic是一家专门收集媒体对于电影、电视节目、音乐专辑、游戏等评论的网站,它会整合每家对产品的评价分数,再按照一定的算法得出总评分。在许多消费者看来,Metacritic的评分具有较高的可参考性。


近日,外媒Glixel采访了Metacritics的一位联合创始人兼主编,请他谈了谈为游戏做综合评分和与电影、电视剧、音乐专辑做评分的差异,以及他认为Metacritic对玩家、游戏公司和行业分析师们有哪些价值。


触乐对文章的主要内容进行了编译,原文标题《'Metacritic' Still Matters, But For How Long?》,作者Chris Baker。



当马克·多伊尔(Marc Doyle)和他的几位大学老友准备动身到圣巴巴拉过周末时,他收到一个消息:《华盛顿邮报》的评论家不太喜欢电子游戏《神秘海域4:盗贼末路》(Uncharted 4: A Thief's End)。评论家认为游戏画面俗气,玩法如同一次“艰苦的长途跋涉”,游戏给人的总体体验就像一场“原因不明的沉船事故”。多伊尔立即意识到那个周末会不太平,《华盛顿邮报》的评论笃定会对《神秘海域4》在Metacritic的得分产生影响。



多伊尔是评分聚合网站Metacritic的联合创始人兼主编,他经常查看CBS旗下《华盛顿邮报》的游戏版块。多伊尔决定Metacritic追踪哪些游戏网站,整理他们对游戏的评论,并将评论转化成为介于0~100分之间的一个分数。通过统计和整合来自许多不同网站的评分,Metacritic会为每款游戏计算出单一评分,也就是Metascore。


《华盛顿邮报》不会对游戏直接给出分数,不过这家媒体认为Metacritic相当重要,所以评测人员会将他们的评分直接发送给多伊尔。《华盛顿邮报》的评论家为《神秘海域4》打了40分



“在看到分数的那一刻,我就知道接下来会发生什么。”多伊尔说,“我知道玩家们会有哪些反应。”


根据Metacritic的统计,111家不同媒体积极评价《神秘海域4》,让游戏的Metascore达到了94分。不过来自《华盛顿邮报》的差评,则会将平均分拉低到93分。


一分之差似乎不算什么大事,但《神秘海域4》的玩家们被激怒了。许多从未玩过这款游戏的人同样愤怒,因为他们是索尼死忠,PS4独占的《神秘海域4》被他们视为一款能够证明PS4优越性的旗舰大作。在这些玩家看来,《神秘海域4》降低1分,就如同他们支持的NFL球队的季后赛排名下降了一个位次。



在那个周末,多伊尔完全没了度假的心情。他知道读者们会情绪激烈——Metacritic游戏版块的访问量远远高于电影、电视剧或音乐版块。玩家们群情激愤,甚至到Change.Org发起了一次请愿,要求Metacritic将《华盛顿邮报》对《神秘海域4》的评分移除。近10,000人在请愿书上签名。



不过多伊尔坚持捍卫媒体对游戏的评分。“《华盛顿邮报》的人因为这件事造成的麻烦向我道歉,我说,‘兄弟,不要道歉!’这就是我们的工作。”多伊尔回忆说。


《华盛顿邮报》对《神秘海域4》差评所引发的争议表明,许多人仍发自内心地认为Metacritic很重要。除了玩家之外,开发团队能从发行商那里拿到多少奖金,往往与游戏的Metascore挂钩,而发行商们也会投入大量时间和精力试图预测游戏作品的Metascore,因为这个分数将可能对游戏在零售店的订单量和最终收益产生影响。


但游戏行业和游戏作品本身都在变化。在许多方面,媒体在一款游戏发售时的评价,并不能反映它的最终品质。在新的行业环境下,Metacritics是否依然重要?


善用你的时间和金钱


1999年,南加州大学的三个同班同学共同创办了Metacritic。贾森·德茨(Jason Deitz)提出最初的构想,马克·多伊尔(Marc Doyle)和他的妹妹朱莉·多伊尔·罗伯茨(Julie Doyle Roberts)一起创建了网站,选择追踪哪些媒体,并将媒体对娱乐产品的评分制成图表。他们的任务简单明了。“Metacritic试图教育消费者,让他们知道怎样才能最好地使用他们的时间和钱。”多伊尔说道。


马克·多伊尔(Marc Doyle)


如果评论家在评测一款作品时没有打分,Metacritic的工作人员会根据他们的评测内容和语气估一个分数。这种方法对电影和音乐专辑的评测来说通常有效,不过评论家偶尔也颇有微词。“《华尔街日报》的乔·摩根斯登(Joe Morgenstern)曾告诉我们,‘你们说我给《珍珠港》(Pearl Harbor)打40分,不过我觉得它只配得10分。’”多伊尔说。


估分通常适用于电影和音乐专辑,不过一旦涉及为游戏评分,Metacritic的工作人员就不会这么做了。从传统角度来看,数值量化是游戏评测中不可或缺的一部分,玩家们似乎希望游戏评测拥有更高的精准度。



这是可以理解的。一款游戏既是艺术作品,同时又是一款软件。游戏跟其他娱乐作品都有所不同:你不需要为一张音乐CD下载补丁,也不需要在观看某部电影时查找攻略。当你观看一部电视连续剧时,你不会因为存档系统出现故障丢失所有进度。


“游戏售价昂贵,它们需要你投入大量时间。”多伊尔说。在某些时候,玩家花60美元购买一款游戏,却因为它无趣或存在问题在短短一两个小时后就放弃。考虑到这些因素,评测人员试图对玩家在游玩时可能感受到的体验进行量化是合理的。



“人们也许会问,‘我该不该买这款《行尸走肉》游戏?’”多伊尔说,“如果它是Telltale制作的《行尸走肉》系列中的一部作品,那么在Metacritic上的分数会在90分以上。不过如果游戏是《行尸走肉:生存本能》(Walking Dead: Survival Instinct),那就只有30多分了。”


游戏作品在Metacritic的得分不仅影响玩家对它们的看法,还会影响到从业者。游戏行业分析师经常在财务报告中提及Metacritic分数,有人甚至认为这些分数会让动视和Take-Two等公司的股价出现波动。


某些发行商付给开发团队的奖金也与游戏的Metacritic分数挂钩,黑曜石娱乐的克里斯·阿维隆(Chris Avellone)曾声称,由于《辐射:新维加斯》(Fallout: New Vegas)的Metacritic分数没有达到发行商的预计目标,他的团队错过了一笔奖金(据传为100万美元)。据阿维隆透露,《辐射:新维加斯》的Metacritic分数只比发行商的目标少了1分。



“这是真事,现在还会经常发生。”游戏业务管理顾问公司Tiswaz娱乐CEO,业内长期投资人士凯文·邓特(Kevin Dent)说,“开发团队能够得到多少额外奖金,与游戏销量和Metacritic分数挂钩。一位执行制作人可能得到大约10万美元的额外奖金,一个普通程序员也许会得到1.5万美元奖金,够买一辆车了。”


“我认识一些游戏公司员工,他们向我解释了Metascore对他们的生活和工作有多重要。”多伊尔说道,“如果发行商关心游戏作品质量,而不仅仅是销量,我觉得那会是件好事,但我不知道他们是怎么做的,我不参与的。”


“我能理解与游戏销量挂钩的奖金。”邓特说,“不过我永远无法理解与Metacritic分数挂钩的奖金。游戏行业的从业者害怕Metacritic,因为它绝对能影响收入,就这么简单。”


可靠性和声誉很重要


多伊尔不认为自己是行业内幕人士,但他密切监测Metacritc所覆盖的媒体。“我订阅了美国、英国和世界其他国家和地区的30本杂志。”多伊尔说,“在任何时候,我都追踪着140~150家媒体的评测。”


在普通玩家看来,某些媒体知名度不高。“我在游戏行业已经工作多年,有些媒体就连我也从未听说过。”邓特说,“我查看了Metacritic收录的《守望先锋》媒体评测,有些媒体我在网上搜过之后才知道它们。”’


Metacritic共收录了62家媒体对《守望先锋》PC版本的评测,它们当中既有大众流行媒体,也有专注于PC游戏的垂直细分媒体,有IGN和IGN瑞典分站,Eurogamer波兰分站,还有像Ragequit.gr.(希腊)、Level(捷克共和国)和Навигатор игрового мира(俄罗斯)这样一些不知名媒体。



多伊尔相信,美国或英语国家的媒体不会垄断有见地的评论,每年他都会在圣诞节后评估Metacritic可追踪的新媒体。据多伊尔说,他会向那些希望自家评测被Metacritic收录的媒体发一份很长的调查问卷,以了解他们的日常运作、编辑背景、写作团队的人员构成以及分数范围和评分理念。


如果遇到外语媒体,多伊尔还要求对方翻译评测,同时多伊尔还会询问他所熟识的一些海外评论家,了解每个媒体的声誉。“我在寻找能够独立思考,评分诚实公正并值得信赖的媒体。”多伊尔说。


Metacritic非常重视可信度和声誉,而不是简单直接地统计媒体评测的平均分数。除了审查媒体渠道之外,多伊尔和他的同事们还会决定每一家媒体的评分权重,这意味着就算两家媒体对某款游戏作品同样给出70分的评价,玩家对它们的信赖程度也不一样。


“在我们的系统中,权重是一个不透明的因素。”多伊尔说,“它是我们的独家秘方。”



不过多伊尔试图淡化权重所带来的影响。据他称在Metacritic,一款游戏的平均分数通常与另一家姊妹网站Game Rankings上的分数十分接近,后者采用的是直接统计来自英语媒体评测的平均分。“这对于那些会吸引许多媒体评分的大型游戏来说尤其如此。”


但发行商们仍然非常关注游戏在Metacritic上的分数,他们渴望知道哪些媒体对分数的影响力最大。有传闻称,某些发行商觉得他们已经成功破解了Metacritic统计分数的算法。


“我突然知道,我们的(游戏评测)权重比较高,这给我们带来了巨大的压力。”英国媒体Eurogamer编辑奥利·威尔什(Oli Welsh)说,“Eurogamer给游戏评分常常低于其他媒体,而较高的分值权重意味着我们可以将一款作品的Metascore拉低1~2分。”


威尔什称在2014年底,Eurogamer决定不再为游戏评分。不过有趣的是,Eurogamer波兰、西班牙和意大利分站有独立编辑团队,他们对游戏的评分仍然会被Metacritic收录。


Eurogamer主站上已经没有了主观的评分机制


据威尔什解释,Eurogamer之所以决定不再采用评分制度,恰恰是因为Metascore的影响力太大。“Metacritic是一个有用的网站。”他说,“不过它正在对游戏行业、发行商和玩家产生负面影响。我不认为这是Metacritic的错……但这种影响确实不健康。”


另外一些媒体也开始取消评分制。“我们曾有一段时间使用Yes/No系统,不过在去年,我们把这个系统也取消了。”Kotaku副主编帕特里克·赫尔南德斯(Patricia Hernandez)说,“我明白评分为什么吸引人——数字很容易被消化,但分数不代表一切。”


游戏评测的演变


威尔什认为,Metacritic影响力过大只是游戏媒体取消评分制的原因之一。“我们感觉游戏变得太复杂、太易变了。”他说,“过去我们对游戏的评测通常集中在一篇文章里,不过如今我们更有可能花几周时间,写几篇文章来评测一款游戏。”


在过去,当一款游戏发售时,Metacritic会对媒体对它的评价进行整合,从而影响玩家决定是否购买。但部分知名游戏公司不会在游戏发售前向媒体发送评测码了,评测者需要花几十个小时才能通关一款游戏,这意味着在游戏发售几天甚至几周后,媒体都无法发布对它的评测。


在收到足够的评测数量前,Metacritic不会显示作品的综合评分


另外,随着联网玩法在游戏作品中变得越来越普遍,评测者几乎不可能在一款游戏发售前对它做出评判。“看看《命运》(Destiny),如果一个评测者无法跟许多玩家接触,那么他根本就理解不了游戏的特色。很多媒体对《命运》的评价都不太合理,因为他们以为这是《光晕》开发商制作的一款新FPS,因为游戏的剧情很垃圾。不过当你跟其他玩家联网游玩,你就会发现更多有趣的玩法。”


“在当今的游戏行业,开发商除了制作续作之外,还有可能永久支持某些游戏的运营。”邓特说道,“过去如果你想为游戏推出一个补丁,索尼和微软也许会要求你缴费大约8.5万美元,但瞧一瞧《我的世界》和《守望先锋》,它们持续为玩家提供新内容;《H1Z1》现阶段还只是一个存在各种Bug的原型,不过它的玩家社区在不断扩大。”


威尔什说,他和多伊尔谈论过Eurogamer决定取消打分制的决定,后者希望通过一些调整,让Eurogamer对游戏的评测继续在Metacritc得到展示。“他提议先解读我们的评测,然后自己为游戏给出一个分数。”威尔什说,“但这个过程似乎充满了困难。那是一次很好的谈话,他(多伊尔)对待工作的认真态度让我印象深刻,不过我还是请他不要再收录我们的评测。”


YouTube主播和评测的力量


游戏评测的影响力和权威性似乎已经开始减弱。在许多媒体,评测变得更为个人化和散文化,而不再追求根本无法实现的客观性。


威尔什曾为英国著名电子游戏杂志《Edge》撰稿,据他回忆,《Edge》的评测极具影响力,以至于如果这本杂志为一款游戏打满分,就会在游戏业内引发轰动。“我尊敬《Edge》的这个传统,不过我显然更偏爱那些拥有自我品位和缺陷的评论家。”威尔什说,“传统的文字评测也许不像过去那样有影响力了,但这未必是件坏事。”



“读者越来越关心某些名人的意见。”赫尔南德斯说。在明星主播的影响力日益增长的今天,Metacritic很难收录主播们对游戏的评论,也越来越难以与他们竞争。


“YouTube明星和主播们变得比过去任何时候都更重要了。”邓特说,“我的儿子不读评测,他只看别人玩游戏,他会观看Total Biscuit或Boogie制作的视频。我曾跟一家主流游戏平台的高管聊天,他告诉我,他不太关心文字评测都写了些什么。据他说,排名前十或前二十的YouTube明星和主播能够为游戏带来远比所有文字评测加在一起都更多的曝光量。如今文字评测通常只会作为游戏简介或营销材料的一部分使用,或是出现在某些作品的年度珍藏版的包装盒上。”


模拟评测


虽然传统游戏评测的权威性似乎在下降,不过它们仍是塑造游戏行业的基石之一。绝大多数主流发行商都会在公司内部对游戏进行评测,他们在游戏研发期间雇佣外部顾问(其中相当一部分有评测游戏的经验),请这些顾问估算游戏的评分。


“还记得Gamergate事件吗?当时许多玩家觉得发行商收买了评测人员。”邓特说,“跟我聊过的每个公关人员都说,‘真希望能收买他们啊’,有趣的是他们确实在收买评测人员。他们会联系一些评测者,以相当于为媒体工作两到三倍工资的酬劳请他们撰写用于公司内部使用的‘模拟评测’。这些评测者与游戏公司签署了保密协议,不能将自己的评测公开,不过能得到足够偿还大学贷款的一笔钱。”


一位不愿透露姓名的受访者告诉我,在游戏行业,这种做法很普遍。在某些3A游戏的开发过程中,很多顾问会在各个阶段对游戏做出评价,据一位消息人士说,有公司曾因为顾问们为一款游戏估算的评分太低,而放弃了那个研发已经耗资数千万美元的项目。


“这相当普遍。”邓特说,“许多游戏因为模拟评测的分数较低而被取消。”


玩家更关心评分


与电影或音乐爱好者相比,游戏玩家似乎更关心评分。“音乐粉丝往往不会那么关心评测。有人给《Purple Rain》打了低分,谁在意呢?”多伊尔说,“不过玩家群体就要关心得多了,他们觉得分数就像自己购买的股票那样重要。”


从某种意义上讲,玩家如此严肃地对待评测并不让人觉得奇怪。游戏硬件和软件售价昂贵,会吸引玩家对它们形成一种品牌忠诚度;玩家热衷于站队,比较不同游戏的分数和排名。对许多玩家来说,追踪Metacritic对游戏作品的评分本身就像是一个足球博彩类游戏。



在Metacritic,玩家试图提高他们所支持的游戏的用户评分,同时拉低其竞争对手的用户评分。“在网站上线四五年后,粉丝之间的抱团战争就成了一个大问题,我们不得不对粉丝投票的时间加以限制。”多伊尔说,“比如当一款像《小小大星球》那样的PlayStation独占游戏正式发售前,其他主机的用户很可能会疯狂涌入给它打低分,但他们根本不可能玩到游戏。”


多伊尔说他希望Metacritic能够帮助消费者了解一款产品的情况,不过他不建议每次购买产品都将Metacritic的分数作为参考。“如果电影《月光男孩》(Moonlight)的分数是50或者70分,我会不会去看?也许不会。但我喜欢宝利·谢尔(Pauly Shore)的所有作品,《Biodome》是我最喜爱的电影之一。”他说。在Metacritic,《Biodome》只得到了1分(满分100)。


“如果我看到某些愚蠢的喜剧分数很低,我认为这不重要。我会去看,会发笑,我会喜欢它的。”


编译 | 等等

触乐 | 高品质、有价值、有趣的游戏资讯

题图来自 | vgalt

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定