iPhone应用评分,你以为真的是你说了算吗?
2020-09-09 10:49

iPhone应用评分,你以为真的是你说了算吗?

去年苹果应用商店交易额超过5000亿美元,数百万家公司使用各种移动应用程序来接触苹果近10亿用户,苹果应用商店中的评级系统堪称移动应用界的“命脉”。自iOS 11以来,“应用内提示”的兴起有效激发了用户参与度,平均每个应用程序的评分从2017年的1.9万次上升到2019年的逾10万次。


然而,这种开发者得到更多安装、苹果得到更多佣金的滚雪球效应促使开发商利用行为心理学了解用户情绪、感觉和行为,花费更多精力推高评分,但所谓的“客观公正”却不得而知。


本文来自:硅谷封面,题图来自:视觉中国


对一个iPhone应用程序打分或许只需要一秒钟的时间,最多也就两秒钟。通常应用程序会弹出一个提示框:“喜欢Skype 吗?”然后用户可以点击1到5颗星的评价来进行打分。数以百万计的用户回复了这些请求,很少认真考虑过他们在短时间内做出的选择。


然而,整个行业在幕后花费无数时间和代码来为这个时刻作准备。看似随机出现的提示框往往经过精心安排和设计,只在用户最有可能作出5星评价的时候才会出现在屏幕上。


游戏应用程序会在用户获得高分后要求打分;银行应用程序会在发薪日进行询问;甚至于赌博应用程序也会在用户抓到完美的21点时才开始弹出提示。毫无疑问,只有当用户所支持的团队获胜时,体育应用程序才会亮出评分。


10年来,苹果一直在打压“下载机器人”等评级做法。开发iOS应用程序的企业利用这些机器人骗取五星评分,并操纵自家应用在苹果应用商店中的排名。虽然这些方法起到了一定效果,但实际上都是试图欺骗评级系统的生硬粗暴手段,显然违反了苹果应用商店的规则。更复杂的技术始终处于规则允许的范围之内,但会利用行为心理学来了解用户的情绪、感觉和行为:它们不再侵入系统;而是正在侵入用户大脑。


Fakespot是一家分析网络评论真实性的服务公司。首席执行官萨伍德·哈利法(Saoud Khalifah)表示:“所使用的这些方法总是悄无声息。”“当你愉悦的时候,当你开始分泌大量多巴胺的时候,它们就会瞄准你……它们可以使用机器学习来确定用户何时更倾向于留下正面评价。”


此外,开发者也知道什么时候不应该问这个问题:如果用户正在阅读有关死亡或毁灭的负面内容,新闻应用程序就不会征求评论;那些反复忘记密码频繁进行试错的用户肯定也不会是提问对象。这种操作有助于防止出现更多低分,从而提高应用程序的整体平均分。


提供移动领域咨询服务的Robots and Pencils公司首席执行官迈克尔 西科斯基(Michael Sikorsky)表示,“我们称之为潜在价值感知……如果你认为已经把某人推到了应用程序的黑暗角落,那就不适合让他进行评分。”


咨询公司Mobiquity战略与分析副总裁布赖恩 莱文(Brian Levine)表示,这种策略对公众来说不得而知,但对开发商来说已经是公开的秘密,其使得很多应用的评级虚高。这种现象在苹果应用商店中非常普遍,以至于“在大型企业中,很难找到不这么做的企业”。


苹果一直在打压“下载机器人”等做法,但“应用内提示”功能在某种程度上夸大了应用的评级


他补充道,即使是那些不愿这么做的人也开始意识到,这也是进入苹果精心策划应用市场的成本。“现在的情况是,苹果应用商店的评级对消费者来说变得毫无意义。”


评级虚高的影响深远。数百万家公司使用各种移动应用程序来接触苹果的近10亿用户。去年苹果应用商店的交易额逾5000亿美元,甚至超出大多数国家的GDP。


移动数据和分析服务提供商App Annie的数据显示,全球用户每天清醒时平均有27%的时间花在使用移动设备上。最近苹果因对应用程序收入抽成30%而备受批评,《堡垒之夜》开发商Epic Games就此对苹果提起诉讼。但这只涉及苹果应用商店中16%的收费应用,相比之下评级虚高会影响到所有应用。


应用程序之间的竞争非常激烈,因此获得高分至关重要。应用评价管理公司Apptentive将应用评级称为“移动应用世界的命脉”。该公司的研究显示,从2星跳到3星可以使下载量增加306%,而从3星升至4星则能使下载量增加92%。为企业应用商店排名优化服务的Gummicube表示,五分之四的用户不信任评级低于4星的应用。


应用评级是“移动应用世界的命脉”


Fakespot的哈利法表示:“每个人都被激励着打出更高分。”“开发者会得到更多安装量,苹果也能得到更多佣金——这是滚雪球效应,又会推动应用得到越来越多的高分。”


“问题在于。”他补充道,“真相被掩盖了。”


“应用内提示”的兴起


引发这种评级虚高的是苹果在2017年9月进行了一次看似无害的更新。苹果此举是为了提高消费者参与度,让用户不再需要主动登陆应用商店对应用程序进行评级,因为那个系统通常只会让心怀不满的用户打出低分。


随着iOS 11的发布,苹果允许开发者提供“应用内提示”功能。这些提示的优点在于,它们能提高用户的参与度,而且有效克服了“回应偏差”,让很多应用得到的不再是消极评分。苹果吸引更广泛用户群体参与评分的目的就是提高应用评级的准确性。


苹果在iOS 11系统中开始引入“应用内提示”功能


从某种意义上说,这是一个巨大的成功。用户评分的参与度飙升。根据Apptentive的数据,平均每个应用程序的评分从2017年的1.9万次上升到2019年的逾10万次。相比之下,谷歌应用商店在这段时间内并未提供应用内评分,单个应用的评分仅从3.3万次上升到4.3万次。


但批评人士表示,苹果设计该系统的方式让开发者得以利用多个漏洞,有意引导消费者提高应用评级。苹果允许开发者可选择弹出应用内提示的时间,开发者可以集中向粉丝征求意见,避免询问在评分方面有风险的用户来实现“样本偏差”。


苹果还要求开发人员使用1到5星评级的标准提示界面,称这是为了收集用户的真实反馈。然而,开发人员可以从中引入“框架偏见”。如果他们给用户一个积极的提示,比如“祝贺你得了高分!”,然后再要求用户对应用进行打分,之后得到五星评价的几率就会提高。


苹果也禁止开发者向用户发送“你如何评价这个应用程序?”等问题,在得到肯定的答案后再去调用应用商店的官方评分系统。不过,开发商仍可以通过调整问题措辞来“吸引”用户。比如说,视频会议应用程序完全可以问“你的视频通话质量如何?”,在确定得到5星评价后再去请求苹果官方的评分提示。


“开发者所做的是在公众评价范围内尽可能扩大对其做出有利评价的用户规模。”贝恩咨询公司(Bain & Company)顾问罗布·马基(Rob Markey)表示。马基也是网络优化指标Net Promoter Score的联合创始人,这一指标主要帮助企业权衡、管理和提高客户忠诚度。“随着公司越来越善于操纵分数,评级系统本身对消费者的用处也越来越小。”


其他平台也经历过评级虚高的问题。一项调查发现,亚马逊正对其网站上评论最多的用户进行调查,有证据表明,这些人通过发布数千份5星评分而获利。


当然,苹果用户可以选择不接收应用内提示。他们也可以在任何时候去应用商店发表负面评论,而且开发者不得以任何方式阻止他们。然而,苹果确实允许应用程序开发商“重置”应用评级,而且由于应用内提示功能让普通用户更容易选择5星评分,很多低分评价完全可以被淹没。西科斯基引用一位客户的例子说,这名客户的应用获得了1090个1星评论,但在调整反馈机制后的几周内,这款应用收到了逾3.5万份评价,其中90%的人打了5颗星。


咨询公司Publicis Sapient用户体验设计师温迪 约翰逊(Wendy Johansson)表示:“这在很大程度上是经过精心设计的。”


苹果一直试图阻止开发者强迫用户打出更高评分,并威胁会剔除违反规则的开发者。苹果在作出回应时表示,其已经从应用商店中下架了不少违反规定的应用程序,也从开发者项目中踢掉了不守规矩的开发者。


“我们的应用商店审查指南明确指出,任何试图欺骗系统的开发者,比如操纵评分或其应用在搜索结果中的显示方式,其应用都有可能被下架,开发者也有可能从开发者项目中删除。”苹果补充道。


“反竞争”


然而有证据表明,开发人员已经找到了多种方法,在不违反苹果规则的情况下玩转这个评级系统。当被问及所使用的策略时,开发者拿出苹果自己的应用内提示指南:“在用户最有可能对你的应用程序感到满意时发出请求,比如当他们完成动作、关卡或任务时。”


对哈利法来说,苹果规则还带来了一个意想不到的后果。开发者每年只能就每个应用向单个用户请求三次评分。这是为了避免让消费者感到厌烦,但实际上却让应用内提示变成了一种稀缺商品。他说,这促使开发者通过打造“黑镜算法”来找出用户什么时候最快乐。


今年7月,苹果首席执行官蒂姆 库克(Tim Cook)在美国国会众议院反垄断听证会上作证


Mobiquity的莱文表示,其结果是应用商店的评级系统受到影响,更有利于占市场主导地位的大企业。他补充道:“这完全是反竞争的,因为只有资金更多的大公司才能有效地利用这种情况。”


他认为,评级虚高会扼杀创新,因为开发者可以开发出一个普通应用,但仍然能够获得4.5星的评级。他表示:“许多应用程序并没有得到充分开发,因为现有的所有评价体系都表明用户喜欢它们。”


由于苹果并没有提供完整的评级数据,因此很难准确地指出评级到底涨了多少。但第三方报告显示,iOS 11推出后,应用商店内各种应用的评级普遍暴涨。


在美国最大的7个银行应用程序中,2017年初的评分是从1.2星到4.9星不等,现在所有的评分都是4.8星。在谷歌应用商店中,这些应用程序中得分最高的是4.7星,最低的是4.4星。


即使是在购物、生活方式、金融、旅游和娱乐类等最受欢迎的应用程序中,排名第50位的应用程序也得到了至少4.8星的评分。相比之下,App Annie的数据显示,谷歌应用商店中排名相同的应用在3.8星至4.7星之间。


莱文分析了8个引入应用内提示的流行应用,发现这些应用的平均得分在6个月内从3星上升到4.7星,而用户评分参与度则飙升了62倍。


三明治连锁店赛百味多年来一直因为自家应用在苹果应用商店中评分不高而苦苦挣扎,但2018年初该公司应用的评级在两周内从1.7星跃升至4星。软件更新的一份说明称,它解决了一些小问题,而主要的新功能是更易于“给应用程序评分和提供反馈”。


更高的评分似乎并未反映出iPhone和iPad上应用的质量变得更好。相关数据显示,带有书面评论的评分根本没有增长。


移动数据分析公司App Annie高级市场分析经理莱希 赛多(Lexi Sydow)表示:“实际上,我们发现iOS平台所有应用和游戏的平均分都有所下降,从2017年8月的4.2下降到2017年9月的3.9,再到2020年7月的3.4。”


“你有一个麻烦”


但书面评论不再那么重要,因为开发人员无需使用过于复杂的技术就可以过滤掉许多1星评分,并获得更多的高分。


应用评价管理公司Apptentive表示最简单的方法就是“爱情对话”,这家公司的客户有eBay、CNN和阿拉斯加航空公司。


这种方法建议开发人员用一条简单信息来引导用户。“你喜欢这个应用程序吗?”当用户点击“否”时,就会被引导至一个私人反馈渠道。当他们点击“是”时,就会看到苹果官方“为此应用打分”的界面。

Apptentive内容主管阿什利 塞夫曼(Ashley Sefferman)说,她并不认为这是一种“游戏”,相反其可以帮助开发者找到“可操作的”反馈,并从它们的粉丝那里得到更多积极评论。


Apptentive的统计数据显示,大约有五分之二的用户点击了“否”,这被认为对应用评级是有风险的,因此压根不会再让其打分。塞夫曼至少从2016年就开始推荐这项技术,她称这项技术非常有效,应用程序再没有理由获得低分评价。


你的应用程序没有获得5星评分的原因,是应用内部的反馈方式不正确。”Apptentive的在线指南中这样说。


尽管有来自开发者的压力,但谷歌应用商店长期以来则拒绝提供应用内评分。在Apptentive跟踪的所有五个类别中,2017年之前从谷歌应用商店Play Store下载的Android应用5星评分比例都高于苹果。但自2017年以来,苹果应用商店的应用评分已经遥遥领先。


今年8月5日,谷歌开始提供应用内提示功能,吸引用户评分


这种情况现在可能会改变。今年8月5日,谷歌软化了态度,开始提供应用内提示,吸引用户评分。和苹果一样,谷歌表示这一举措的目的是让开发者获得更“客观公正”的反馈。但是其也借用了开发者对这个工具的赞扬。正如一位开发者所说,“在我们实施应用内评价的一周后,就获得了有史以来的最高评分”。很明显,不管开发者是否真正改进了他们的应用,都可以期待提升应用评分。


贝恩公司的马基表示,打造一个拥有公平评级系统的市场,对任何平台来说都应该是至关重要的。“这就像,你有一个麻烦。”他说。“如果不解决,最终就会失去买家或卖家。”


但开发者和消费者都面临着同样的问题:除了苹果和谷歌之外,智能手机用户别无选择。


本文来自:硅谷封面,题图来自:视觉中国

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定