下一个大计算平台?亚马逊 Echo 研发幕后全揭露
2016-06-03 07:34

下一个大计算平台?亚马逊 Echo 研发幕后全揭露

【导读】作为亚马逊打入智能家居并占据入口地位的标志产品,Echo的研发历程一波三折。本文作者采访内部一线人员,得到Echo问世幕后消息:亚马逊最初瞄准AR,不成后转做声控扬声器,Fire Phone的失败让这款产品成了亚马逊语音控制的出口,发货时间一延再延,偶然之下被定位成智能家居入口型产品,最后关头做出5大改变。文中能看到亚马逊产品研发流程、员工待遇,还有杰夫·贝索斯其人其心的剪影。本文来源:bloomberg.com ,作者:Joshua Brustein ,新智元 米粒 翻译。


告诉杰夫·贝索斯(Jeff Bezos)他有错是件令人恐怖的事情。2014年秋天,亚马逊全新语音控制扬声器的开发团队认为,他们需要去跟CEO好好谈一谈。扬声器的发布迫近,大部分事情准备就绪。设备外观看起来很不错,声音识别软件也有了飞速提升,连发货的箱子都已设计并组装好。但是,有个悬而未决的问题,那就是印在盒子上的名字:Amazon Flash。


据两位亚马逊前雇员所述,在亚马逊硬件部门126实验室工作的很多人都不喜欢Amazon Flash这个名字。然而,贝索斯十分钟爱这个名字。此外,还存在另一个顾虑:这款设备的核心功能是通过“唤醒词”开启语音指令。“Alexa”是两个候选词的其中之一。贝索斯认为最好的唤醒词应该是“Amazon”。而这就带来了问题,因为人们常说这个词。126实验室达成的共识是,这个项目有可能正朝着灾难性的方向急速发展:扬声器会在听到电视中亚马逊的商业广告后便自行启动,然后开始随机在网上购物。


一般情况下,126实验室的工程师与产品经理会在平息分歧之后才找贝索斯会谈,而不是聚在一起告诉老板他们认为老板想要的是什么。据一位前雇员所述:“我们花费了很多时间努力揣测杰夫想要做什么或说什么,拼命分析他在会议上的发言,想从字里行间读出他的想法,这为我们带来了很多额外的工作量。”


把事情变得更糟糕是126实验室那个夏天的整体气氛。亚马逊在2014年7月发布了与iPhone竞争的Fire Phone。在扬声器研发的最后冲刺阶段,Fire Phone一败涂地,整个实验室那段日子举步维艰。员工要么转到新的项目中,要么辞职,这感觉就像126实验室跌到了谷底。


在扬声器装好准备发货的几周前,反对者找到贝索斯摊牌。贝索斯愿意做出转变:这个设备改称为Echo,唤醒词是“Alexa”。用户之后可以根据自己喜好把唤醒词改为Echo或Amazon。Amazon Flash的包装盒被销毁,首批扩音器在2015年11月份发货。


亚马逊Echo概览。图片来源:geekwire.com


在一个满是长方形触摸屏构成的硬件市场里,Echo确实与众不同。这款扬声器是一个没有屏幕的圆柱体,高约9.25英寸(约23.5厘米),直径3.27英寸(约8.35厘米)。它能够播放音乐,回答一些基本的家居问题,例如一个茶杯有几个茶匙。与Echo互动的唯一方法是与它交谈,它也随时待机等候唤醒词。


Echo一经推出,就有批判者跳出来取笑亚马逊。有人称它为无用的噱头;另一些人则指出这是亚马逊“乔治·奥威尔倾向”的证据。紧接着,一些奇怪的事情发生了:人们开始喜欢上Echo。亚马逊从来没有披露过有关该产品销量的数据,但是2016年4月Consumer Intelligence Research Partners发布的一份报告指出,亚马逊Echo的销量已经了超过300万台,其中有100万销售是在2015年圣诞节假期间完成的。约有3.5万人在亚马逊网站给这款扩音器打过分,评分有4.5星之高,满分为5星(注:新智元编译这篇文章时查看评分为4.4星)


对于亚马逊而言,更重要的或许是有几十个独立开发商都在编写可供Echo语音控制使用的App。用户可以说一声Alexa来关灯,询问它自己汽车里还剩多少汽油,或者预订披萨。考虑到亚马逊在研发Echo时其语音控制与苹果及谷歌之间的差距,这就更令人吃惊了。起初Echo看起来可能只是一个多余的玩具,但是现在看来这成了亚马逊进军人与计算机和互联网交互入口的一种方式。


“我们想成为一家大公司,同时也是一家发明工厂”,贝索斯2016年4月在一封给投资者的信中这么写道。Echo展现了亚马逊实现其目标后所发生的事情。贝索斯拒绝接受有关Echo开发过程的采访,但是10位亚马逊的现雇员及前雇员同意接受访谈,鉴于他们没有获得公司的授权,大多数以匿名形式进行。接下来就是亚马逊开发Echo的真实故事。


铺垫6年的专利战


亚马逊在2004年设立126实验室打造Kindle电子阅读器。实验室名字的由来参考了字母表,1表示字母A,26表示字母Z。实验室的人有时候把Kindle叫做项目A。Fire Phone是项目B。Echo——作为项目D——始于2011年。在项目高峰期,西雅图、旧金山湾区及马塞住萨州剑桥省,有几百名雇员为项目D效力。


Echo的构思是项目C的衍生物,许多Echo的早期员工都来自项目C。尽管这个项目已经停止,但亚马逊十分关切让有关信息保持机密。不过,可以从126实验室工程师所申请的专利中对项目C略知一二。


首次行动是在2010年12月21日至23日之间出现的。126实验室的雇员在此期间申请了5项标题包含“增强现实”一词的专利。增强现实——把类似全息图的展示投影到现实世界中来,已经是当时的一个流行词语。一家电商公司不大可能成为该领域的标杆。但是,亚马逊的专利申请向我们展示了亚马逊早在6年之间便开始追寻一个愿景,这个愿景远远超出现今市面上的任何商品。


其中一项最初的专利申请描述了一个可以显示增强现实图像的设备,人可以与这些图像进行互动;另一项则是在人们鼓掌、吹口哨、唱歌或说话时候,对人的动作与反应进行追踪的设备。总体来看,亚马逊在这段时间所申请的专利都描绘智能家居的愿景,虚拟显示器跟着人从一个房间走到另一房间,根据语音指令和肢体语言为人提供相应的一系列服务。贝索斯自己也是此期间申请的两项专利的发明者,都跟语音控制或增强现实有关。



亚马逊并没有染指原始专利申请,Rawles有限责任公司是这些专利的受让人,也就是拥有专利的机构。Rawles恰好是在亚马逊开始提交有关增强现实专利申请的两周之前在特拉华州注册成立的。自那年起,126实验室员工提交了数十项以Rawles为受让人的专利申请,全部都与增强现实或语音控制有关。在LinkedIn上没有人把Rawles列为雇主,而Rawles公司与美国版权与商标局来往的信件均由华盛顿州的律师来处理,而亚马逊的总部正好就在华盛顿州。


“毋庸置疑,我们想要悄悄做事情,”亚马逊设备高级副总裁Dave Limp说:“除非产品问市,能从中获益的只有竞争对手,或许还有媒体。”


用Rawles做专利掩护并没有把保密工作做得很彻底,但这确实让它更难被察觉。这样的策略似乎起到了作用。尽管围绕着亚马逊智能手机及机顶盒研发进度的猜测早在这些项目开始前几年已经有了,但亚马逊以增强现实为核心的智能家居野心仍不为人所知。2015年11月,Rawles把106项专利转到亚马逊名下。一个月之后,美国版权与标签局批准了其中一项专利,引发了媒体一小轮的关注。那时候,虚拟现实项目已破冰而出,Echo已上市。


整合购物的每一个环节


一些曾经在项目C工作的员工感叹,项目C的失败是亚马逊雄心放小的信号;其他人则说,亚马逊只是意识到是时候放弃一些对处于全盛期的公司而言太过愚蠢的想法。据称,直到Fire Phone一败涂地导致126实验室的管理层质疑其领导特大项目能力的时候,项目C才彻底终止。但是Echo早在此之前就脱离出来,作为独立项目运作,其目标是开发一款不会太过科幻的商品。


按照最初的设想,Echo要比当前的扬声器更简单、更便宜。据效力于该项目的一位员工回忆,公司预计该设备的生产价是17美元,售价为50美元。现在Echo的成本是180美元,如果把包装、运输及市场推广等费用计算在内,市场分析人士认为亚马逊每卖出一台Echo都是在亏本。亚马逊公司拒绝就此发表评论。


当时,人们还不清楚这款扩音器的主要用途为何。当然,它可以用来播放音乐,但是除此之外,人们为何想要一个可以交谈的扩音器呢?贝索斯有很多的想法。“围绕该设备的功能几乎有一个非理性的预期,”据一位当时在126实验室工作的人所述:“杰夫有这样一个愿景,他想要整合购物体验的每一个环节。”



亚马逊聘请了几位曾经在语音识别公司Nuance工作过的人员,也收购了两家专门从事语音识别的初创公司Yap及Evi。亚马逊的工程师全身心投入开发一个能够和谷歌Now或苹果Siri相媲美的语音识别系统,通考虑到这两家公司已经取得的成就,这实在是一个艰巨的任务。


当亚马逊的工程师开始制作这款扩音器的时候,他们立马就意识到该设备需要比预期更多的处理能力。他们抛弃了微型控制器,一种用于控制设备的简单计算机(例如遥控器),改用能够处理更多复杂任务的微型处理器。进行了这些根本性的改变之后,实验室的负责人还是深信扩音器已经做好上市准备。在连续3年的时间里,这款产品的预期送货时间都停留在6个月之内。50美元的定价变得越来越牵强。


效力于126实验室不同项目的员工对其他正在进行的项目的情况并不了解,因此,Echo团队在数年时间里并不清楚其他实验室人员正在开发一款电话,其他团队情况亦是如此。2014年6月,当贝索斯推出Fire Phone的时候,扩音器项目进展十分顺利。但Fire Phone的失败让126实验室的一切偏离了原有的轨道。


亚马逊对于Fire Phone的官方说法是,偶尔跌倒也是工作的一部分。在他最近给投资者的信中,贝索斯把此次失败看作是发明不可以分割的一部分。Limp表示,Kindle与Fire TV受欢迎是团队的慰藉。他说:“看到产品受客户预料之外的好评与产品不受待见相比当然有很大差距。”


曾经在那个时候效力于126实验的人把那个时期描述为极其痛苦时刻,完全是对该部门集体自信心的一种摧残。亚马逊并没有立即解雇为Fire Phone 效力的员工。取而代之的是一小部分管理人员空降Echo团队,这些人对扩音器有着不同的看法,怀着不同的热情。这激怒了一部分从开始就一直参与该项目的员工。此外,这款扬声器不得不挽回亚马逊的声誉,而这也构成了压力。更糟糕的是,所有这些的发生使整个实验室疑云四起:或许亚马逊确实无法生产理想中的高端消费产品。


最后关头5大改变


Echo在最后关头经历了几次大的关键改变。这款扬声器必须要拥有在同一时间发声与接听指令的功能,这对工程师而言一直是个问题。如果音乐声音太大了,掩盖了人的声音怎么处理?研发初期,工程师设计了一些外观像冰球一样的小型样机,可以放在房间各处,在用户偏离主扬声器太远的时候接收指令。实验室的负责人把这个想法置于一边,而把重点放在主设备的研发方面。但是,这个想法在近期变身成为了Echo Dot。亚马逊于2016年3月发布了Echo Dot, 该产品目前以限量形式发售。


Echo 产品线的两款新品:Amazon Tap(左)和 Amazon Dot


在2014年秋天,有关于Echo自身听力是否足够好仍然存在分歧。除了扬声器自带的声音控制输入模式以外,贝索斯及其他顶层高管坚决反对使用任何其他形式的输入模式,他们将其视为作弊行为。一些工程师不这么认为,他们力推遥控器,以便人们可以在房间的任何角落进行语音输入。好在亚马逊已经为Fire TV做了这么一款遥控器。双方最终达成共识,第一批扬声器会配置遥控器。之后工程师收集了关于人们使用频率的数据,并相应对产品做出了调整。显然意见,这种担心似乎是多余了。用户使用Echo时几乎从来没有使用过遥控器,因此,在之后的配送中原装盒里不再配有遥控器。


2014年年末以前,126实验室都没有关心过要把Echo与其他公司生产的互联网功能电灯泡与温度控制装置相匹配。有位工程师闹着玩,把扬声器当作一部流媒体电视设备的声音控制系统。据某位与贝索斯直接共事的雇员所述,这如同给了他当头一棒。那人说,贝索斯越来越中意这个想法,而且很积极地推进它。亚马逊现在对Echo的愿景很大程度上依赖于这个扬声器作为所谓智能家居的中枢。Limp开玩笑说,让跃跃欲试的开发人员写程序用Echo声音控制来冲马桶只是时间上问题。



许多曾经参于开发Echo的人已经不在亚马逊工作。他们离开的原因各种各样:做完某个大项目后的完结感;竞争对手高薪挖墙脚,或开始自己尝试制作一些东西;长期工作后的倦怠;多年来内部政治斗阵的苦楚。接受采访的前雇员对于在亚马逊工作是不是很残酷这一点没有一个闪烁其词。当被问及参与例如Echo产品工作是否真的“有趣”,某位前雇员嘲笑说,没有人会正儿八经用“有趣”形容亚马逊。


Echo的成功正吸引着代替这些离职员工的人。2016年2月,亚马逊在总部一幢建筑里举行了公开招聘会。数百名序员与工程师出席——他们之中的很多人来自微软。他们听取了亚马逊高管所做的有关公司未来发展的雄大计划,将亚马逊的语音控制扬声器作为连接所有市面上已有和将有互联网功能设备的纽带。“现在是让智能家居成为现实的时候了,”Alexa智能家居总监Charlie Kindel告诉与会者。


手机之后的下一个平台


在开发了Echo后,亚马逊已想出了如何通过其他设备与服务来把自己加入客户的互动中来。这一部分归因于好的时机。科技行业早已在寻找手机之后下一个大计算平台。目前对一些语音控制与人工智能相结合项目还没有出现大规模投资。苹果、谷歌及微软均拥有属于自己的虚拟助手,他们设计虚拟助手的目的是为了让智能手机更好地运作。但Echo与过去这些案例有着很大的背离。


在某种程度上来说,Echo的成功是Fire Phone失败的一个结果。亚马逊扼杀了智能手机项目,它在语音控制上的努力注定要放在其他方面。虽然智能手机已被吹捧为带来方便的巅峰之作,一边拿出手机点开某个App查询天气,一边给衬衣扣上扣子,跟在房间里喊一声相比,工作量其实还挺大的。


Alexa有超过500项技能——你可以通过这款扬声器来查询银行账户余额、播放Pandora电台,或发出你孩子喜欢的动物叫声。公司存有一个内部记录,上面列有客户提出的新增操作建议,根据受欢迎程度排序来确认执行顺序。


亚马逊下一步大的任务是要开始尝试提供组合服务的新路子,ForresterResearch的分析师Julie Ask表示。她说,能够告诉Echo去Uber打车很有趣,但不是必需。“5年后,我的Echo会说,嗨,现在到点要去机场了。需要我帮你叫辆车吗?我会说,好,”她这样说:“这就是现实与希望之间的差距。”


作为一家公司,亚马逊更愿意面对这些挑战,而不是退回去解决Echo开发过程中那些没有解决的问题。Limp似乎更愿意大略描述Echo的开发过程,但谈话中涉及具体时总会闪烁其词。对他而言,整个开发过程最显著的一步就是减少了滞后时间,也就是你向Echo提问之后,它作出反应的时间间隔,从约9秒缩短到1.5秒。他声称已经不记得最后时刻有关为扬声器命名焦虑的任何细节,唯一记得的是最终大家达成了共识。


他说:“我向你保证,杰夫喜欢Echo这个名字。”


新智元:智能+中国的资讯社交平台,致力于推动中国从互联网+迈向智能+新纪元。转载请联系公众号:新智元(AI_era)获得授权

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定