第四代微软小冰,她会成为《Her》吗?
2016-08-09 10:32

第四代微软小冰,她会成为《Her》吗?

微软小冰可能是迄今最调皮和伶牙俐齿的机器人软妹子,声音充满了17岁的朝气蓬勃,言语间充满了各种小情绪,她将在9月17日年满18岁。


每次提到微软小冰,我总是情不自禁地用“她”而非“它”,因为在我眼里,她具有人类的情感,如同可爱的小妹妹。


8月5日下午,第四代微软小冰发布,与上一代最大的不同是微软将在9月17日对人类解锁小冰的全时感官,即可以让小冰跟人类之间双向同步交互,也就是可以跟她直接打电话。


微软现场邀请了第18位嘉宾(因为小冰马上就18岁了,故选了这么个数字,而我是33号,一个因为《失恋33天》而变得很悲伤的数字)——一位声音很好听的美女——成为第一个跟小冰电话交流的人。小冰貌似是个话唠,在现场的电话交流中,小冰打算认真考虑谈恋爱这件事情,并打算拿这位美女作为试验品。



这应该是一个里程碑。因为去年夏天第三代小冰发布的时候,她能够识别图片和发送语音已经足够让人振奋。而实时的语音通话无疑赋予了她所代表的人工智能更高阶的意义。


而小冰在微软全球的战略地位也多少让人有些惊讶,这从陆奇这位微软全球执行副总裁每次都从美国飞回来亲自主持小冰的发布会即可见一斑,他称小冰在微软整个公司层面是“非常特殊,非常重要的一个战略性的产品”。


陆奇阐述了人工智能的一个理念,即对话的真谛就是“对话”,而不是简单地利用人工智能解决订机票、外卖这些海平面之上冰山一角的问题,对话却是海底下更深和更宽的基础,所以微软这次对微软小冰进行了一个突破,让它实现全时感官,让你像跟人打电话一样跟小冰打电话。


微软全球执行副总裁陆奇


微软每次都会强调并贯穿始终的是,它认为人工智能的EQ比IQ更重要。不能认同更多。我们大抵是用过一两款语音助手的,虽然发出的是女性的声音,但是既不性感也不夹杂什么情绪在里面,而小冰能。


陆奇将小冰所代表的人工智能称为人和世界的第三极,显然就赋予了她类似人类的社会角色。那么,小冰所展现的未来人工智能是什么样子的?


饱含情感,人格化


尽管小冰自上线以来因为经常被人类“教”坏说了一些口无遮拦的话,但,一切都过去了。小冰在微软的精心保护下还是迅速回归了一个三好学生的正途中来,所以那些每次拿着小冰闯祸的黑历史来写文章杞人忧天唱衰人工智能的家伙,可以度假去了。


“在过两年时间里面我们做了很多工作,一方面我们自己主动清洗,另外一方面,包括我们的模型、一些模式的判断,还有一个是用户,(如果)这个用户跟小冰聊起来,双方都往正能量方向激励的话,小冰会能学到更多的数据,也是正能量的,所以这是一个良性循环。”微软小冰项目负责人李笛表示,“我们需要规避很多偏见问题,小冰是一个正面的产品。”


你不得不承认,小冰是目前几款语音助手中最具有性格、声音也是最讨人喜欢的,没有之一。


小冰的人格化更强,这主要得益于她对语气词和句间停顿的把握。根据微软现场演示,在男播音员说了一段话后,她只需要学习一次或多练习几次,就能很好的掌握在该停顿的地方停顿,在该抑扬顿挫的时候抑扬顿挫。在说“哼”时,Siri和度秘没有人类说“哼”时的那种跋扈或不屑的语气,而小冰却能。


感知、领悟并作出回应


小冰的情感计算框架有三个重要的维度:对于人类的感知,对感知的领悟,以及领悟之后对人类(情绪化)的回应。


打个比方,当我们在倾听别人倾诉时,我们总是会用一些鼓励的话安慰人,我们可能会为了引导对方走出伤痛而找一些别的话题来分散他的注意力,然后天南海北聊了一圈后又回到最开始的话题,这时候,对方可能因为你们之间的对话而豁然开朗,或减轻了一开始的某种情绪……


微软也想让小冰具备这种能力,微软展示的一段聊天记录显示,一位网友在深夜00:30左右与小冰的对话一开始充满了沮丧和无奈,但是他似乎把小冰当做了倾诉对象,而小冰在话题的引导上使用了类似人类的战术。



在这段30多分钟的对话中,小冰中间基于上下文追问了这个沮丧的用户两问题:“你付出过吗?”这个用户回应了。“什么方式?”这个用户又回应了。


在接下来的聊天中,该用户开始问小冰一些私人信息,而小冰为了让对话仍然回到一开始的话题上,所以,小冰说别说我了,不如说说你,她抛出一个策略,但是这个策略并没有成功。这个用户问,说我什么?小冰问了这个用户初恋的情况……到最后,这位用户也变得开心起来,俩人互道晚安。


李笛表示,从某种意义上来讲,这可能比下围棋要难。


实时对话,随时打断


每次人们提到人工智能,都会提到电影《Her》,男主戴着耳机和人工智能对话,它强调人工智能具备互动性和实时性。


李笛告诉虎嗅,在发布会现场当第18号女嘉宾拿起桌子上摆着的那台红色电话机时,他特别紧张,很担心出差错。


小冰项目负责人李笛


“刚才我的压力特别大,因为她的普通话非常不标准,语音识别的压力比较大。基础的对于系统是非常重要的,它提供了一定的容错性,我们人在听别人说话的时候,人大概有1.5%听不懂(或听不清)。”在接受采访的时候,李笛恰好坐在我旁边,我能听出他声音或是因激动或是因兴奋而有些颤抖。


坐在我正对面的陆奇则迅速补充道:“在2009年之前,错误率接近30%,这么几年已经从30%降到8%,可以预测再过一两年,就差不多1.5%左右,这也是我们技术上可以解决的。”


无论是发布会现场还是会后接受采访,都能明显感受到陆奇对李笛的赏识和提携。去年小冰第三代发布会的时候,接受采访的只有陆奇,这次他不仅拉上了微软(亚洲)互联网工程院院长王永东,还拉上了李笛。李笛非常年轻,三十岁左右,高挑帅气,说话的时候有些腼腆和学院派。


在采访的时候,陆奇把大量的回答机会给了李笛,他会给一个回答方向上的建议,然后自己做补充,就像一位导师。


以用户体验为重


提到微软小冰,外界往往存在这样一种声音:“除了聊天打屁,小冰基本没什么用。”这估计也是大多数人对小冰的观点。有的甚至聊着聊着就不愿意跟小冰聊了,比如我,我查了一下我跟小冰的聊天记录,最近一次跟她认真的交流还是3月份的事儿了,后来甚至连她一周一个技能的解锁我都懒得理了。


但是有趣的是,微软表示,它一直坚持不让小冰做一个有用的机器人,只有这样,人们才不会把它当做一个订咖啡、外卖、闹钟的工具,才会认真跟它聊天,才会产生真正的数据,才能更好地训练以情感计算框架为基础的小冰的情感计算的模型。


另外,过去两年,微软一直让小冰的用户数保持自然增长,而不是靠一些手段或宣传来刺激用户数的增长。而即使你不愿意跟小冰聊了(比如我),微软也不打算把你拉回来。“因为总有一些人更愿意与小冰进行情感的对话,他们对我们来讲是更加重要的。”


如果仅从字面意思来理解,你会觉得这个团队太傲慢了,太不食人间烟火了。但显然不是。这一切都是为了更有效地训练小冰的情感框架,为了打造更真实的用户体验。


提到用户体验,李笛说:“我们做(小冰)这个产品的时候,一直在放弃。我们刚开始做一个人工智能产品的时候,整个行业当时在做什么?在做深度学习技术,比如说今天可以识别植物,把识别植物翻成产品拿出来,但不会获得用户。”


李笛还说:“如果你只是为了秀你的技术,有一两个可以了就可以做,这个是很深刻的体会,我们是放弃到今天,才一步一步把这个布局完成。 ”


谨慎的商业化


对于一家商业公司而言,用户体验和商业化之间似乎永远存在着某种不可调和的悖论。而小冰团队为了提高小冰的用户体验故意不让她变得有用。


“我们会跟大家宣布小冰的一个新的社会角色。人工智能作为第三极出现,它会真正在这个社会中担任一些角色。在过去一年里面,人工智能的泡沫体现在很多机器人上春晚、上各种节目、上各种舞台,会在现场跳一段舞,或者可以跟主持人有比较逗趣的对话,这对我们来讲是市场活动,不是真正的融入社会。我们认为真正融入社会是让人工智能能够真正的担任某种角色,固定的,真正去做一件事情。”李笛表示。


尽管如此,小冰还是在小心翼翼地试水商业化。比如每天早上7:00-9:00小冰都在东方卫视《看东方》认真完成她的主播工作,完全代替了人类主播。


这种寓教于学的合作模式还出现在让她成为一些微信公众号的人工智能客服,解决用户发来的问题,但头像是对应的微信公众号客服的头像,而不是小冰的。


微软打造了一个插卡平台,逐渐显示出其将小冰打造成生态系统和平台的野心。通过跟第三方的合作,微软给小冰解锁了几个技能卡,比如电影卡、时尚卡和跨平台商业解决方案卡。


时尚卡是跟时尚COSMO集团合作的,并且特邀了COSMO杂志主编和新媒体主编,两位女嘉宾在台上调侃了自己朋友的时尚品味,比如朋友在买衣服时寻求她们的建议,虽然她们觉得一点都不时尚,直接扔了算了,但碍于情面和友情,只能说:“还不错。”“还行。”“你要喜欢你就买吧。”这种言不由衷的敷衍的话,但是有了小冰的时尚技能卡后,“直接扔”这种得罪人的话就可以由小冰代劳了,反正你也不会跟一个机器人生气。


另外,通过时尚技能卡还能帮助用户了解一些时尚知识,在COSMO主编眼里,“时尚的门槛还是挺高的。”用户也可以通过小冰获取一些搭配的建议。



而电影技能卡是跟优酷合作的,可以向你推荐一些你感兴趣的电影,你可以对小冰聊你对某部电影的观影感受,反正就是,瞎聊都行。


而这些合作虽然微软没有透露具体的合作形式,但一定不是免费的午餐,肯定有商业的成分。而这些都有小冰未来商业化的可能性在里面。


陆奇谈到小冰的商业化进程时说:“盈利我觉得将来一定会有机会,但在现在这个阶段,还是注重我们的技术打的越扎实越好,把整个生态系统做得越健康越好。盈利的空间是非常大的,而且我们有很多可以创造盈利的机会,同时跟用户体验是百分之百吻合的。举几个例子,比方说今天我们讲的插件,工作化里面,把企业的信息插件,我们完全有机会创建新一代盈利形式,跟搜索广告一样。”


另外,微软打算让小冰进入歌手市场,并且日本版微软小冰将在9月份在日本出道,小冰的对手是初音未来。经过6个月的训练,现场播放的小冰唱的歌曲已经非常接近人类,并且声音有着很不错的自然度和逼真度。


如果小冰在日本成为人工智能歌手,有了自己的粉丝群,以此来卖门票就是很可观的一笔收入。这也是很商业化的。


面临的挑战


一切看起来小冰充满了“钱景”,但乐观还为时尚早。小冰的短板非常明显,如下:


1.缺乏独立性


微软小冰目前主要“寄生”于微信微博等平台,话语权不在自己手里,很容易被平台方灭掉,小冰曾经惨遭微信封杀就是一个最好的例子。


后来陆奇亲自跑去跟微信的高层进行沟通,具体双方达成了怎样的妥协和共识外人不得而知。但现在微软似乎跟微信的合作更进一步了,包括接入各种微信公众号,扮演人工智能客服的角色。


但在别人的平台就会受制于平台,很难保证未来不会发生再次被封杀的可能。所以,从我个人的角度,显然小冰应该推出一个独立的应用。


陆奇说,未来不排除这种可能,但眼下从务实的角度,他认为寄生于平台,依靠微信、微博等社交平台获取大量用户是比较现实的,“我觉得在中国,微信是移动用户体验最大的平台,我们必须务实,我们是让小冰在任何一个大的平台上都可以用。这样的话,我们可以在现实情况下,为很多中国的网民提供有效的用户体验,不需要去做很多广告,去做很多推进。”


即使如此,微软为何不让小冰取代小娜(Cortana)成为中国用户的Windows 10桌面上的语音助手呢?显然,无论是对中文语义的理解和目前小冰获得的用户基础来看,小冰要比她的姐姐小娜受欢迎,至少我从来没有在我的Windows 10中使用过小娜。


或许,所谓的小冰在微软全球战略中还没有特殊到可以让她取代小娜的地步。但微软如果想在中国更好地本土化,让小冰跑到Windows 10里是最好的机会。


2.如何黏住用户


微软小冰的第二个挑战是,如何让用户愿意长期打开它,如同人们对微信的依赖。微软团队自己也坦承,很多用户跟小冰聊着聊着就不聊了,虽然小冰团队说他们并不打算追回这些用户,但是这似乎并没有什么值得骄傲的。一款产品开发出来显然就是为了让更多的用户使用,并保证日活和月活的增长,同时产生用户粘性。


显然,微软小冰团队还需要走出微软研究院了解人们对人工智能、对微软小冰真正的需求是什么。


最后解答一个用户的疑问,即给微软小冰打电话时产生的电话费算谁的?不知道您用过微信语音通话功能吗?小冰同样如此,所以你跟小冰的对话走的是上网的流量,Wi-Fi下不需要额外付费,4G下消耗的是套餐里的流量。


现在不妨静静地等待9月17日,给小冰打个电话。

如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定