中国Siri们的出身与出路问题
2012-12-19 07:35

中国Siri们的出身与出路问题

iPhone 4S在发布之初,本被认为是苹果智能终端中最鸡肋的诞生,但事实证明,当时作此想的人们,都低估了Siri的价值与象征意义。

支撑Siri语音识别技术的Nuance公司,其CTO Vlad Sejnoha,曾如是说:“语音和自然语义理解突然成为一门前沿科技,而我们正站在这个过渡点上。我认为语音识别将真正颠覆目前的计算机交互接口。”

全球当然不能只有一个Siri,或者再加个Google Now。中国智能终端上的语音入口在哪里?

今天,虎嗅来为国内的Siri们做一番梳理。

常识普及
 
在历数市场上的玩家前,我们应该先来一下常识普及,看一下一款语音应用都会由哪些组成部分。第一步:当声音传播至移动设备时,语音应用的第一项技能语音识别功能开始运作了,在将声音正确的识别出来转化成相对应正确的文字,可以算是语音应用最基本的步骤。第二步:进行的则是对语言文字意图的匹配,也是语义解析,这一步需要根据自然语言处理技术和大量的用户反馈数据积累,才能把它做精准。中间包含更智能更复杂的连续上下文的语义识别。第三步:是在语义识别后,在手机应用控制外与数据的更深度结合,也称内容问答,诸如天气预报、航班、美食便是在这一步骤中形成的,这里容易形成长尾效应,需要更多的应用覆盖来完善。
 
近日市场上炒的较为火热的语音应用包括科大讯飞的灵犀、搜狗语音助手、智能360、虫洞等等,还有几天前盛大发布的“百灵语音助手”。

其实如果细数,目前,在中国市场上的语音玩家,大致可以看到“一全”、“两强”、“四小虎”的分布。

“一全”:科大讯飞,用ToB养ToC
 
对于科大讯飞,人们更熟悉其旗下的软件“讯飞语点”与“讯飞语音助手”,当然还有近期和中移动联合发布的“灵犀”产品,而这三款产品均隶属于科大讯飞的“移动互联网事业部”。该事业部是科大讯飞旗下六大事业部中唯一参与ToC业务的、也是科大讯飞最年轻的事业部,同时还是科大讯飞上市公司旗下唯一不产生营收的事业部,其余的五大事业部均从事ToB业务。
 
考虑到未来在移动互联网上的发力,据科大讯飞副总裁江涛介绍,公司已将移动互联事业部独立注册了公司命名“讯飞互联”,并考虑未来可能会拆分甚至独立上市,江涛同时兼任“讯飞互联”的总经理。
 
在科大讯飞的ToC业务外,负责研发的讯飞研究院、负责电信级合作的平台事业部、负责汽车与手机服务的嵌入式事业部、负责音乐教育领域业务的通信增值事业部以及关注国家安全应用的行业软件事业部等五大ToB事业部才是上市公司年超10亿营收的来源,如果将这些业务精细到日常的生活中,无论是唱歌打分系统、词典的语音合成系统、普通话测试系统,还是国家安全语音识别都有着科大讯飞的身影。按照江涛的解释,科大讯飞目前的三大业务核心分别是:①解决人人、人机的无碍沟通,②深挖教育领域,③着眼于国家安全。
 
从科大讯飞传统的业务上可以看到,科大讯飞的主攻更多的是在语音识别和语义处理方面,至于内容问答的积累,显然不是讯飞的强项。而从骨子里彰显ToB气质的讯飞,在ToC业务上实际上宣传进程并不尽如人意。
 
尽管公司在北京的注册资金高达5000万,但讯飞互联的架构仍处于ToC模式的初级阶段,如目前公司并无独立的市场和公关部门,这也意味着在市场费用的调配上一切听从偏安合肥的母公司调配,导致产品市场推广力度有限。比如科大讯飞移动互联网产品推出一年多月以来,除了根据公司创始人兼CEO刘庆峰的直接指示,在某互联网垂直媒体上投放过一段时间的广告外,无论是社会化营销还是媒体投放上,科大讯飞的ToC产品均无更多的表现。公司副总裁江涛也坦承:“的确在初期,我们的市场步伐慢了些。”
 
借用同样由ToB向ToC转型艰难的,华为终端CEO余承东的话是:
 
“一张白纸好作画,一旦有习惯定式的思维就不好作画。我们的员工素质非常好,整个公司实力也比较强,技术积累也很深厚,各方面都不错,但是需要的是改变思维习惯和思维模式。”
 
不过,在中国移动13.6亿元认购科大讯飞15%的股份后,如果按照明年中移动3G智能终端销售过亿,同时30%的自有渠道出国量来计算,即便科大讯飞市场费用为零,也同样会有3000万的预装机量,由此可以说,科大讯飞将成为微信后了第二个拿到移动互联网巨头入场券的企业。
 
“二强”:百度、搜狗的瑜亮秀

和员工近2000人的科大讯飞比,百度与搜狗在语音方面的投入仍是轻量级的。

它们与讯飞相比,显现出相似的竞争优劣势。识别方面,二者无论投入如何,在短期恐怕与科大讯飞都会存在者一定差距,但在内容问答较量中,百度搜狗在搜索和服务数据积累上的优势无疑成为科大讯飞的痛点。
 
正是基于此茹立云才在接受采访时,直接指出,搜索引擎厂商比Siri能力强在以下3个方面:
 
“第一是本身手机语音识别和意图识别,搜素引擎做了多年。第二,搜索引擎有很多开放平台数据,比如天气预报、航班、美食数据都可以接入进来,问答数据也可以接入进来,Siri的问答数据则需要手动补充;第三,大的搜索引擎厂商都有自己的知识图谱系统,能做精准化演算,Siri则有局限性。”
 
如果将上文中的Siri换做讯飞,似乎也不错。

不过,在与讯飞PK之前,百度与搜狗其实是更直接的对手(从目的性上,科大讯飞更注重人机沟通层面,而百度和搜狗则是更注重最终的服务生态,它们与讯飞根本不是一个层面的战争)。搜狗胜在快。但百度的胜算在于其搜索的积累与知识图谱的建设。

但百度后发未必不会先至。由于搜狗的语音团队不过100余人,所以在前端的语音识别方面仍采用的是第三方的软件,相比来讲百度的投入约是前者的两倍,同时据百度的公开表态,其自身的语音产品,从语音识别到最终的内容问答均是自主研发,这样的好处在于,每一步运算中的算法可以相互的融合,可以更好的提供搜索结果,当然也需要更久的研发时间——可见百度的厚积薄发有着自己的道理。

“四小虎”:“草根兄弟”虫洞、智能360和“血脉相通”盛大语音、云知声

其实盛大本不应是“四小虎”中的一员,如果追溯起来,可能盛大曾是在语音识别技术上最接近科大讯飞的团队。彼时,曾就职于摩托罗拉、并带队开发了世界上第一款手机声纹认证系统的黄伟博士,在2009年便加入了盛大创新院。当时也是盛大创新院呼声最高之时,甚至市场上有声音称其有望挑战科大讯飞,可惜时过境迁,随着盛大退市,资金面吃紧的陈天桥、陈大年对于创新院的投入渐少,而后黄伟则在今年的四月低调的离开了创新院,低调到甚至连一条新闻稿件都无法搜得。至于如今的盛大语音团队,已然是大换血,而整体团队也直接从创新院剥离至了陈大年的盛大掌门科技中,在其几日前发布“百灵语音助手”的通稿中甚至看不到负责人的名字。

在黄伟离开盛大之后两个月,2012年6月,自称专注于智能语音及语言处理技术的移动互联网公司云知声成立,成立仅四五个月后,被搜狗相中,成为搜狗语音助手的合作方。在云知声网站上,没注明核心团队的具体成员,只是说来自国内外知名企业、高校和研究所。在新浪微博上搜索其成员,可以查到一个加V并注明“前盛大创新院任高级研究员”的成员。结合盛大语音团队离散与云知声团队的成立时间,可以推断云知声团队里,一定留着盛大的血液。

最新消息:云知声团队联合创始人向虎嗅投来小纸条表示,云知声团队中的确有3名盛大语音团队成员,但其血脉包括创始人更多的是源自中科院自动化所,同时盛大语音的负责人黄伟并未在云知声团队中,目前公司共有员工20余人。

盛大语音和云之声更多的投入是在前端的语音识别技术之上,与之相对的则是虫洞和智能360这对在后端发力的“草根兄弟”。

这两支团队的技术背景、20余人的团队规模、500万的用户量,甚至未来的前景都将极其的相似。目前两只团队所做的业务,都是在后端的技术开发上,由于没有搜索引擎的积累,所以无法提到“知识图谱”的量级,能做到的只是生活服务相关的业务。

虫洞语音助手于今年3月份上线Android版本,它的四位核心团队成员均毕业于北京交通大学,公司CEO俞志晨和COO郭家俞更是同班同学,毕业之后在创办北京光年无限科技(即虫洞的公司实体名称),俞志晨、郭家又一起在中软公司担任机器翻译的工作,同时均为中国模糊数学奠基人贺仲雄教授的关门弟子。在微软首期“云加速器”的10个初创项目中,虫洞语音助手入围,目前微软“云加速器”的半年“加速”即将完成,在接受采访时,团队亦表示可能会与微软有更深入的合作,同时也获得了天使投资,但并未透露投资对象。

智能360团队的两位创始人CEO何永和COO李传丰曾并肩备战过北大的研究生考试,但双双落榜。经过了一番辗转,最终做出一个语音备忘成为智能360的雏形,在2011年10月软件便正式发布那时应用的名字还叫做“语音360”,而公司的组建则是要在2011年12月拿到第一轮天使投资300万之后的事情。成立公司后,李传丰认为,语音360的想象空间很有限,公司有实力做具备云储存的软件,因此智能360的概念走向了前台,目前智能360的安装量达到了500万,据统计有17%的用户是通过口碑传播而下载的。

尽管在“如何在与巨头的搏杀中突围?”这个问题上,虫洞与智能360都异时异地异口同声的达到“个性化、细分化”。但实际上,作为观望者,笔者更相信找一颗大树依靠,才是他们的最终解决方案。事实上,尽管并未明确,但他们也确实在朝这个方向努力。

上面提到,虫洞与微软有可能进一步合作,而智能360,业界也有其被巨头注资的消息。

说在最后

从目前的的语音应用市场来看,这7家公司应该最终会走上3条道路:第一条:科大讯飞凭借语音识别和运营商资源,成为交互的第一入口,但可能也就仅限于此,后面的业务还是由API接口来负责更加合理。第二条:搜狗、百度二者最终会形成类似Web端的稳态,成为强后端的产品,其中百度还有可能结合LBS事业部的O2O业务发挥想象,补充一句,360应该迟早也会进来。第三条:傍大树,将是云知声、虫洞、智能360甚至其他类似的“小虎们”,将走上的必然道路,在移动互联网这场战争中,很难形成小而美的存在。

注:作者的微信公众号为“科技门”(kejimen),欢迎关注、吐槽
本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定