科大讯飞刘聪:能带其他公司一起赢的,才是伟大的公司
2018-11-26 10:23

科大讯飞刘聪:能带其他公司一起赢的,才是伟大的公司

在“虎嗅 2018 F&M”创新节上,科大讯飞 AI 研究院执行院长刘聪作为“能量馆”的演讲嘉宾,和观众分享了讯飞——这家深耕人工智能十余年的公司,对 AI 热潮的理解,以及对于未来的预测。同时,“讯飞听见”为“虎嗅 F&M 创新节”全程提供语音转写技术支持。


人工智能在当下无疑是技术的热潮,刘聪认为,当下技术的主题是讨论如何落地,如何赚钱,技术能不能产生商业价值。有三种创新的模式可以引领 AI 的浪潮:产品的创新和微创新、商业模式的创新、源头技术的创新。而科大讯飞这种“爬山型”的源头技术创新,是最困难的,也是最孤独的,因为一两年内很难看到结果。


刘聪说,科大讯飞 1999 年成立以来,在语音识别等技术上做了很多的积累,而现在主要的人机交互方式,他认为会是“基于视觉呈现的语音交互”。


未来,每家公司都需要有自己的人工智能技术,但并不意味着每家公司都需要从零开始自己做。未来的竞争,一定是生态的竞争,而讯飞愿意做行业的赋能者,开放自己的 AI 能力帮助更多的公司,去实现合作共赢。刘聪也认为“只有成为商业生态系统当中的核心节点,整合各种资源,并且把整个的系统带动起来,实现共赢,这样才是伟大的、有影响力的公司。”


以下为刘聪在虎嗅 F&M 节演讲全文,略经虎嗅编辑:


各位年轻的小伙伴大家好,今天非常高兴能来参加虎嗅 F&M 创新节,这样一个非常有特色的会,我也是虎嗅的粉丝之一,虎嗅的网页也是我搜索栏里前几个收藏之一,经常通过虎嗅能帮我来获得一些相关的信息以及八卦,也能在一些不相关的领域对我产生一些科普——看了虎嗅早报之后,可能微博都不用刷了。



前几天我看到了一篇文章,叫做《算法工程师的危机》,里面提到现在工程师是调参的,调参这件事儿小学生都能做了吗?


另外一种说法是现在后端的研究员得抛弃自己高高在上的姿态去走向前端,去背上业务的 KPI,去和业务贴身肉搏,虽然这可能不是全貌,但的确也反应了一些现象。作为我个人来说,从原来做技术到现在的技术管理,从原来做语音识别到去负责计算机视觉,我是蛮焦虑的,因为我也是个工程师。


如果从公司的角度出发,我们知道讯飞经常说顶天立地,顶天就是指核心技术领先,可能主要是从研究院产出,怎么样更好地做好利弊这件事,怎么样去更深入地理解产品和商业模式,反过来帮助我们更好地做技术。这也跟我们今天的主题相关,怎么样能让 AI 变得更精彩,而不是变成泡沫。


我们知道现在第三次浪潮已经到来,可能现在大爷大妈都知道了,(这)也许是因为前面几次浪潮低谷的教训,也许是因为现在的节奏实在是太快。在第三次浪潮之下,我们的主题一直在变。我们在 2015、2016 年提的是算法、算力、大数据;2017 年变成什么?场景,你光有那些没有用,你得找到一个可以落地的场景。2018 年变成了价值,说直白一点,是你能不能赚钱,你的技术能不能产生商业价值。所以我们可以看到,这不仅仅是哪一家公司的事情,而是整个行业的事情。



我们认为有三种创新的模式可以引领 AI 的浪潮,有一些我们称为叫产品的创新和微创新,我们去关注通过一些快速的迭代,通过敏捷的开发,去关注这些用户的活跃率存活率;还有一些是在商业模式上进行创新,甚至是资本去推动的,当然这些确实能改变我们的生活,包括我们知道的所谓“中国新四大发明”,这一类型的公司,我们一般称为“冲浪型”的。


还有一类是什么?我认为可能在现在的中国相对会少一些,我们称为源头核心技术创新。讯飞是这样一家公司,源头核心技术意味着你可能是需要坐冷板凳的,它不是一两年才能获得成果的,这种我们称为“爬山型”的公司。


讯飞从 1999 年成立,从做语音合成、语音评测、识别,到 2014 年提出超脑计划,从“能听会说”的角度出发,也在这个过程中产生了输入法、翻译机、屏幕上的“讯飞听见”等。另外一方面,我们也在能理解、会思考这个方面,去挑战更难的认知智能。


我们现在到底有哪些成果?在 2018 年初的时候,研究院院长胡国平说,讯飞在 2017 年“顺便”拿了七个世界冠军,今年从评测和技术角度出发,(我们)也做出了一些成绩。这里面既有我们在语音合成连续 13 年夺冠,也包含今年号称史上语音识别最难任务的国际 CHiME-5 英文识别比赛;既包含我们面向于淘宝真实照片中文字信息的 OCR 比赛,也包含去年我们在国际 1.0 版本 SQuAD(Stanford Question Answering)挑战赛中,一些相关指标已经超过了人类,今年的 2.0 版本,我们也在此基础上获得了一个比较好的成绩。每次成绩出来的时候,我们能在朋友圈发现整齐的转发加上“666”这样一个标签,其实还是蛮壮观的。



也有人在说,这些高大上的东西怎么样能更好地更快的在我们的业务落地,其实是一个很好的问题。


对于源头核心技术创新,我们认为可能有几下几点(关键):


首先核心技术要做得非常领先,甚至在世界的层面要去不断去挑战无人区;第二要能实现盈利,实现商业的闭环;第三,当你形成闭环之后,你能不能持续地、不忘初心地持续投入,这一点非常关键。在业界华为其实做得非常好,也是我们学习的一个榜样。最后很多的技术创新,它不只是某一个领域,我们怎么样去做到国际化,去拓展它的应用非常重要。


从人工智能的技术,这些思维怎么样来助力产品创新?我们认为语音、图像这些相关的技术大致可以分为两类。第一类我们称为叫自然交互,其实很简单,你告诉一个小孩说你去打个酱油,然后把钱找回来,怎么样让机器可以更好地做这些事。


而另一类,我们知道语言和文字产生之后,产生了很多的行业。这些行业中最宝贵的是什么?是专家,专家的知识在他们头脑里。怎么样能把这些专家的知识学习出来,把这些有限的专家资源解放出来,对行业产生更大的贡献,我们称之为智能学习。


首先看一下交互,我们知道交互是一个发展的过程,从最初的大型机,需要专业人员通过打孔的方式和机器交互,再到后来的对系统下命令,再到我们的图形界面下的鼠标和键盘,再到以 iPhone 为代表的触摸方式。那么现在是一种什么方式?我们认为称为叫基于视觉呈现的语音交互。


大家想一下,对机器来说,如果机器要把它头脑的东西展示给你用什么最方便?一定是图像,因为它有屏幕,用图片或者用文字的方式展现给你就可以了,对人来说,80% 的信息是来源于视觉。如果人要把信息传递给机器,我们可以画画,我们可以写字,可以做手势,但最直接的方式还是语音,(这也是)我们现在基于视觉呈现的语音交互所要表达的思想。


在行业能力方面,我们正处在一些主要的赛道。


举个例子,在教育,我们通过个性化学习,让学生减轻他们的学习压力;在医疗,我们通过认知技术去通过执业医师考试,在一些基层的医院,我们已经帮助医生在做一些辅助的工作;在政法的领域,我们帮助法院的法官去提升庭审效率,辅助判案。


另外还有一点,就是我们通过开放平台,提供了相当多的 AI 能力,成为业界内能力非常全的平台,直接或间接地改变了一些行业。我们现在累计的终端数达到 21 亿,平台的开发者伙伴增长非常快,现在达到 86 万,每天的交互次数接近 50 亿。但其实还不够,因为我们知道触摸的交互次数每天在千亿级别,我们认为未来还有非常大的空间。


以上是现在的状态,让我们来看一下未来会发生什么事。我们知道未来的发展其实是有趋势性的,有时我们要根据对未来的一些预测来制定我们的战略,否则等水落石出的时候已经晚了。未来有哪些,我们做了一些预测,未来的交互形式可能会发生这样一个变化。


(未来)除了现在单纯的软硬件会向云端一体化,包括软硬件一体化发展。可能大家会说现在有芯片了,是不是以后都能在端做。但其实大家想一下,后台还有服务,还有内容,这些还是需要云端一体化的。对产品来说,一方面可能是像手机、电脑、汽车这样,我们称为“大 C 产品”,这些产品最多,未来最终很多会被一些巨头所垄断。但是也会有一些像衣服、鞋子、机器人、玩具这样,有非常多的形态,大家有一些差异化和个性化的需求,这些我们称为“小 C 产品”。而从未来的发展,我们认为围绕 AI 尤其是智能硬件,更可能会以“小 C”的这样一种方式发展,以满足每个人的个性化需求,甚至是情感的寄托。


参与生态。我们知道,在互联网时代,更多的是一家独大,马太效应;在移动互联网时代,除了“BAT”,我们又出现了像“TMD”和超级 App 这样的新东西。在未来在 AI 时代,我们认为除了现在的公司,会有更多开发者、传统行业的公司、运营商、银行等加入进来,可以使得整个生态变得多样化。


当然在中国的特殊环境下,我们认为除了市场经济导向之外,计划经济这种二元经济的发展,在人工智能的当前阶段可能会起到非常重要的作用,因为一些大型的攻关或突破,需要在国家体制之下举全员之力来进行突破。


继续上面的预测,我们也觉得未来的商业生态系统,也会从现在的寡头向去中心化的方式发展。可能未来开发者、传统企业、互联网企业、做 AI 的人工智能的企业,会像编篮子一样,形成一个非常紧密的结构,共同来营造一个生态。讯飞的执行总裁胡郁,把它称为“混合正交的商业生态系统”。


在这个系统之下,各家的角色到底是怎样的?


我们知道在互联网时代,服务商需要提供服务,要建网站,用户通过电脑去点击网站连接的桥梁或者渠道,我们称之为搜索引擎;移动互联网时代,硬件更多的展现方式变成手机,服务商需要建立 App,建公众号和微博,这时的桥梁变成 App Store,包括微博和微信。


那么在 AIOT 时代发生怎样的变化?


首先我们可以看到,硬件肯定是趋向于多元化的:可以是个音箱,可以是个电视,可以是个机器人或者其他的硬件设备。我们认为对于现在的一些品牌或者行业,每个行业每一个公司都应该要建立自己的人工智能系统,通过这些人工智能的系统,更好的去触达用户,去知道他们的需求到底在哪里。


在这种情况下,分发渠道变成什么样的状态?今年我们在“1024 全球开发者节”上刚刚发布的 iFLYOS 软硬一体化的智能解决方案,就是在这样一个行业生态下,提供了桥梁的作用。一方面我们为开发者提供一站式的解决方案和技能的平台,另外一方面我们也能为消费者提供体验一致的场景服务。


在这种生态之下,我们也判断未来这些竞争可能会从公司之间的竞争,变成一个生态的竞争。我们现在可以看到,(智能手机行业)并不是苹果公司和哪一家公司的竞争,而是苹果 iOS 和安卓生态的竞争。在这样的情况之下,每一家公司怎么样找到自己在产业当中的位置?你的上下游是什么?你是做“大C”还是“小C”?你所在产业的聚集度和寡头化程度是怎样的?其实都非常重要。


我们认为只有成为商业生态系统当中的核心节点,整合各种资源,并且把整个的系统带动起来,实现共赢,这样才是伟大的、有影响力的公司。


从历史我们可以看到,像 PC 时代的“win-inter”体系,像 Google 搜索加广告的体系,像移动互联网时代的苹果体系,以及在石油领域的美孚,其实都是掌握了整个生态体系当中核心的控制的环节。我们也认为在 AI 时代,通过一个大波浪加小波浪的创新,我们还是非常有可能做出一些颠覆性创新。这里面颠覆性创新不只是由 AI 公司做的,也包括使用 AI 的公司。


所以在未来,(我们认为)每一家公司都会有自己的 AI 人工智能系统,包括云计算包括大数据,但是不是每个公司都一定都要从头开始自己做?我们也知道现在的行情,应届毕业生硕士 40 万,博士 80 万,专家 200 万起步,可能有时你愿意砸钱,还不一定能招到合适的人。所以对我们来说,有没有一个能真正对这个行业产生赋能,就体现得非常的重要。


在这个过程当中我们希望能看到,因为每一个公司需要有它的云计算大数据和人工智平台,到底有没有一些公司,它真的是愿意来为行业赋能。不像在寡头垄断时代,“你的也是我的”,而变成从赋能的角度出发,变成“你的是你的,我的也是你的”。


当然在这个过程当中,怎么样让彼此不同的公司能够建立起紧密的合作,在新的生态之下,我们的数据、知识、经验,甚至是利益,怎么样把这样的分享机制建立好,非常关键。最终我们希望通过一个混合的方式来建立新生态和共赢的合作。


我们一直在讲,科大讯飞是一家希望在人工智能领域可以进行赋能的公司。我们现在已经和很多的行业在进行一些深入的合作,我们可以看到在现在人工智能的热潮之下,一个非常好的环境之下,我们也是用一种非常开放的心态,希望能跟更多的伙伴来合作,我们也乐于见到现在百家争鸣、百花齐放的状态。


最后,我们相信基于人工智能未来,我们相信可以实现颠覆性的创新,我们相信未来可以通过人工智能改变世界,建设美好的世界,这也是科大讯飞的使命之一。我们也非常希望可以和在座的各位共同见证,共同看见未来更加精彩的 AI,谢谢大家。

如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定