去搜搜
头像
探秘AI机器人,距离规模应用还有多远的路要走?
2020-08-20 11:15

探秘AI机器人,距离规模应用还有多远的路要走?

文章所属专栏 活动实录

虎嗅注:


本篇为“虎嗅Pro钻石会员”标杆企业参访,走进AI机器人公司优必选参访实录内容。


“优必选科技有很多的产品线,你很难想像在任何一家AI机器人创业公司能够看到这么宽的产品线。为什么?对人工智能的探索过程前无古人,也没有可参考的历史,这样的创新产品必须要通过自己的实践得到市场答案。”

 

不解与好奇之外,优必选科技也逐一在教育、商用服务等领域备受关注,拿下高额订单、验证商业化场景的真实落地需求,那么优必选科技是怎么做到的,还有哪些不被外界熟知的秘密?

 

带着这些疑问,虎嗅Pro团队与学员一起走进优必选科技,和CTO熊友军、CBO 谭旻和高级副总裁钟永高管团队深入探讨商业、品牌、生态及底层技术之间的来龙去脉,大有值得学习之处。


以上问题在现场均有详细探讨,受篇幅所限未能一一列尽。想要解锁全部交流内容,立刻加入虎嗅Pro钻石会员,亲身前往名企内部交流学习,与我们一道解锁科技产业创新创业学习计划。


以下为现场实录节选:

 

Q:机器人加手是干嘛的?第二比如楼宇导航或者居然之家在用的导航机器人,这些场景是真需求吗?实际商务场景有多大?

 

优必选科技CBO谭旻: 


人形机器人与“以人为本”


人工智能的发展严格意义上来说还处于非常初级的阶段,一般来说人工智能在算法、算力和数据这块着力较多,但大家不要被这三个要素给限制了,我们也会在场景上不断地去探索。

 

优必选科技其实有很多的产品线,你很难想像在任何一家机器人企业能够看到这么宽的产品线。为什么?对人工智能的探索过程前无古人,也没有可参考的历史,这样你的创新产品必须要通过自己的实践得到市场答案。

 

我们开拓出很多不同的产品,比如2019年和人民日报数字传播合作推出的智慧党建机器人是其中一个很好的尝试,借助人工智能赋能党建工作,推动党的声音直接进入各类场景终端,把党的声音传得更开、传得更广、传得更深入种。新零售方面,我们跟饿了么、居然之家做了很多创新的尝试。以居然之家为例,我们派了大概60人的交付团队去做所有的商业场景的重新匹配,我们发现:居然之家的前台,一天会被问6千到1万个问题,其中70%是问路。所以我们会很快地调整,思考应该怎么样用AI机器人帮助他们解答问题。第一个,我们坚信AI机器人一定是能提高工作效率的;第二个,在提高效率的过程中,我们的AI机器人怎么帮助客户,这是很关键的。在博物馆、美术馆,我们觉得非常有用的场景是咨询类导航,目前,我们的AI机器人已经在非常多的美术馆和博物馆应用。

 

关于“机器人手”的问题,其实给机器人加上手臂,企业要增加更多的成本和交付难度,在实际应用场景中也发现用户非常喜欢有手臂的人形机器人,比如大多数小朋友喜欢在机场跟机器人握手,这是我们跟很多公司在人工智能、机器人方面不同的理解,我们很坚信科技是有温度的,它不是一个机器,人形机器人是进入家庭服务不可缺少的形态。

 

我们跨了几个领域,第一个跨了软的部分,人工智能,第二个跨了硬的部分,机器人。所以AI机器人行业门槛非常高。难点在于如果你只是一个机器人,搞不定软件、打不通硬件,很快你会发现没有市场。因为机器人行业其实不是硬件为核心的,大部分机器人公司,我们认为只是集成公司,必须要有软件加硬件加服务,才能叫AI机器人。实际上,我们在全球机器人行业里已经走通了这个模式:软件+硬件+内容+服务,如果没有这四个,很难称之为完整的AI机器人革命。

 

我们的使命是“让智能机器人走进千家万户”,完成这一使命,核心点在于人性化。我们需要人性的关怀,除了从人的角度,我们还在思考如何通过科技的手段帮助人跟人拉得更近。


讲到人性化,企业的品牌形象很关键。上图左边的logo是我们原来的企业形象。直观感受是人形机器人,问题在哪儿?基本上99%的公司logo,都是以自己企业为主,企业的理念和价值观没有体现出来,现在看右边这个UBTECH的新logo,首先看到的是笑脸,核心是technology,即“科技以人为本”——首先要明确我是为谁服务。我们认为人工智能是有温度的,它不是一个机器,要把这个核心理念通过企业形象呈现出来。

 

优必选科技最近两年最大的变化之一,就是转向以用户为核心的企业文化,然后围绕着人工智能和机器人行业的三个核心点,去做所有品牌的变化。第一个点是Technology,“领先的科技”;第二个点是Smart,为什么不用Intelligence?因为Smart更有人性的感觉;第三个点是Human,即“以人为本”,人性化去做品牌的核心,而不是仅仅谈人性化,不回归到这个核心点里面去,前面提到的机器人的手也是人性化的一种体现。很多公司不做机器人的手,但我们做了非常多的场景测试,小朋友也好、老人家也好,看到有手的机器人马上会有一个动作,想跟你拥抱、握手。

 

2019年优必选科技成立7年,在这一年被评为最具价值中国品牌100强,品牌价值9.1亿美金,也就是仅品牌价值就接近一个独角兽的估值。不要以为说投资硬件、投资市场才叫做投资,投资品牌是一个越早做越好的事,因为越早做,你的赛道越没有竞争对手。

 

资源有限,如何去做全球化的品牌传播?

 

品牌工作围绕着硬件、软件、服务加内容四个方面去打造这个空间。

 

我们从2016年开始和苹果做生态的结合。苹果一直在全球找机器人公司或者硬件公司,能够实现Swift编程的最佳呈现。最后找到了我们,做了为编程教育而生的一款产品Jimu Robot,在全球500多家苹果门店销售,并在苹果WWDC17上成为Swift Playgrounds首家中国合作方,从2017年7月起加入到苹果线下体验活动 Today@Apple,每年24000次落地活动,给机器人编程爱好者提供学习软硬件支持。优必选科技的教育业务也是从这里开始的。

 

2016年我们成为曼城足球俱乐部的全球合作伙伴。为什么会选择足球?其实2016年我们已经开始建立全球化生态,在创业公司投入资源有限的前提下,怎么去做全球化的品牌传播?比较统一的观点就是选体育足球赛道,第一,体育没有国界;第二足球是第一大运动,受众最广。

 

我们跟曼城母公司城市足球集团在全球的7个足球俱乐部合作,开展足球和编程教育活动。很多全球的品牌合作,其实都是简单的广告合作,但我们有自己本身的优势:我们是做机器人的,通过跟曼城的合作,我们了解到很重要的一个需求,他们有一个组织叫“曼城俱乐部球迷家庭会”。足球俱乐部文化很浓郁,他们认为未来的球员培养一定要有这种综合科学知识的培养,一个好球员不仅仅要懂得踢球,也需要很重视科学文化知识的学习。

 

基于这个球迷家庭会,我们做了一款产品“足球特攻队”,在英国做了七周测试,除了俱乐部成员,他们的家庭成员也非常有兴趣。我们不改任何生产线,利用Jimu Robot的部件拼搭成一个足球机器人,并能进行比赛,有竞技性。从与苹果合作,到曼城足球俱乐部的合作,再到后面深挖AI教育,从2016年到2018年,优必选科技的AI教育业务其实是这样一步一步地走出来的。

 

通过和城市足球集团7个足球俱乐部的合作,我们的产品在全球多个国家落地,并通过一个单一场景创新,放到教育垂直应用里去,然后再把它放大,是很明显的一个效益。

 

垂直服务领域里往往有很庞大的需求,以优必选科技和饿了么的合作为案例,饿了么有超过28万个商家,我们不可能跟28万个商家一一去聊合作,所以我们通过跟头部的商家,一步一步把真正的新零售的场景需求挖掘出来,这种大规模的行业应用是非常有用的,如果没有这些大规模的应用,我们很难往前走。

 

5G时代会发生很大的变化,我们叫做off-hand communication,现在人机交互是基于手指来交互的,这是很不智能的交互手段。现在语音的互动刚刚开始,我们相信在三到五年内,在5G的应用里面就慢慢过渡到语音时代,手机会发生极其大的变化,人跟机器的互动很快会步入用语音、视觉沟通的时代。

 

现在机器人行业,我们叫做“八仙过海,各出奇招”。比如送餐机器人的使用,我们觉得不是核心,解决不了行业痛点。真正行业的痛点是劳动力覆盖。有两点我认为是人工智能的痛点,一个痛点是,机器人下半身主要是运动性能,在不同的路况上面的运动平稳能力,现在没有一家公司能够打包票说做得很好,包括波士顿动力。痛点二在于人工智能的交互能力现在还处于黑盒子阶段,深度算法如果不突破,机器人其实很难做到像人一样服务。

 

我们也还在不断尝试,娱乐、教育、服务、安防、巡检这五个场景都还在坚持,但教育很明显更有优势,娱乐还没有看到真正的2C端的大规模应用,服务我们觉得还是困难重重。

 

优必选科技高级副总裁、产品及解决方案部负责人钟永:

 

智能机器人未来的发展趋势是什么?


首先,从基础设施的角度来看:过去交互中心的变化是从电脑到手机,接下来的交互方式可能是语音交互,其交互中心,我们认为有三个方向:AR、全屋智能和智能机器人。智能机器人很可能未来会成为下一个消费级的人机交互中心。因为相对AR与全屋智能,其输入器官、接触器官,以及交互方式,可以在手机的基础上解放双手,并能以家庭成员的方式在生活中出现。

 

第二点,从情感角度出发,在家庭场景下的人形机器人可以与人类有更多的情感交流,赢得信任,成为家庭成员,这也是其它执行语音指令的家用电器所无法实现的。

 

最后一点是人形机器人不仅可以适配人类的居住环境,方便上下楼梯的移动,还可以成为家庭成员,更好地了解和掌握家庭数据,清楚家庭成员的喜好,陪伴人类的各种行为。相比于根据大数据原则得出的用户喜好结果,人形机器人可能发展到可以分析用户喜好的深层次原因,即为什么会有这种喜好。

 

从整个机器人的发展角度来讲,我们会认为未来的发展分为三个阶段。

 

第一个是仿人阶段,现在做的一些人形机器人,都会认为是仿人阶段。这个阶段的机器人具备一定的运动和控制能力,在AI方面的应用上,是一个弱AI、弱传感器、弱数据收集能力的机器人;再往下走是类人阶段,机器人在运动控制方面具备运动环境适配、高运动强度、微控制等能力,并具备基于特定场景的AI技术,即全方位的人机交互,包括语音、视觉、触觉、情感等,就是我们讲的多模态的交互融合;机器人最终的发展阶段是真人,在这个阶段,一个机器人和一个普通人是很难区分的,那个时候机器人可能等同于人,甚至在很多方面是强于人的,它是全场景的强AI,拥有自我学习、自我决策的能力。

 

从长期的发展来看,目前机器人的发展还处于“仿人”的阶段,在这个阶段目前做的比较好的是本田的阿西莫,以及波士顿动力,但是两者的产品设计、未来发展方向以及应用场景都不同。阿西莫是服务机器人,波士顿动力的应用更多是军工,因此能力也不太一样。

 

从产业化落地的角度来说,本田阿西莫是更有可能进入到刚刚提到的服务场景中。遗憾的是,本田把阿西莫这个项目停了。原因有以下几点:第一,人形机器人的技术发展,还没有完全达到我们所认为的成熟程度;第二,人形机器人的成本非常高;第三,本田本身做阿西莫机器人的目的,是为了展现他的技术实力,而没有想清楚为什么做这件事情;第四,阿西莫作为一个三十年前的机器人,他的技术比较传统,比如内部衔接是用皮带做的,因此每次演示完,就要去校准它的皮带,因此在这点来看,Asimo有一些产品发展的障碍。在仿人这个阶段,优必选科技比较有代表性的机器人是Walker,从2015年开始研发到现在,大概做了五年左右的时间,与其它仿人机器人最大的不同是,Walker是在成本可控的平台上进行研发,将会是中国第一款可商业化落地的大型仿人服务机器人。

 

新的交互方式出现,是因为整个智能终端在变,人机交互的中心在变。而交互方式的变化会重新定义数据的价值,导致现有的产业生态将会被颠覆。举个例子,微信和QQ在功能上本质没有区别,都是一个聊天交流的工具。但是从交互方式的角度来看,QQ大部分的设计,它是基于PC的逻辑设计,因此最早叫QQ是即时通信,意思是联系时,需要双方在线,都坐在电脑前,这是由电脑的形态决定的,因此功能设计如此。但是到了手机阶段,手机跟着人走,无时无刻地在你身边,只要发一条信息,对方都能接收到,只是愿不愿意看而已。因此由即时通信,变成了随时通信。

 

第二点,当你走在路上拿着手机的时候,会发现打字不太方便,此时语音交互的功能出现了。因此相比于QQ,微信推出时最大的一个优势就是把语音的功能推到一个非常重要的地步,才让大家用的很爽,再加上腾讯原来的社交功能,最终形成了微信这个产品。

 

对比来看,微信上的所有功能特性, QQ上面都有,只是微信在移动场景下做了很多适配,所以新的交互方式出现,导致出现一个新的产品。随着微信的出现,移动互联网的交互方式颠覆了PC时代的交互方式。而交互方式的变化,会重新对产业生态进行颠覆升级。如果机器人作为一个新的人机交互终端,产品发生了改变,交互的方式、形态以及与人的关系都会发生改变。所以围绕着人的衣食住行的各个方面,数据、业务、甚至未来的交互方式,及延伸的其他产业生态,都可能发生很大的变化。

 

人形机器人相比于手机终端来说,其数据收集是主动完成的,甚至未来发展到智能时代,环境中的一切可沟通的产品,都可以进行数据收集处理,因此又称作物联网,进入万物互联时代。当然伴随着产品的发展进步,会出现伦理道德、法律安全、隐私等一系列问题。但是相关的法律法规也会逐步发展,解决这些问题。基于这种服务场景,未来商业化的空间非常大。当机器人主动收集你的数据,通过各种人工智能的处理数据,最终实现商业化变现,这将能够实现一个很好的商业化闭环。

 

AI机器人产业现状


刚刚讲了一下未来机器人的技术和形态的发展趋势、商业化变现,以及对未来产业形态的影响。接下来讲中国力量,我们从2008年开始投入机器人研发,2012年成立优必选科技。现在中国的人工智能产业发展非常快,而人工智能的未来也将在中国。

 

第一,从全世界来看,机器人的商业化才刚刚开始,中国占了一定的先机。整体来看,商业化发展阶段会经历几个过程,目前处于弱AI阶段,更多的在教育市场落地应用,包括一些弱AI应用,机器人作为大数据的辅助,给生活添加了很多空间;再往下走,我们称为特定场景的前应用的阶段,比如在安防、巡检、医疗、养老等方面,可能是一个非常大的市场。经过在to B行业的沉淀、技术的发展、商业化的探索,可能到这个阶段,2025年以后,才有可能是一个消费级机器人爆发的时代。最终未来,一定是人机共存的时代。

 

第二点,对比波士顿动力和本田阿西莫来看,优必选科技的机器人walker研发升级时间短、水平高、耗费成本低、升级快,极大的提高了商业化优势。除此之外,中国的AI机器人具备厚实的产业基础,以广东省为例,大概有1381家机器人领域相关的公司,产业链上下游非常完备,具备很好的产业基础。从科研角度来看,中国的论文研究数量,仅次于美国位居全球第二,据统计每年有40%的论文是来自中国的博士及科研人员提交的,大概一年有2万多篇。假设一篇论文由4位博士完成,则在AI方面,中国有8万名博士。

 

下一个“十三五”规划是到2035年,但是从我们的预判来说,未来中国要跟美国真正站到同一条起跑线,成为两个顶级的世界强国的时间点是在2049年, 2035年到2049年15年左右的时间里,中国真正要实现超车,或是跟美国比拼,可能人工智能是一个非常重要的技术。因此从国家角度来看,已经把它上升到一个国家战略,而且不仅仅是中国,全球很多国家都把人工智能作为一个重点,包括非洲、阿联酋、迪拜等,都已经把人工智能上升为国家级战略,提供大量的基础研究和数据平台,吸引全球的科学家到本国发展。

 

总之,随着驱动、运动控制和AI技术的发展,我们认为大概五年以后,会迎来智能服务机器人大规模的产业运用。目前,更多还是在垂直行业的应用。但是从商业化的角度来看,机器人的公司相对来说是比较艰难的。

 

AI机器人行业分层


刚刚讲了一下产业现状,接下来是机器人、AI的行业分层,第一个基础层,指的是基础性的技术,比如芯片、大数据算法等。第二个是通用技术层,即AI相关的技术,云的技术,视觉的相关技术等。第三个是应用落地层。

 

从未来发展的角度上说,面对当前产业的现状,我们主要在做消费者和行业这两个方面的扩展,比如教育、安防、养老,甚至医疗,逐步将核心技术和产业结合。所以整体的方向就是,更多的行业运用区域化,提升技术积累。

 

第二个是技术,目前已经从“互联网+产业”变为“AI机器人+产业”的时代,但是现在,人工智能和机器人作为一个生产力,不足以改变我们的生产关系,只是在一些特定的领域和场合下可以帮人做一些简单、机械、重复、高危的动作和劳动,这与 “互联网+”的逻辑是一样的。但目前还没有达到AI机器人+行业的阶段。所以目前机器人公司、AI公司都在做行业的落地方向。整个行业仍然处于降本增效的早期,还没有到能够改变行业阶段,这是一个方向。

 

现在机器人公司或者AI公司都遇到的问题是,目前机会不是特别缺,很多公司都在各自的赛道里做这件事情。目前有两类比较好的公司:第一类是发展方向比较明确,即机会赛道受认可,但业绩落地还不如人意;还有一类在机会赛道的布局可以,业绩做的还可以。这两类公司虽然发展艰难,但整体发展前景比较向上。

 

而从业务分类来看,行业基本可分为三类:第一类是完全机会探索型,比如消费者产品、场景这种,因为消费终端、消费需求和心态都在发生不断的变化,很难进行探索,不确定生产的产品是否大卖,只能根据经验积累进行判断;第二类是可能机会点,比如安防巡检、室内巡检类似的降本增效的行业,但是不确定是否能够成为一个新的刚需;第三类是稳定收入的业务,可作为保本业务,比如AI教育行业等,这也是优必选科技投了很多精力、人力、物力和财力去做教育的一个原因。

 

基于这个情况,优必选科技定了一个整体经营战略,以COO养CTO,既关注商业化如何赚钱,也探索和布局前沿的新技术。从2008年开始研发机器人核心部件伺服舵机,到现在的Walker,优必选科技一直在持续地投入核心技术研发,到今天,Walker可以代表中国最顶尖的大型仿人服务机器人走向世界,都是因为我们技术的长期积淀。但是技术积累,是很难又需要大量的钱投入的事情。因此我们有两个途径去贡献,第一个就是融资投入技术发展。第二,因为我们是商业公司,不是研究机构,因为在做很多商业化的尝试,不断造血。所以整体优必选科技的经营战略是 COO+CTO,一边自己不断地赚钱,尽可能地自给自足,一边把赚到的钱投入到技术研究当中,为长期的技术储备,为整个机器人行业去做好很多基础性的工作,这是优必选科技整体的经营战略。

   

我们做了很多尝试,最早做消费者娱乐陪伴的机器人,后来和迪士尼合作,做IP相关的娱乐机器人探索。第二是做教育,是我们目前重点投资的地方,也是目前商业化产出比较多的地方。第三是体育,我们和城市足球集团、健腾体育产业基金收购了四川九牛足球俱乐部,在AI+科技+体育的逻辑上做这件事情。第四,我们也在尝试商用服务、安防巡检领域的落地,跟国家相关部门制定2025年国家安防巡检机器人的标准,这是一个非常大的市场。除此之外,包括智慧零售、智慧康养等也是我们在尝试的领域。

 

未来人工智能和机器人可以拓展很多领域,而优必选科技最终想成为一家专注于做人工智能和机器人的相关核心技术和产品公司,赋能各个行业的智能化升级和转型。

 

目前,在具体的商业应用尝试上,机器人能够在特定的环境和场景下,替代和协助人类完成一些危险性工作,比如巡检机器人,电力、化工厂、炼油厂等高危行业机器人等,可以起到减员增效,降本增效,降低人员危险性的作用。第二是机器人在特定的场景环境下,替代一些重复性的工作,比如室内巡检、机房巡检,资产盘点等。还有一类就是个人家庭场景应用的尝试。

 

优必选科技在AI教育方面的布局

 

我们为什么要做AI教育。首先,AI技术的引进和发展,是智能时代各行业的一个关键技术,AI技术本身是非常重要的点,机器人是人工智能发展的重要分支。第二,机器人是人工智能技术赋能的关键硬件载体,是最好的和AI天然结合的一种技术。第三,教育是AI技术带给人类社会第一步深层次冲击。

 

有两个重要时间点,第一个时间点2049年,第二个2035年。2049年,新中国建国100周年,国家的发展战略可能是世界强国的战略,我们有可能进入人机共存的新时代。2035年,国家十三五规划的结点,从现在到2035年,从2035年到2049年,都是15年左右的时间。刚好是一个10岁的小朋友长到25岁,从小学走上工作岗位。现在的小朋友应该开始去思考或者是具备一些适应未来工作生活管理的能力,因此现在从小学阶段开始学AI的逻辑是最适合的。这也是国家把AI列为国家教育一个重大战略的原因。接下来五年左右的时间,在全国所有的中小学,AI将会成为一个必修课。而AI教育从国家战略的落地政策来说,至少是一个千亿级的市场。而真正大规模的落地,应该会在2020年到2021年开始。

 

什么是AI教育?目前市场上的AI教育总结起来就两个方向,第一个,把人工智能作为一门技术或者工具属性,去赋能教育,比如说科大讯飞的智慧教室、智慧校园等,都叫AI教育。第二是内容属性,把AI作为一门学科去跟小朋友讲,什么是AI,怎样做这件事情。

 

从市场理解的角度上来说,只要跟素质教育相关的,像机器人教育、编程教育、创客教育,都叫做AI教育。但是本质上什么是AI教育?我们的理解是,编程教育、机器人教育和创客教育相融合的焦点部分,才是真正的AI教育。

 

为什么做教育?现在很多人做教育,但是很多是从科技公司的角度去看待教育,我们认为应该更多以教育的视角来看科技如何去赋能做好教育这件事情。教育本质上其实是育人。而教育的目的有四点:第一,让青少年具备与AI共生共存的意识;第二,掌握未来的智造力,具备一定的鉴别、认识和应用人工智能技术的能力,在AI时代,起码知道什么样的东西叫做AI,AI能够怎样改变我们的生活;第三,能够将AI的技术创新应用,用于成就自我或者改变生活,教会小朋友使用用AI技术,真正使用它改变自己的生活;最后一点,是培养青少年新的社会责任感和伦理道德,包括数据安全、合法化应用、法律意识等,这是一种新的社会责任感,因此小朋友现在开始接触AI的时候,就一定要在课堂里面不停地强调这个概念,辩证地看待这个逻辑,只有这样,当真正这个社会来的时候,法律才能跟上,相关的社会制度也能跟上。这四点,也是我们讲的AI课程内容。

   

从整个教育传递的过程角度来讲,以前很多公司包括优必选科技是从产品到目标,但经过探索实践很快发现了这个流程不对,现在我们已经变为从目标到产品开发,把课程设计作为AI教育的核心和关键,并且这是经过实践验证的路径。我们希望AI教育是大家共同来做,不是优必选科技一家独大。如果说所有人都能够按照这个理论或者是理念来做这件事情的话,这个市场会更好。

 

其实教育的细分市场非常大,我们把它拆分开来,校内和校外培训机构,和普通消费者的泛教育场景,面对不同年龄段的小朋友都是不一样的,仔细拆开看,这里面有至少有27个细分维度。每一个维度,都是一个市场。每一个维度,都能做成一家市值上百亿的公司。面临这么庞大的一个市场怎么切入是很关键的,而AI教育最重要的是做好教育深度和教育价值的传递过程。

 

围绕着我们的逻辑来讲,优必选科技整个的AI教育,用一句话总结是以机器人等硬件为载体,以AI赋能教育。首先有专门的AI课程体系,其次有专门的学习服务体系,最后有专门的共享生态。整套课程体系包括培训体系、竞赛体系、运营体系、实验室方案。围绕着课程体系,有三级运营体系,就是整个学校里面,分为标准校、中心校和人工智能教育基地。这三者的策略是不一样的,标准校针对的是百分之百的学生,是通识性教育;中心校针对的是百分之三四十的感兴趣的学生。通过学习,可能有5%的学生,是有天赋,在这方面很拔尖的,从而进入另一种体系学习,课程、内容、活动进展都不一样。

 

在师资方面,优必选科技与华东师范大学、教育部的教师一起制定人工智能教师标准,推行职业等级认证。并与卡耐基梅隆大学、IEEE(美国电子电气工程协会)联合打造一个国际级的人工智能标准教师认证。

 

在活动方面,我们在做一个校级、区级、国家级的竞赛。帮助学生去掌握、应用一个知识的能力,而且是跨学科知识的能力,大多为开放性主题的竞赛活动展示逻辑。比如做一个智慧工厂,就像研究生导师,给学生下一个课题,围绕着这个课题,搭建团队,通过自己训练,做演示答辩,给出结果。通过这种活动,考验学生发现问题、解决问题的能力。

 

在教材方面,我们的教材由国家课标组和AI教育领域的技术大咖共同负责教材编委,而且这套教材被美国的STEM教育当做标杆教材。

 

总结一下优必选科技AI教育的几个亮点:第一个是经过验证的端到端的AI教育解决方案,我们不仅提供硬件,也提供教育解决方案。第二个是贯通的课程体系,即国内紧扣国家课标,国际遵循CSKA标准,编委由国家的课标组成员、一线教师、AI领域专家、大学教授组成,保证课程内容不会走偏的同时,有一定的灵活性。第三个,可扩展的标准化、中心校、基地三个运营体系。第四个,是系列化智能载体,软硬结合,我们不是纯做软件的,也不纯做硬件,人工智能技术和硬件的深度融合系列化的课程体系,是学生可学即可得。最后有完善的产业生态,链接全球知名的高校和研究机构、全球人工智能企业和专家,形成产业联盟,可以让教育链接真实世界,不仅把学生带出学校,而是把视野从课本中移到实践中,从活动中带到课外去,同时我们要把企业的很多资质、资源带到学校去,比如定期举办CTO课堂,讲机器人的发展趋势等。只要有一件事情一个人,能够激发学生的灵感,改变思想意识,都是一件非常有意义的事情。

 

提问:AI教育场景最主要的商业模式是什么?

 

钟永:商业模式其实分为几点,早期我觉得教育这个东西,尤其是创新型的教育,首先从市场的角度来看,它一定要有规模属性,所以商业模式很简单,第一种类型是引导政府投资,通过财政预算拨款来做;第二种类型,未来往校外培训机构走,去走正常的商业逻辑。其次,从销售的角度上有两个范围:第一是直接卖设备或者师资培训,第二是AI教育相关的服务,其实就是服务采购,按照课时服务走。

  

优必选科技CTO熊友军:

 

人工智能未来的愿景和应用场合


每次谈到机器人都离不开人工智能,因为实际上机器人是人工智能的一个重要分支。所以每次谈机器人的时候,我们都会回顾一下人工智能,以及我们做人工智能的目的是什么。人工智能协会曾经给人工智能下了一个定义和目标,就是要创造与人类的水平相当的智能,甚至超越人的智能,最终目的是将人工智能嵌入到人类的智能生活中去,并希望通过人工智能改变我们的生活,提升我们的生活。

 

人工智能协会也发布过一个愿景图,非常丰富地展示了人工智能未来的愿景和应用场合,包括智能出行、智能教育、智能工厂、智能医疗、智能社交、智能家庭、智能娱乐等。整个人工智能愿景图,有非常好的指导意义,人工智能未来真的会进入我们的家庭,进入我们的生活,机器人也会成为我们生活里非常重要的元素。

 

我们看一下人工智能发展的历史,1943年开始萌芽,出现了智能的说法。而真正提出人工智能,是在1956年的达特茅斯会议,在随后几十年,陆续经历了几个发展的高潮和低谷,一直到近10年、20年的时候,随着深度学习理论的成长,以及智能手机网络技术的进步,人工智能才得到比较快的发展。我个人看来,虽然近几年人工智能在理论算法方面碰到一些瓶颈没有重大突破,但是人工智能开始大规模地走入生活,向我们的日常应用进行扩散,确确实实提高了很多行业的智能化程度和工作效率。

 

一般我们会把人工智能热门的研究领域分成四大块,第一个是机器学习相关的理论算法;第二个是关于自然语言处理,这实际上是以苹果的Siri开始吹响了这个号角,随后开始很快地发展;第三个技术就是关于计算机视觉方面的,大量的人脸识别、物体识别、行为识别等;第四个就是机器人技术,这是人工智能里面非常大的研究分支。

 

机器人与人工智能的关系

 

机器人是人工智能的子集,也是研究人工智能的最好载体,在机器人上可以承载很多知识领域,如计算机视觉、语音技术、机器学习、感知和认知科学等。而机器人的发展也离不开人工智能技术的发展,人工智能的任何一个短板都会限制机器人在该领域的应用或者问题解决不够彻底。在人工智能的基础上,机器人又增加了很多包括运动控制、人机交互、感知、决策、执行等硬件特性。

   

优必选科技为什么坚持做人形机器人?:机器人是机器+人,应该同时具有机器的属性和人的属性。机器的属性就不再强调,我们现在应该更专注如何更多具有人的属性,也即智能的属性,人形机器人是最能体现其智能性的机器人,包括运动、语音、视觉和学习等各方面的各种智能,当然难度也是最大的。人形机器人虽然技术难度最高,但是未来广泛服务我们人类且能被大众真正接受的一定不是轮式机器人、履带式机器人或者球形机器人,而是人形机器人。现有的轮式机器人、球状机器人只是在现有技术发展还不够成熟情况下的过渡产品。在服务领域,人形机器人具有人的外形,从心理学的角度更容易被人接受,更有亲近感。在学术领域,机器人设计是仿生设计可以借鉴很多人类的动作习惯,如关节的拓扑设计,运动空间的设计、抓取规划、步态规划、手势意义等等,都可以借鉴人类的行为,如在规划人形机器人的行走步态时就可以利用动作捕捉器将人的行走模式映射到机器人上面去。从适应环境角度来看,现有的环境是为方便人类工作和生活而设计,人形机器人能更好的适应这个环境,比如室内会有各种门槛、楼梯,双足人形机器人相对轮式等机器人更方便移动;具有灵巧手臂的人形机器人相对其它没有手臂的机器人能更方便的帮人类完成端茶、取物等工作。

   

智能化的伺服驱动控制关节是智能机器人的关键技术。现在有一个趋势,就是智能一体化的关节,驱动和控制放在一体上。这里面涉及到的算法非常多,比如位置控制、速度控制、力位混合控制。现在因为服务机器人要更加强调安全性,尤其是在每天的生活中和人打交道,比如拿一个苹果,不能把苹果捏碎,跟人握手,不能把手握伤,这都需要力的感知,需要力控。力控实际上是非常难的,尤其在现在力传感器还非常不成熟的情况下。

 

除此之外还涉及到控制的其它一些算法,如模型预测控制,这些都是常用的控制算法,是人形机器人的关键,最早的时候,我们接触的是这种被动行走理论,经过一段时间后,逐步发展成现在通过强化学习来实现高效利用的运动控制模式。

 

做人形机器人一般遵循理论计算、虚拟仿真、实物样机、垂直场景的设计逻辑。首先会建机器人各种模型,在仿真环境把机器人运动学模型、动力学模型都建起来,进行运动学和动力学仿真。仿真之后做实体机器人,开始完善各种算法,通过实验,建立数据模型。有了一定的算法、模型训练之后我们会做整机,加载各种控制算法在垂直领域,测试更加复杂的场景。

 

自主定位导航SLAM技术是机器人在大场景中移动必不可少的关键技术,包括地图构建、地图更新,实时定位和导航等几个方面。单一感知技术的SLAM已经远远无法满足现在复杂可变的非结构化环境,因此,在传统的激光SLAM技术上,以后的发展趋势是激光融合视觉技术、超宽带UWB等的多传感器融合的SLAM技术。


服务机器人的机器视觉,实际上我们强调的不仅仅是做人脸检测、人脸识别、身份识别、行为识别,还要有基于这些识别结果后机器人的思考决策的一些行为能力,比如在家庭环境中通过人脸识别出老人或者小孩后要采取不同的交互模式和交互内容;根据人的动作识别,不同的识别结果采取不同的服务模式。在生物识别方面,除人脸、年龄、性别之外增加关系识别、情感识别。在语音交互方面,从语音信号、声波信号转化为电信信号、文字信号,文字信号转化成语音信号。后面有一些自然语言的理解,包括语音识别、对话理解等。

   

多模态交互的问题与优势


这是机器人相对于传统电脑、手机的巨大优势。因为机器人相对于电脑、手机增加了很多的传感器,其交互方式从而增加了语音、视觉、表情、动作、情感等。人类下达指令的方式变得丰富,机器人的执行方式也更多元,这种多元的交互能够增加机器人与用户之间的情感。

   

有了刚才上面各种运动控制的技术,机器人还缺一个非常关键的技术,把这些所有的技术串起来,即机器人操作系统,没有操作系统的话,所有的生态实际上都是散的,没有一个魂。就像我们各个电脑的windows操作系统和手机的IOS、安卓一样,目前优必选科技推出了操作系统应用框架ROSA,已经应用在我们公司的所有产品。目前操作系统在全球都还处于探索和发展阶段,所以这是一个巨大的机会。

       

总结一下我们的核心技术,包括这几大方面:伺服舵机、运动控制算法、机器人视觉、语音交互、定位导航、机器人操作系统。

   

工业机器人方面,中国起步较晚,因为工业机器人在上世纪五六十年代就已经在其它国家开始了,中国实际上是从本世纪初才开始。而服务机器人领域,现在全球都是刚刚起步,所以全球都处于同一个起跑线上,而且中国有非常好的应用场景、技术、平台,还有大量的应用数据,因此服务机器人中国有大量的机会。优必选科技从刚开始做服务机器人,就非常注重专利的积累,从成立到现在已经在全球范围内有效申请了1500多项专利,在学术前沿也做了很多布局。

 

Q:未来机器人在语音方面的发展会比较快,所以未来的发展趋势是怎样的?

 

熊友军:我觉得未来在机器人在语音方面的发展还是比较乐观的,因为像语音识别、自然语言理解、语音合成,很多算法已经相对成熟了,缺的实际上是数据。我们现在做的比较多的是普通话,但是大家普遍感觉比如说聊几句之后机器人就没得聊了,这实际上是大量的数据缺失了。其实如果针对某一个行业,非常细分的领域,做很多的数据收集和优化,体验会非常好。比如,我们之前打银行客户服务电话的时候,体验非常差,但是现在这个体验越来越好,因为它针对银行这个场景要服务的东西,可能问到的问题都了解清楚,并提前准备好,所以你问一个问题,它基本上都可以与你的答案匹配,是你要的东西。所以语音发展的一个趋势是更多的聚焦在行业,大家会发现在垂直领域有更多的应用给我们带来更好体验。

 

我们人类涉及到的领域太多了,随意聊天这个功能,我觉得如果以后知识图谱或者图论这两个学科没有发展的话,可能还是会受到很大瓶颈,因为这里面还是需要有底层的一些算法,还涉及到大量的人类生活的常识知识。尤其像知识表达,我们涉及到说一瓶水、一杯水,以这个水作为一个知识图谱的话,涉及到方方面面太多了,这些表达怎么样很好地表达出来,便于知识搜索,这个实际上是数学领域图论需要有新的突破,否则的话还是有一些局限。但是我觉得在语音识别和语音合成这一块,现在技术已经非常非常好了,你刚刚说了以假乱真完全可以,现在要去合成哪位伟人、明星的声音都没有问题,只要有数据都可以做到,前提是要尊重隐私、社会伦理道德和法律。

本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声