2019-11-27 12:57

淘宝有这么多数据,为什么“猜你喜欢”还是打动不了你

本文来自微信公众号:造就(ID:xingshu100),文字:颖仔,校对:Lily,视频:黄烨,题图来自:视觉中国


当人工智能、类脑仿生成为热议话题时,有一个相关冷门知识你或许也该知道下:人类大脑由860亿个神经元连接组成,如果将大脑活动时的生物电状态转换成普通电流,功率大约是20瓦。


20瓦的人脑可以做什么呢?


作为一个拥有20瓦大脑的人类小孩,会和她身处的世界、和其他人做交互,她会有自己的情绪,她会求助等等,同时她也会因为自己的兴趣,无视家长的输入。 


她的这些交互是一个非常自然的过程。我们看到,人脑可以在低功耗的环境下学到与他人交互的能力。


那么,人工智能在进行深度学习时是怎样的状态?


阿里巴巴计算平台事业部总裁、阿里巴巴集团副总裁贾扬清一边开发人工智能系统,一边观察和训练自己的女儿。


贾扬清


他说,科学家教人工智能进行深度学习的过程,其实和我们辅导小孩做功课差不多。这两者都需要解决算法和算力两个问题。


在人工智能领域,深度学习解决了算法问题,规模化解决了算力的问题。


其实在图片识别上,人的算力和单个GPU差不多,但是机器可以通过规模化大幅提升算力,人类则不能。


在全世界的数据不断爆发的今天,人工智能是一个系统工程,通过不同子系统的拼接,我们才能够完成一个实际生活中需要的完整场景。


以下是贾扬清演讲的精彩片段:


在很多电影中,我们可以看到这样的情节,有一些像人或者不像人的机器人,它可以实现不同功能:有些能开飞机、开宇宙飞船,有些是处理垃圾,当然也有些机器人可能目的不太好。


从这些电影当中,我们会发现一个非常有意思的现象,就是人们觉得人工智能是一件很容易的事。

电影《我,机器人》剧照


从2013年开始,我们就经常听见这样一句话:“人工智能的未来已来”。其实,今天我们还没有一个通用的智能体能够解决所有的问题。


人工智能难吗?


深度学习=小孩写作业?


2012年,多伦多大学的研究生阿莱克斯·克里泽夫斯基和他的教授杰弗里·辛顿提出了一个“深度学习”,或者说“深度学习网络”的方法。


他们通过大量标注的信息,以大量的数据集为基础,让一个比以前深很多的神经网络自动地学习从浅层的各种各样的边,到更加深层的、更有语意的信息,最后达到一个更好的识别效果。


这个过程有点像辅导小孩写作业。


平时我们在辅导小孩时,面临两个最大的问题。第一个问题是,你怎么就学不会呢?这时候我们其实是在讨论小孩的算法能力。他如果采用的是比较笨的算法,那么他学不会。深度学习就是解决了算法的问题。


我们经常跟小孩说的另一个问题是,你做作业怎么就那么慢呢?这其实是一个算力的问题。我们人的计算速度可能就只有这么快。在算力这方面,我们没办法让一堆小孩合起来提升一个小孩,但我们可以用一堆计算机来提升计算机系统。

 

辅导小孩写作业


2014年,MIT做了一个研究,在对一张图片里有怎样的物体做预测时,人类几乎可以在13个微秒左右的时间里完成识别,一秒钟我们可以处理77张照片。


今天非常非常高效的GPU,它一秒钟可以处理多少张图片?我们发现,GPU比人不一定快多少,单个的GPU每秒钟大概可以处理230张图片,这不是非常高的数值,我们人的计算能力可能和GPU差不多。


但我们可以通过大规模的系统的方法,把非常多的GPU聚合在一起,当我们把256个GPU放在一块,它每秒钟就可以通过集群的方式处理6万张图片。


人、GPU与GPU集群的计算能力对比


在这种状态下,我们可以通过大量堆数据的方式,非常迅速地训练出一个更聪明、更高效的深度学习系统。


人工智能是一个系统工程


在电影《蜘蛛侠》里面有这样一句话:“With great power comes great responsibility”。意思是说,能力越大,责任也就越大;从机器学习的角度,我们说:“With great power comes great overfitting(过拟合)(注:过拟合是指机器学习样本的特有属性后,过于严格地按照样本属性进行判断,导致判定误差较大)”,模型越复杂,我们就需要有更多的数据来做训练。


电影《蜘蛛侠》中舅舅对彼得·帕克说的话


我们去医院看病,都希望找一个老医生,因为老医生更有经验。在医疗影像识别这个领域,我们发现,医生看片子做诊断的正确率和他的年龄、跟他看片子的数量是正相关的,看的片子越多、数据越多,准确率就越高,机器也是一样。


我们可不可以让机器来看X光片和CT片呢?机器看图片永远会比人看图片看得更快、更多。


医生看X光片


另外一个例子是报纸。很多人可能有几年都没有看过报纸了。报纸的内容有什么问题呢?


它是静态的。


报纸并不知道,我今天的心情是什么,今天是不是来上海了,我是不是想买这件运动服等等。它永远是一个静态的状态。在全世界的数据在不断爆发的时候,一个静态的、不和用户产生交互的媒介是面临很大挑战的。


你有多久没看过报纸了?


在今天,人工智能已经可以直接和用户产生交互了。人工智能在今天是一个系统工程,通过不同子系统的拼接,我们才能够完成一个实际生活中需要的完整场景。


AI和云结合是必经之路


前两天我夫人对我说,淘宝给她发送了这样一个广告,但她并不太喜欢这样的内容。


显然在大数据领域,广告可能会吸引用户来点击,但是用户当下的心情怎么样,这是今天人工智能还做不到的地方。我跟广告系统的负责人是很好的朋友,我开玩笑一样地把这个图片发给他了,他给我发了一个非常非常精辟的评论。



人工智能可以帮助我们解决实际生活中的很多挑战。AI和云的结合是一个必经之路,那么我们怎么通过整个计算机领域,以及实际业务领域的结合,来把AI往前推到更进一步的方向,这是我想通过今天的分享引发大家思考的地方。


本文来自微信公众号:造就(ID:xingshu100),文字:颖仔,校对:Lily,视频:黄烨

展开
本内容为作者独立观点,不代表虎嗅立场。

未经允许不得转载,授权事宜请联系hezuo@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定

相关推荐

回顶部
收藏
评论9
点赞4