去搜搜
头像
【圆桌第19圈 - 专享笔记】李明强:人工智能技术如何产品化落地?
2017-06-08 19:02

【圆桌第19圈 - 专享笔记】李明强:人工智能技术如何产品化落地?

文章所属专栏 活动实录

虎嗅注:很多人都说人工智能是大公司才有入场券的游戏,小公司出去创业的就别想了。除了技术实力,庞大的数据量就干死一大波的淘金者。但只有大平台才能积累大数据吗?未必如此。图普科技的李明强,腾讯T4出来创业,机缘巧合碰上了直播的快速崛起。通过提供基础的鉴黄服务,一步步积累数据、锻炼机器,也赚到了进入图像人工智能领域的入场券。


虎嗅会员圆桌邀请到图普科技CEO李明强,讲讲不是大公司,怎么找到进入人工智能的把手。这次分享主要回答了如何规划合理的人工智能产品路径?如何低成本的获取大数据?如何建立正循环的AI生态?等问题,还是那句话,实践出真知。


小步快跑,先找准切口跑起来


2013年出来创业,我们是国内创业团队里最早去尝试深度学习技术的公司。但刚开始创业要选择一个小的切口,找到刚需,而不是以上来就贪大求全,如果你不是捞偏门,就要对你的产品、内容负责。


我们第一个用户迅雷,迅雷说往前数五六年,不断有公司或者公安部门找他们想合作,但尝试下来大家对效果都不满意。我们的鉴黄产品,他们尝试下来觉得很惊喜,区别在于我们是用深度学习在做这件事(当时几乎没有公司用同样的技术)。虽然离他们的需求还有一定距离,但那时正好赶上了直播爆发的风口,他们团队也很着急,甚至把硬盘寄给我们,让我们赶紧训练出一个可用的模型。第一个版本,帮他省掉了80%的人力,歼灭了两代鉴黄师。


做人工智能产品,一定要区分什么是确定部分?什么是不确定部分?我知道人工智能一开始是做不准的,当时我们的定价和商业模式也是围绕这么一个原则:能做准的收钱,做不准的部分不收钱。所以我们一开始定价很低。早期,也有客户跟我们纠结准确度如何,我的态度就是——收钱那部分一定要做好,不收钱那部分反正你原先也是用人去做,现在继续用人就好了。


小步快跑,快速迭代。如果要等这个产品完全完善了再推入市场,会花很久的,也没有迭代的可能。我认为应该先获取第一批的数据进来,锻炼你的模型,把你的识别能力提高,再提高人工智能不断迭代的能力。


正好是赶上2015年到2016年直播短视频这个风头,直播生产了大量UGC的图像数据需要平台审核。视频、图文等非实时内容还好,可以通过内容池去平衡内容产生的波峰波谷。但直播内容都是正在发生的,审核人力得要配合平台用户量的发展而增长,还要配合直播高峰、低峰的区别,此外还会有很多突发情况,比如活动或其他热点导致的用户量激增,这时候平台单纯靠人力很难快速响应和匹配。


跟迅雷的这次合作,一开始节省了它80%的人力,现在他们已经完全不用人力审核了,完全信任我们机器的结果。这几十个人力就节省下来转到其他岗位上去了。我们现在审核几亿张图片,如果让人去做,即使是唐马儒这么顶级的鉴黄师(当天活动唐马儒的扮演者李迪在现场),一天要看10万张图片也很崩溃,几亿张图片需要几千人去看。



迅雷、映客、花椒、美拍、小咖秀这些都是我们的客户,我们现在的服务器遍布美国东部、日本、东南亚,在国外很火的Music.ly我们也在服务。


进入人工智能的正确产品路径


人工智能是不是要替代人?终极上讲是要替代人,但是你需要讲求一个路径。我不认可说一开始就做那么强的替代人力,十年前Google的无人车就开始做了,一开始连人的座位都没有,过于激进,做了很多年产品无法落地,到现在核心人员大量流失。而特斯拉一开始做了一辆电动车,预埋了传感器,没有打开无人驾驶的功能时也在搜集大量数据。


收集数据的第一步是辅助驾驶,手可以短暂离开方向盘,但人对最后驾驶结果负责。然后产品不断升级迭代,在某些极端情况下,机器的判断跟人的判断不符,人纠正了这个反馈,慢慢升级到更加安全的状态。很多人觉得无人驾驶是黑科技,但是不是一下子跳到人们面前,而是需要产业链和上下游慢慢配合的。人工智能也不可能是一家公司就做出来,而是整改产业链,有的是做核心技术,有的是做相关服务,从硬件、软件、生态、需求包括客户的认知,整个行业同时去进步。


比如说,移动互联网是第三次工业革命的一个小时代,我们前面有三次工业革命:蒸汽机革命、电器的革命、信息化革命。移动互联网时代是信息化时代的一个小革命,智能手机也不是说一下子成熟,放到30年前,别说手机,电脑都很笨重。地图、音乐、打车、购物、支付、点餐,十几年前的人看到现在这个时代,他会觉得应该已经过了一百年了。其实变化没有那么快,人工智能这个时代给大家的感觉也是这样,每一天都有新的科技在发生,但是大家不会一下子被吓到。有新事物,也会有泡沫,有人当了先驱,有人死于竞争,在一个正常的商业环境中此消彼长。一大波一大波的量变积累成了现在的质变,人工智能的发展一定也是这样。


那我们做的这个人工智能的图像识别审核服务,是我们图像识别里面的其中一个,我们机器替代人工的路径也是这样,先替代大部分的人力,后面再往100%努力。这是人工智能很重要的循环路径,一种方法论,所以人工智能跟其它的互联网的创业可能不太一样。


三大因素,此消彼长


人工智能为什么在这几年爆发呢?是因为有三个要素:

    第一个是数据;

    第二个是计算能力;

    第三个是它的算法。


人们说起人工智能都以为是算法,其实不是这样的,原理其实很简单,但是需要靠大量的数据去学习。我刚才说的三个要素是在2012年被拼起来的:


  • 这些年互联网积累了大量的数据,大量存储在云端;

  • 摩尔定律下CPU的计算能力每18个月提升一倍;

  • 在2012年,深度学习的算法取得了一个比较大的突破,应该叫深度地继续学习



这三个要素加在一起深度学习就起来了,但整个的发展过程中,这三个要素也必须要是互相扶持去发展。比如,算法取得一个突破,计算能力又成了一个瓶颈,然后又逼着像英伟达、因特尔这样的公司去发展相关的技术,也会有芯片厂商生产专门的人工智能芯片。做到了低功耗、大规模计算数据的芯片,计算能力提升后,数据的获取和收集就又变成一个困难的事情。人工智能就是这么循环交替,此消彼长地发展。


数据是关键,更关键的是源源不断的数据生态


无人驾驶也是如此,为什么说特斯拉非常有机会呢?特斯拉十几万辆车在路面上跑,卖出去的车里的传感器铺好了,那收集数据的管道就已经搭好了, 目前应该是最大规模的收集数据管道。


收集数据的能力是做无人驾驶的公司里最强的。计算能力目前不是瓶颈;算法好坏,学界不停地有新的论文出来,大家一直在进步;但是数据的获取反而是商业社会里很困难的事,花钱也不一定买的来。所以在人工智能里,数据决定成败很关键的,尤其是持续获得数据的能力。



其实,我们也是这样的路径,通过种子数据做出第一代产品,然后接入实际应用。这些应用能源源不断地提供数据,又成为新的机器学习样本,继续帮机器提高能力。我们通过新的样本训练出新的模型,每个应用来的数据样本有不一样的特征,客户需求也总有20%不一样,新的需求又催生我们做新的产品功能。继而能服务更多客户,他们也会源源不断地给我们提供数据,由此形成了一个正向的循环生态。


这跟2C的应用不太一样,2C应用不一定需要用户参与,比如美图做好美颜功能就行,滴滴做好打车功能就行,不需要用户参与开发过程。自信如乔布斯,直接把产品做出来给你。但是人工智能一定要有数据循环参与,数据的重要程度我认为占到60%到70%。


从数据上来看,全民直播是伪命题


新的数据进来,让我们能提供更多的产品功能。


举几个例子,我们在基础的审核功能上,加上了大数据标签功能,可以机器分辨主播是什么类型:小清新、潮女、御姐、小鲜肉,审美还是审丑,室内还是户外,辅助产品做个性化的推荐,而不用一个个人工去看大标签了。



全民直播可能还是一个伪命题。我们发现大部分直播还是发生在室内场景,这就说明直播目前还主要是秀场模式,固定下来给你看。如果真的是渗入生活方式的全民直播,场景应该比较分散,直播就真正成为一种生活方式了,但现在还是以表演形式为主。


加入了人脸识别技术后,我们能辨别用户上传的头像是不是明星或者政府敏感人物,如果是明星我就能分辨他上传的是不是自己的头像,涉及政治敏感的信息能尽快警示平台处理,这也是平台风险所在。


说几个图像识别的具体应用,我们之前在做QQ邮箱时,广告图片真的是很头痛,稍微变一个字或水印又是新的难题。现在可以用人工智能识别出图片上的文字,是不是垃圾广告。除了监测,人工智能还能有创造性,俄罗斯团队的Prisma,能把图片变成名画的风格。


Face APP,能把不笑的照片生成你笑的样子,男生能生成如果是女生的样子,女生生成男生的样子,你老的样子,小时候的样子等等,(现在正流行的是一键卸妆)都是在艺术的理解上,通过人工智能做出的加工。


从入门到精通,客户推着你,渐进式提升产品


这个是我们目前提供的几十个图像识别的接口,我们是这样区分: 



产品经理都会很讲究一个核心需求是什么?设计产品也是如此,不同阶段需要的产品不一样。在1.0的时候我们不要做2.0的事情。


复盘我们的发展经历就是从内容审核这个强需求,到“大数据标签”“人脸识别”等提升运营能力的需求。直播、短视频刚刚起来那一波,直播最基础的需求就是不涉黄、不违法,才能合法地活下去。到了A轮之后积累了一定用户,才是说如何靠更合理地运用手段,去匹配流量和用户的兴趣。如果我一上来就给他推高阶的人工智能,他也一定不会感兴趣,至少不会对你的技术信任,接下来就很难谈了。


我记得我们刚创业,就有做视频广告平台的,那个时候行业还没发展到,这个需求过早了。企业客户应该先用强需求把他们接进来,在跟客户发生链接,顺着他的需求往上走。我需要他们的数据,用了他们的数据就更理解他们的内容,等他们更高层次的需求来了,再把新的产品拿出来,用户还会配合你去测试,顺理成章。



我们每天大量的数据都是财富,这些都是我们后面需要挖掘的新空间,所以这些数据保存下来是非常宝贵的财富。很多的人工智能公司可能还要花钱去买数据,我们是让用户交了钱把数据给到我们。我们积累了海量数据,积累了大量的相关算法和技术,也通过正向的积累让公司盈亏达到平衡点,让团队能够在用户需求的压力下快速成长。而不是说我们闷着头,两年、三年靠着团队的想象力做出来一个产品,再去试市场的需求。


我们每一次迭代,都是在用户的压力下,推着你去做的。不需要我催,客户去催团队,团队觉得自己做的事情是有价值的,那你自己就做起来很有动力,而且有方向感。用户用的过程中有什么问题?准或者不准?成本高还是低?你都能及时获得反馈。这才是把一个商业做扎实的保证,而不仅仅是是靠一个顶尖的技术去实现的,它是一个整体平台,成本、稳定性、准确度、应用性等等很多方面结合起来。



培养名叫“人工智能“的思维方式


我们不一定仅仅服务互联网客户,而要拓展到其它领域去,通过可以复用的能力,用云服务的方式,再应用到其它的领域。比如说商业智能、智能家居、智能制造等等,然后慢慢地一个个去服务。但这个服务的路径不是我们去选择,其实是看每个行业商业发展的程度。因为有些行业比较传统,对它来说可能它的问题不是人工智能,信息化都还没有做到。信息化程度比较高的互联网行业,我们就可以去进入。


如果说人工智能是一个时代,10年以后小孩子对人工智能基础的理解肯定是优于他的长辈,在他初中、高中的时候就大概就能够知道网络原理、基本函数。我们对于内部的同事培训,不管你是销售还是HR,还是市场,都要求他们去学习人工智能的基础知识贝叶斯公式,概率论、统计学、线性代数……人工智能是在多维的空间里学习出来的一种模式,所以你要有这种基础的思考方式。


每一代人的思考方式都会不太一样,我们要扭转一下这种方式,大家可能要从底层去考虑社会组织形式、产品组织形式。比如无人驾驶,原先车是放在停车场里,它是连接不了的,有了无人驾驶后,这个车就自动开过来接你,新的连接就出现了。


人工智能的创业可能就不是你做一些小的切入点,然后再尝试怎么样。后面社会连接比较充分后,可能少部分有人工智能思维的人,在这个网络里找到一个突破点后,就获得更大的利益。


因为人工智能,或许以后的贫富差距会加剧,少部分掌握算法的人会积累大量的财富。而其他的很多人甚至工作都会丢失掉,尤其是对于技术工种、残疾人的很多工作都会替代掉,我们替代掉的鉴黄师很大部分从业者就是残疾人士。


大家可能不知道,我们有一些合作伙伴里会去把鉴黄的人力网络铺到3、4线城市里,这些残疾人原先没有工作,之前在家里是很被鄙视的。好不容易有这么一份工作,一个月还能够拿到1500块钱,对于他们来说已经算是高收入了。他一下子从不被待见的人,变成家里的经济顶梁柱了。但我们的产品会让他们失业,并且很难被找回来了。因为低难度、重复的事情一定是最先被人工智能所取代掉的。这部分人的工作和收入问题,是社会要去考虑的。


当年ios工程师也很贵,现在满大街都是,目前能做人工智能的工程师可能是少的,因为有巨大的商业价值,大家都会往这个方向去投入。如果有一天每个团队自己都有这个能力,我们还去提供什么服务呢?


我们做人工智能基础的商业模式,肯定不是建立在黑科技基础上,而是建立在规模化的复用。即便团队自己做,成本、管理难度上也不比使用我们的服务要轻、便宜、方便,就跟大家都使用云服务去降低成本一样。我们比云服务多一点壁垒就是数据,一个是样本量要大,另一个是数据的多样性也很重要,如果都是单一数据,很难训练出来强壮的模型。



做人工智能还是要结合自己的行业去思考,可以借鉴我说的这套发展路径和思考方式,但每个行业也会有特定的问题。在人工智能这个大潮里,人工智能不是个单一产业,而是人工智能+,要渗透到各个行业里去,就像互联网+去提供信息化的能力一样。


我作为人工智能的创业者,当然希望这个事情能够在这个行业去站住脚,通过我们去改造一些行业。但是我觉得更大的改变,还是各个行业的人自发去理解人工智能的能力和产品的边界,去自发改造。以后专业的人才也会越来越多,大家也不那么焦虑,理解你的行业,明白你的需求,然后方法要得法。不要为了人工智能而人工智能。OK,我的分享到这里。


Q&A环节


1.问:目前人工智能在哪几个领域有比较大的机会?后来的创业者进入的机会有哪些?

 

答:哪些行业会率先被人工智能改造?我觉得有2个原则:

 

1.行业的发展需要智能批量化地去解决;

2.行业里有简单重复的工种,机器容易替代。

 

举几个例子,有人觉得驾驶很容易,所以很多人去做无人驾驶,因为它符合“看起来机器也能够做到”的特点;其次行业发展成熟后,市场基数够大,可以批量应用。医疗领域用人工智能看片子、做配方,解决医生数量不足的问题,思路是对的,但这种行业不一定是留给创业者的。

 

人工智能领域留给创业者的机会越来越少。

 

在医疗这种传统行业,医疗器械的厂商都是西门子级别的顶级公司,技术、人才、资金都不缺,创业者想要代替,无论从技术还是从渠道来说都很困难。无人驾驶方向更因为传统车厂,像丰田、福特、奔驰可以自行研究升级,新手入门很难分得一杯羹。如果说创业者你不能用两、三年的时间快速积累足够好的数据,跟老牌厂商达成合作,失败几乎是必然。

 

连通性好的行业更容易被改造,比如说智能客服。有一些行业可能不太容易被改造,但商机巨大,也会吸引很多人进入。比如说像无人驾驶、工业机器人,虽然技术上比较困难,但是它改造成功后的商业利益够大,这些领域也有可能会被改造。

 

在工业智能里面,某些行业、某些生产厂的产品比较容易被改造,比如说富士康的手机生产,因为它本来就是电子化的仪器生产。

 

有一些传统行业,比如说纺织、成衣加工,这些行业原先就靠人去剪裁,这些行业如果直接通过人工智能改造,相对来说比较困难,改造起来价值可能也不如电子数码产品那么大,所以这种行业的优先级不高。

 

2.问:从盈利的角度,是不是2B领域更好一点?2C的机会是不是已经被BAT给垄断了?

 

答:人工智能是一个技术,技术是拿来去实现产品的,要首先考虑用户的需求。


还要想一想这个产品是不是一定要用人工智能去实现。


现在人工智能被滥用了,虽然很多产品有了人工智能的影子,比如说2C的家居机器人、今日头条、智能洗衣机、小米电视等,都运用了人工智能技术,但我不觉得它是一个人工智能产品。

 

3.问:切换行业和应用的时候,可能行业壁垒会大于技术壁垒,那你们是怎么克服的?

 

答:我们是一个2B的服务,所以我们不用去克服行业壁垒,我们只是服务于行业,壁垒我们碰不到。当行业有需求,我们就去服务,只是解决它某一部分的需求,所以并没有说通过服务就跨越了不同的行业。

 

比如说人脸识别系统,各行各业因为不同的需求来调用,但是人脸识别是一个标准化的技术,我们就提供一个标准化的服务。

 

行业壁垒分为四个层面:

 

第一个层面是技术。

第二个层面是产品。

第三个层面是资金。

第四个层面是人。

 

技术是为了推出产品。各种岗位都有自己的技术,美工有美工的技术,产品经理有产品经理的技术,销售有销售的技术,这些技术是为了拼出这个产品,终极目的是赚钱。有些是好的产品,但没有好的商业模式,比如说QQ邮箱。它是一个好产品,但是它不赚钱,如果拿来创业,估计没有什么人会投资。

 

更高层面就是人,人的关键点是协作。你跟合作伙伴、跟客户、跟政府都会发生合作的关系。这四个层面并非断裂,而是像螺旋一样向上连接。人和人之间的协作关系是会发生改变的,举个极端的例子,如果战争发生,如今所有的商业模式、技术全都要洗牌,因为最需要的变成了枪械、车辆、金属。人的关系发生了根本变化,更宏观的东西发生了根本变化。

 

比如说滴滴代驾之前,e代驾也做得挺好,谁也没想到一个打车软件最后把一个代驾软件给搞死了,这就是人的需求和产品的模式变化后的影响。

 

4.问:现在小孩要学的东西越来越多,未来人工智能会渗入到每一个行业,您觉得现在的小孩子应该学一些什么才能适应未来的发展呢?

 

答:有一种观点我很赞同:小孩子不要去学太多技能,应该是学素质。

 

让一个孩子去记去理解很多成人的东西,这种广度的发展对于小孩子来说是很累的,反而是基础的一些智能,比如说好奇心、逻辑性、韧性,他自己的一些人生愿景,这些东西是最重要的。

 

等到他大学的时候,他再去看那些书,可能比小学的时候花费10天的效果都要好。基础的素质、逻辑的教育才是最主要的,再一个现在网上很多课程都很好,不一定就是学校的老师最好。

 

比如说数学,有一个可汗学院(KHAN ACADEMY),那个老师教的非常好,在美国很多学校老师是不上课的,就只是当一个助教批改作业,因为你肯定讲不过最顶级的老师,那还不如放录像就好,这也是语音化的一种教育。


当有一个人把某项课程做到顶级,其他人就不用再做重复的事情了。我觉得老师最终是要被替代掉的,放视频哪一个地方卡住了,暂停一下先去找相关背景知识,每个人的进度可以自己控制。这种学习方法挺好,不仅可以碎片化地学习,还可以用合适的方式、节奏去学习,更适合现在的互联网思维。

 

5.问:IBM的服务对于体育赛事的变现,或者说盈利是怎么做的?

 

答:我对IBM模式还真不是很清楚。

 

我跟你说另外一个例子,现在像很多量化交易、量化金融,就是买卖股票很多是由智能机器去完成的,相当于是收集很多的信息后去帮助决策,它是非常高等级的交易,但是买卖非常快速,所以它不求每一次都赚,只追求整体的盈利。像华尔街很多投行都是用机器做这方面的事情,有很多人工智能教授、学者也在华尔街,甚至自己创业。

 

有一个叫做文艺复兴的量化投资公司,它去年的利润是几十亿美金。特朗普说自己是亿万富翁,身价几十亿,这个公司一年的利润就有那么多。这个公司的老板是一个很有名的数学教授。你看数学家们把人工智能的知识应用在什么地方?尤其是博彩这种形态,使得数据分析非常有价值,如果没有博彩的存在,也许人工智能就只能给教练去做决策分析。


本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声