【圆桌第19圈 - 专享笔记】李明强：人工智能技术如何产品化落地？ - 妙投

虎嗅注：很多人都说人工智能是大公司才有入场券的游戏，小公司出去创业的就别想了。除了技术实力，庞大的数据量就干死一大波的淘金者。但只有大平台才能积累大数据吗？未必如此。图普科技的李明强，腾讯T4出来创业，机缘巧合碰上了直播的快速崛起。通过提供基础的鉴黄服务，一步步积累数据、锻炼机器，也赚到了进入图像人工智能领域的入场券。

虎嗅会员圆桌邀请到图普科技CEO李明强，讲讲不是大公司，怎么找到进入人工智能的把手。这次分享主要回答了如何规划合理的人工智能产品路径？如何低成本的获取大数据？如何建立正循环的AI生态？等问题，还是那句话，实践出真知。

小步快跑，先找准切口跑起来

2013年出来创业，我们是国内创业团队里最早去尝试深度学习技术的公司。但刚开始创业要选择一个小的切口，找到刚需，而不是以上来就贪大求全，如果你不是捞偏门，就要对你的产品、内容负责。

我们第一个用户迅雷，迅雷说往前数五六年，不断有公司或者公安部门找他们想合作，但尝试下来大家对效果都不满意。我们的鉴黄产品，他们尝试下来觉得很惊喜，区别在于我们是用深度学习在做这件事（当时几乎没有公司用同样的技术）。虽然离他们的需求还有一定距离，但那时正好赶上了直播爆发的风口，他们团队也很着急，甚至把硬盘寄给我们，让我们赶紧训练出一个可用的模型。第一个版本，帮他省掉了80%的人力，歼灭了两代鉴黄师。

做人工智能产品，一定要区分什么是确定部分？什么是不确定部分？我知道人工智能一开始是做不准的，当时我们的定价和商业模式也是围绕这么一个原则：能做准的收钱，做不准的部分不收钱。所以我们一开始定价很低。早期，也有客户跟我们纠结准确度如何，我的态度就是——收钱那部分一定要做好，不收钱那部分反正你原先也是用人去做，现在继续用人就好了。

小步快跑，快速迭代。如果要等这个产品完全完善了再推入市场，会花很久的，也没有迭代的可能。我认为应该先获取第一批的数据进来，锻炼你的模型，把你的识别能力提高，再提高人工智能不断迭代的能力。

正好是赶上2015年到2016年直播短视频这个风头，直播生产了大量UGC的图像数据需要平台审核。视频、图文等非实时内容还好，可以通过内容池去平衡内容产生的波峰波谷。但直播内容都是正在发生的，审核人力得要配合平台用户量的发展而增长，还要配合直播高峰、低峰的区别，此外还会有很多突发情况，比如活动或其他热点导致的用户量激增，这时候平台单纯靠人力很难快速响应和匹配。

跟迅雷的这次合作，一开始节省了它80%的人力，现在他们已经完全不用人力审核了，完全信任我们机器的结果。这几十个人力就节省下来转到其他岗位上去了。我们现在审核几亿张图片，如果让人去做，即使是唐马儒这么顶级的鉴黄师（当天活动唐马儒的扮演者李迪在现场），一天要看10万张图片也很崩溃，几亿张图片需要几千人去看。

迅雷、映客、花椒、美拍、小咖秀这些都是我们的客户，我们现在的服务器遍布美国东部、日本、东南亚，在国外很火的Music.ly我们也在服务。

进入人工智能的正确产品路径

人工智能是不是要替代人？终极上讲是要替代人，但是你需要讲求一个路径。我不认可说一开始就做那么强的替代人力，十年前Google的无人车就开始做了，一开始连人的座位都没有，过于激进，做了很多年产品无法落地，到现在核心人员大量流失。而特斯拉一开始做了一辆电动车，预埋了传感器，没有打开无人驾驶的功能时也在搜集大量数据。

收集数据的第一步是辅助驾驶，手可以短暂离开方向盘，但人对最后驾驶结果负责。然后产品不断升级迭代，在某些极端情况下，机器的判断跟人的判断不符，人纠正了这个反馈，慢慢升级到更加安全的状态。很多人觉得无人驾驶是黑科技，但是不是一下子跳到人们面前，而是需要产业链和上下游慢慢配合的。人工智能也不可能是一家公司就做出来，而是整改产业链，有的是做核心技术，有的是做相关服务，从硬件、软件、生态、需求包括客户的认知，整个行业同时去进步。

比如说，移动互联网是第三次工业革命的一个小时代，我们前面有三次工业革命：蒸汽机革命、电器的革命、信息化革命。移动互联网时代是信息化时代的一个小革命，智能手机也不是说一下子成熟，放到30年前，别说手机，电脑都很笨重。地图、音乐、打车、购物、支付、点餐，十几年前的人看到现在这个时代，他会觉得应该已经过了一百年了。其实变化没有那么快，人工智能这个时代给大家的感觉也是这样，每一天都有新的科技在发生，但是大家不会一下子被吓到。有新事物，也会有泡沫，有人当了先驱，有人死于竞争，在一个正常的商业环境中此消彼长。一大波一大波的量变积累成了现在的质变，人工智能的发展一定也是这样。

那我们做的这个人工智能的图像识别审核服务，是我们图像识别里面的其中一个，我们机器替代人工的路径也是这样，先替代大部分的人力，后面再往100%努力。这是人工智能很重要的循环路径，一种方法论，所以人工智能跟其它的互联网的创业可能不太一样。

三大因素，此消彼长

人工智能为什么在这几年爆发呢？是因为有三个要素：
第一个是数据；
第二个是计算能力；
第三个是它的算法。

人们说起人工智能都以为是算法，其实不是这样的，原理其实很简单，但是需要靠大量的数据去学习。我刚才说的三个要素是在2012年被拼起来的：

这些年互联网积累了大量的数据，大量存储在云端；
摩尔定律下CPU的计算能力每18个月提升一倍；
在2012年，深度学习的算法取得了一个比较大的突破，应该叫深度地继续学习。

这三个要素加在一起深度学习就起来了，但整个的发展过程中，这三个要素也必须要是互相扶持去发展。比如，算法取得一个突破，计算能力又成了一个瓶颈，然后又逼着像英伟达、因特尔这样的公司去发展相关的技术，也会有芯片厂商生产专门的人工智能芯片。做到了低功耗、大规模计算数据的芯片，计算能力提升后，数据的获取和收集就又变成一个困难的事情。人工智能就是这么循环交替，此消彼长地发展。

数据是关键，更关键的是源源不断的数据生态

无人驾驶也是如此，为什么说特斯拉非常有机会呢？特斯拉十几万辆车在路面上跑，卖出去的车里的传感器铺好了，那收集数据的管道就已经搭好了，目前应该是最大规模的收集数据管道。

收集数据的能力是做无人驾驶的公司里最强的。计算能力目前不是瓶颈；算法好坏，学界不停地有新的论文出来，大家一直在进步；但是数据的获取反而是商业社会里很困难的事，花钱也不一定买的来。所以在人工智能里，数据决定成败很关键的，尤其是持续获得数据的能力。

其实，我们也是这样的路径，通过种子数据做出第一代产品，然后接入实际应用。这些应用能源源不断地提供数据，又成为新的机器学习样本，继续帮机器提高能力。我们通过新的样本训练出新的模型，每个应用来的数据样本有不一样的特征，客户需求也总有20%不一样，新的需求又催生我们做新的产品功能。继而能服务更多客户，他们也会源源不断地给我们提供数据，由此形成了一个正向的循环生态。

这跟2C的应用不太一样，2C应用不一定需要用户参与，比如美图做好美颜功能就行，滴滴做好打车功能就行，不需要用户参与开发过程。自信如乔布斯，直接把产品做出来给你。但是人工智能一定要有数据循环参与，数据的重要程度我认为占到60%到70%。

从数据上来看，全民直播是伪命题

新的数据进来，让我们能提供更多的产品功能。

举几个例子，我们在基础的审核功能上，加上了大数据标签功能，可以机器分辨主播是什么类型：小清新、潮女、御姐、小鲜肉，审美还是审丑，室内还是户外，辅助产品做个性化的推荐，而不用一个个人工去看大标签了。

全民直播可能还是一个伪命题。我们发现大部分直播还是发生在室内场景，这就说明直播目前还主要是秀场模式，固定下来给你看。如果真的是渗入生活方式的全民直播，场景应该比较分散，直播就真正成为一种生活方式了，但现在还是以表演形式为主。

加入了人脸识别技术后，我们能辨别用户上传的头像是不是明星或者政府敏感人物，如果是明星我就能分辨他上传的是不是自己的头像，涉及政治敏感的信息能尽快警示平台处理，这也是平台风险所在。

说几个图像识别的具体应用，我们之前在做QQ邮箱时，广告图片真的是很头痛，稍微变一个字或水印又是新的难题。现在可以用人工智能识别出图片上的文字，是不是垃圾广告。除了监测，人工智能还能有创造性，俄罗斯团队的Prisma，能把图片变成名画的风格。

Face APP，能把不笑的照片生成你笑的样子，男生能生成如果是女生的样子，女生生成男生的样子，你老的样子，小时候的样子等等，（现在正流行的是一键卸妆）都是在艺术的理解上，通过人工智能做出的加工。

从入门到精通，客户推着你，渐进式提升产品

这个是我们目前提供的几十个图像识别的接口，我们是这样区分：

产品经理都会很讲究一个核心需求是什么？设计产品也是如此，不同阶段需要的产品不一样。在1.0的时候我们不要做2.0的事情。

复盘我们的发展经历就是从内容审核这个强需求，到“大数据标签”“人脸识别”等提升运营能力的需求。直播、短视频刚刚起来那一波，直播最基础的需求就是不涉黄、不违法，才能合法地活下去。到了A轮之后积累了一定用户，才是说如何靠更合理地运用手段，去匹配流量和用户的兴趣。如果我一上来就给他推高阶的人工智能，他也一定不会感兴趣，至少不会对你的技术信任，接下来就很难谈了。

我记得我们刚创业，就有做视频广告平台的，那个时候行业还没发展到，这个需求过早了。企业客户应该先用强需求把他们接进来，在跟客户发生链接，顺着他的需求往上走。我需要他们的数据，用了他们的数据就更理解他们的内容，等他们更高层次的需求来了，再把新的产品拿出来，用户还会配合你去测试，顺理成章。

我们每天大量的数据都是财富，这些都是我们后面需要挖掘的新空间，所以这些数据保存下来是非常宝贵的财富。很多的人工智能公司可能还要花钱去买数据，我们是让用户交了钱把数据给到我们。我们积累了海量数据，积累了大量的相关算法和技术，也通过正向的积累让公司盈亏达到平衡点，让团队能够在用户需求的压力下快速成长。而不是说我们闷着头，两年、三年靠着团队的想象力做出来一个产品，再去试市场的需求。

我们每一次迭代，都是在用户的压力下，推着你去做的。不需要我催，客户去催团队，团队觉得自己做的事情是有价值的，那你自己就做起来很有动力，而且有方向感。用户用的过程中有什么问题？准或者不准？成本高还是低？你都能及时获得反馈。这才是把一个商业做扎实的保证，而不仅仅是是靠一个顶尖的技术去实现的，它是一个整体平台，成本、稳定性、准确度、应用性等等很多方面结合起来。

培养名叫“人工智能“的思维方式

我们不一定仅仅服务互联网客户，而要拓展到其它领域去，通过可以复用的能力，用云服务的方式，再应用到其它的领域。比如说商业智能、智能家居、智能制造等等，然后慢慢地一个个去服务。但这个服务的路径不是我们去选择，其实是看每个行业商业发展的程度。因为有些行业比较传统，对它来说可能它的问题不是人工智能，信息化都还没有做到。信息化程度比较高的互联网行业，我们就可以去进入。

如果说人工智能是一个时代，10年以后小孩子对人工智能基础的理解肯定是优于他的长辈，在他初中、高中的时候就大概就能够知道网络原理、基本函数。我们对于内部的同事培训，不管你是销售还是HR，还是市场，都要求他们去学习人工智能的基础知识贝叶斯公式，概率论、统计学、线性代数……人工智能是在多维的空间里学习出来的一种模式，所以你要有这种基础的思考方式。

每一代人的思考方式都会不太一样，我们要扭转一下这种方式，大家可能要从底层去考虑社会组织形式、产品组织形式。比如无人驾驶，原先车是放在停车场里，它是连接不了的，有了无人驾驶后，这个车就自动开过来接你，新的连接就出现了。

人工智能的创业可能就不是你做一些小的切入点，然后再尝试怎么样。后面社会连接比较充分后，可能少部分有人工智能思维的人，在这个网络里找到一个突破点后，就获得更大的利益。

因为人工智能，或许以后的贫富差距会加剧，少部分掌握算法的人会积累大量的财富。而其他的很多人甚至工作都会丢失掉，尤其是对于技术工种、残疾人的很多工作都会替代掉，我们替代掉的鉴黄师很大部分从业者就是残疾人士。

大家可能不知道，我们有一些合作伙伴里会去把鉴黄的人力网络铺到3、4线城市里，这些残疾人原先没有工作，之前在家里是很被鄙视的。好不容易有这么一份工作，一个月还能够拿到1500块钱，对于他们来说已经算是高收入了。他一下子从不被待见的人，变成家里的经济顶梁柱了。但我们的产品会让他们失业，并且很难被找回来了。因为低难度、重复的事情一定是最先被人工智能所取代掉的。这部分人的工作和收入问题，是社会要去考虑的。

当年ios工程师也很贵，现在满大街都是，目前能做人工智能的工程师可能是少的，因为有巨大的商业价值，大家都会往这个方向去投入。如果有一天每个团队自己都有这个能力，我们还去提供什么服务呢？

我们做人工智能基础的商业模式，肯定不是建立在黑科技基础上，而是建立在规模化的复用。即便团队自己做，成本、管理难度上也不比使用我们的服务要轻、便宜、方便，就跟大家都使用云服务去降低成本一样。我们比云服务多一点壁垒就是数据，一个是样本量要大，另一个是数据的多样性也很重要，如果都是单一数据，很难训练出来强壮的模型。

做人工智能还是要结合自己的行业去思考，可以借鉴我说的这套发展路径和思考方式，但每个行业也会有特定的问题。在人工智能这个大潮里，人工智能不是个单一产业，而是人工智能+，要渗透到各个行业里去，就像互联网＋去提供信息化的能力一样。

我作为人工智能的创业者，当然希望这个事情能够在这个行业去站住脚，通过我们去改造一些行业。但是我觉得更大的改变，还是各个行业的人自发去理解人工智能的能力和产品的边界，去自发改造。以后专业的人才也会越来越多，大家也不那么焦虑，理解你的行业，明白你的需求，然后方法要得法。不要为了人工智能而人工智能。OK，我的分享到这里。

Q&A环节

1.问：目前人工智能在哪几个领域有比较大的机会？后来的创业者进入的机会有哪些？

答：哪些行业会率先被人工智能改造？我觉得有2个原则：

1.行业的发展需要智能批量化地去解决；
2.行业里有简单重复的工种，机器容易替代。

举几个例子，有人觉得驾驶很容易，所以很多人去做无人驾驶，因为它符合“看起来机器也能够做到”的特点；其次行业发展成熟后，市场基数够大，可以批量应用。医疗领域用人工智能看片子、做配方，解决医生数量不足的问题，思路是对的，但这种行业不一定是留给创业者的。

人工智能领域留给创业者的机会越来越少。

在医疗这种传统行业，医疗器械的厂商都是西门子级别的顶级公司，技术、人才、资金都不缺，创业者想要代替，无论从技术还是从渠道来说都很困难。无人驾驶方向更因为传统车厂，像丰田、福特、奔驰可以自行研究升级，新手入门很难分得一杯羹。如果说创业者你不能用两、三年的时间快速积累足够好的数据，跟老牌厂商达成合作，失败几乎是必然。

连通性好的行业更容易被改造，比如说智能客服。有一些行业可能不太容易被改造，但商机巨大，也会吸引很多人进入。比如说像无人驾驶、工业机器人，虽然技术上比较困难，但是它改造成功后的商业利益够大，这些领域也有可能会被改造。

在工业智能里面，某些行业、某些生产厂的产品比较容易被改造，比如说富士康的手机生产，因为它本来就是电子化的仪器生产。

有一些传统行业，比如说纺织、成衣加工，这些行业原先就靠人去剪裁，这些行业如果直接通过人工智能改造，相对来说比较困难，改造起来价值可能也不如电子数码产品那么大，所以这种行业的优先级不高。

2.问：从盈利的角度，是不是2B领域更好一点？2C的机会是不是已经被BAT给垄断了？

答：人工智能是一个技术，技术是拿来去实现产品的，要首先考虑用户的需求。

还要想一想这个产品是不是一定要用人工智能去实现。

现在人工智能被滥用了，虽然很多产品有了人工智能的影子，比如说2C的家居机器人、今日头条、智能洗衣机、小米电视等，都运用了人工智能技术，但我不觉得它是一个人工智能产品。

3.问：切换行业和应用的时候，可能行业壁垒会大于技术壁垒，那你们是怎么克服的？

答：我们是一个2B的服务，所以我们不用去克服行业壁垒，我们只是服务于行业，壁垒我们碰不到。当行业有需求，我们就去服务，只是解决它某一部分的需求，所以并没有说通过服务就跨越了不同的行业。

比如说人脸识别系统，各行各业因为不同的需求来调用，但是人脸识别是一个标准化的技术，我们就提供一个标准化的服务。

行业壁垒分为四个层面：

第一个层面是技术。
第二个层面是产品。
第三个层面是资金。
第四个层面是人。

技术是为了推出产品。各种岗位都有自己的技术，美工有美工的技术，产品经理有产品经理的技术，销售有销售的技术，这些技术是为了拼出这个产品，终极目的是赚钱。有些是好的产品，但没有好的商业模式，比如说QQ邮箱。它是一个好产品，但是它不赚钱，如果拿来创业，估计没有什么人会投资。

更高层面就是人，人的关键点是协作。你跟合作伙伴、跟客户、跟政府都会发生合作的关系。这四个层面并非断裂，而是像螺旋一样向上连接。人和人之间的协作关系是会发生改变的，举个极端的例子，如果战争发生，如今所有的商业模式、技术全都要洗牌，因为最需要的变成了枪械、车辆、金属。人的关系发生了根本变化，更宏观的东西发生了根本变化。

比如说滴滴代驾之前，e代驾也做得挺好，谁也没想到一个打车软件最后把一个代驾软件给搞死了，这就是人的需求和产品的模式变化后的影响。

4.问：现在小孩要学的东西越来越多，未来人工智能会渗入到每一个行业，您觉得现在的小孩子应该学一些什么才能适应未来的发展呢？

答：有一种观点我很赞同：小孩子不要去学太多技能，应该是学素质。

让一个孩子去记去理解很多成人的东西，这种广度的发展对于小孩子来说是很累的，反而是基础的一些智能，比如说好奇心、逻辑性、韧性，他自己的一些人生愿景，这些东西是最重要的。

等到他大学的时候，他再去看那些书，可能比小学的时候花费10天的效果都要好。基础的素质、逻辑的教育才是最主要的，再一个现在网上很多课程都很好，不一定就是学校的老师最好。

比如说数学，有一个可汗学院（KHAN ACADEMY），那个老师教的非常好，在美国很多学校老师是不上课的，就只是当一个助教批改作业，因为你肯定讲不过最顶级的老师，那还不如放录像就好，这也是语音化的一种教育。

当有一个人把某项课程做到顶级，其他人就不用再做重复的事情了。我觉得老师最终是要被替代掉的，放视频哪一个地方卡住了，暂停一下先去找相关背景知识，每个人的进度可以自己控制。这种学习方法挺好，不仅可以碎片化地学习，还可以用合适的方式、节奏去学习，更适合现在的互联网思维。

5.问：IBM的服务对于体育赛事的变现，或者说盈利是怎么做的？

答：我对IBM模式还真不是很清楚。

我跟你说另外一个例子，现在像很多量化交易、量化金融，就是买卖股票很多是由智能机器去完成的，相当于是收集很多的信息后去帮助决策，它是非常高等级的交易，但是买卖非常快速，所以它不求每一次都赚，只追求整体的盈利。像华尔街很多投行都是用机器做这方面的事情，有很多人工智能教授、学者也在华尔街，甚至自己创业。

有一个叫做文艺复兴的量化投资公司，它去年的利润是几十亿美金。特朗普说自己是亿万富翁，身价几十亿，这个公司一年的利润就有那么多。这个公司的老板是一个很有名的数学教授。你看数学家们把人工智能的知识应用在什么地方？尤其是博彩这种形态，使得数据分析非常有价值，如果没有博彩的存在，也许人工智能就只能给教练去做决策分析。

【圆桌第19圈 - 专享笔记】李明强：人工智能技术如何产品化落地？

评论

最新评论