去搜搜
头像
华为造车迈出关键一步,合成语音进步让诈骗更容易,旷视用鼻纹找狗【一周前沿科技热点】
2019-07-12 19:41

华为造车迈出关键一步,合成语音进步让诈骗更容易,旷视用鼻纹找狗【一周前沿科技热点】

文章所属专栏 前沿技术情报所

新一期的周报与大家见面了,在本期周报里,我们跟大家聊一下最近在AI、大数据、云计算等领域的新进展。

 

华为要做高精地图了

 

先来看一下华为的消息。最近华为获得导航电子地图制作甲级资质的消息,似乎没有引起大家的关注。自然资源部网站最近公示了华为导航电子地图制作甲级资质的申请。在公示通过后,华为将成为我国第20家可以依法制作自动驾驶地图(高精地图)的企业,华为自动驾驶技术的研发体系也将更加完整。


这个牌照并不好拿,吉利老板李书福曾在2017年两会上提交提案呼吁适度放开高精地图牌照申请,让车厂也能参与进来。不过到现在也未实现。顺便说一下这个资质跟互联网地图不一样,对申请厂商资质的要求高不少。

 

拿到导航电子地图制作甲级资质,这应该是华为造车的关键一步。当然华为不会去做整车厂,而是做“车联网的模块,汽车中的电子部分”,向车厂提供智能网联、自动驾驶相关的模块。


这其中,自动驾驶地图是非常关键的一环,可以说没有自动驾驶地图,就没有自动驾驶。之前人们觉得有传感器、激光雷达去感知周边环境来做出判断就可以了,后来发现不够,汽车对环境不熟,做出识别后来不及做判断和规划,还是要实现车路协同,让车更了解路面的情况,从而更顺畅地做出决策


高精地图的价值在于,提供更多驾驶辅助信息,除了车道属性的信息外,还会提供防护栏、周边树木、道路边缘类型、路边地标等更详细的目标数据,另外还可以通过位置定位信息与车速,计算车辆与周边环境的距离,从而使行车更安全。

 

华为要在自动驾驶领域有所作为,就不能不做高精度地图。不过对于华为来讲,做高精地图的挑战是很大的。


先说说规模化,地图要有大范围地理区域的信息,才有更大的价值。这是关键的难点。我们知道在北京就会有大量的道路交汇点,需要高精地图匹配上。全国的道路交汇点,几乎可以说是无数了。在这么多的交汇点做到只有20厘米左右的误差精度,难度会有多大,可想而知。企业要去通过激光点云、图像等手段去实现,工作量是相当大的


而且也有不少技术难题,例如在激光点云方面,往往需要多次测量,每次测量的绝对精度不一样,会导致影像出现重影,影响地图使用。在点云的特征提取上,需要大量业内人员进行特征提取,效率比较低


其次,即使做到了大范围的覆盖,也还要进行实时更新。例如某条道路重新划线了,高精地图要很快去识别这变化。

 

语音合成技术的新进展

 

虽然难度高,但相信华为凭借自身的技术能力,还是可以在这块领域闯出一番天地。到时候可以用华为的地图来导航了。我们习惯了高德导航的声音,可以在林志玲和郭德纲之间切换。未来可以在使用华为导航的时候,听听华为代言人(如梅西、胡歌、鹿晗等)的声音。

 

这些声音其实都是用技术合成的。最近阿里达摩院发布了新的语音合成技术 KAN-TTS。语音合成是一种将文字转化成语音的技术,可以为智能音箱、个人虚拟助理等应用提供技术支持,我们平时用的小度音箱、天猫精灵、高德导航能够发出声音,用的就是语音合成的技术。而我们平时接到的很多营销电话,也是外呼机器人打过来的,机器人的语音也合成的。

 

达摩院称,该技术可以将合成语音与原始音频录音的接近程度,从85%到90%之间,提高到97%以上。且可以提供34种不同的声音,如稚嫩孩童的声音、温柔女性的声音等。另外在成本上做到了降低,以往语音合成定制需要十小时以上的数据录制与标注,定制周期在半年以上,该技术则只需要1小时录制数据,定制周期不到两个月。总结来说,该技术可以形成更短的数据录制周期,合成更像人类的语音。目前该技术已经集成到阿里云上,并在高德地图、天猫精灵、夸克浏览器上获得了应用。

 

当然,这是达摩院的实验室数据,真正落地到客户的产品中,可能效果没有宣传得那么明显,例如合成语音与真人原声的接近程度提高几个百分点,普通用户可能并没有感知。对于B端客户和开发者而言,价值在于可以获得更多种类的语音,从而去匹配更多的应用场景,录制语音的时间也会有一定的缩短


现在语音合成的能力相比于深度学习算法出来之前,已经有了很大提升,合成出来的语音不再那么呆板了,跟真人已经有很高的相似度,但依然还是机械,下一步需要让合成的语音能够更智能,更有情感,根据人的情感状态去形成不同语态、语速的语音内容。这需要情感分析的能力,还需要语音合成算法的进步


另外,在合成语音与真人语音越来越像、合成成本越来越低的情况下,要警惕技术被用于诈骗。不法分子可以在微信群等渠道收集到某些人发的语音,根据语音去训练,形成高仿真的合成语音,再去用这样的语音去跟当事人相关的亲人、朋友等交流,实施诈骗。而商家也不会忽视这门技术的新进展,语音合成的营销电话可能更逼真了。


旷视要给宠物们一个身份

 

现在都是合成人类的声音,还很少有合成动物的声音的应用出现。将来动物的声音模拟处理,再配合上AR技术,就可以云吸猫、云养狗了。带来的效用不一定比真实的养狗养猫差。为什么?这不仅解决经济成本的问题,家里养的宠物还容易闯祸,比如咬人,或者惊吓了邻居,还可能带来纠纷。


因此国家现在对宠物管理是越来越严格了,养狗必须办狗证,出了事之间找狗主人。狗的身份验证是核心的一环。

 

包括狗之内的动物身份验证,比较常见的技术手段包括耳标、项圈、注射式RFID、可穿戴设备等,将可以验证身份的物件安置到动物身上。更新一些的技术手段包括指纹、掌纹、鼻纹、虹膜、静脉、声音、基因等元素的识别,不过应用还很少。

 

最近,旷视科技推出了AI鼻纹识别解决方案,用于犬只的身份验证。在应用中,狗主人需要对犬鼻进行抓拍或视频录制,系统通过犬鼻检测,采用图像识别技术,抓取出鼻纹的关键点,进行描述、匹配和分类,提取出鼻纹深度图信息,录入到后台数据库,形成犬只专属身份证。当犬只出现伤人事件、丢失或被遗弃时,通过鼻纹比对就可以鉴别出主人的信息。之所以用鼻纹,是因为鼻纹与人类的指纹一样,具有唯一性与稳定性,不同犬只的鼻纹不一样,也不会岁成长而改变



旷视鼻纹识别解决方案助力在线犬证办理

 

 

鼻纹识别在国外应用其实还挺多。在日本,鼻纹识别被广泛应用在牛的身份识别上。日本对牛的血统非常重视,因为这往往决定了牛肉的品质。优质血统的牛价格要比普通牛高不少,特别是松阪牛、神户牛、飞弹牛这些知名的牛类品种,往往是用严格的血统管理来确保品牌价值。应用鼻纹识别技术,将牛的身份信息确认下来,从养殖到销售,都可以对身份进行查验

 

在国内鼻纹识别技术应用还很少。在去年8月,宠物领域创业公司宠城科技与杭州谷狗科技共同研发了一款应用于宠物身上的“鼻纹识别”技术项目,用于宠物识别、宠物走丢等问题的管理。不过在市场上没有什么反响。这也很正常,旷视这个解决方案,要实现大规模商业化也比较难。


从技术上来说,用深度学习算法训练、识别犬鼻图片,抓取关键特征,形成识别能力,在技术上难度不算大,现在可能识别精准度还不是非常高,如旷视的1:1识别,在误识率为万分之一的情况下,试点场景中准确率95%,但随着数据量的增大,预计精度会提升,在1:N检索上也会形成更好的效果。


技术上可以实现更好的识别,但在商业化方面难度很大。宠物主人群体没有充足的动力办宠物证,自然也没有动力去做鼻纹识别。拿养狗来说,鼻纹识别只是让宠物身份识别过程不再繁琐,但不能解决宠物主人办证意识的问题,有些宠物主人觉得养宠物是私事,有些则不想过多地承担责任,甚至推脱责任,所以不愿意办理宠物的身份认证。这一点再好的AI解决方案也解决不了,只能靠政府的强力推动来保障规则的实施。


不过相比于B端服务能力不足的创业公司,旷视服务过很多政府客户,有这方面的服务经验,而且既然推出方案,想必也是跟一些地方的管理部门沟通后才做出的。但每个地方管理措施不一样,宽严程度不同,想在全国大范围推广,不太现实

 

IBM百年一遇的豪购,为的是混合云

 

接下来看看国外吧。老牌IT巨头IBM终于完成了340亿美金的豪购,将红帽(Red Hat)收入囊中,编入IBM的混合云部门。这是IBM百年历史上最大一笔收购,在软件领域也是TOP级的并购。这次并购的关键词是混合云

 

云计算市场这几年蓬勃发展,格局逐步定型,尤其是在公有云领域,AWS、谷歌已经确立了领先优势,IBM、甲骨文这对传统IT服务厂商成了难兄难弟,在后面追赶的很辛苦。虽然自身云业务也在增长,如IBM的云收入占比从之前的个位数,已经增长到目前的25%,但在公有云市场要赶超AWS非常困难。

 

这时候,混合云成了新增长点。越来越多的企业在接受混合云的部署,AWS、微软、谷歌云、阿里云、戴尔等都推出了混合云方案,惠普和思科甚至关闭了公有云,转向混合云。咨询机构也认可混合云的价值。

 

IDC曾预测,未来混合云将占据整个云市场份额的67%;

Gartner则预计,到2020年,90%的组织将利用混合云管理基础设施

在规模上,MarketsandMarkets预测,到2021年,企业在混合云的支出将达到近920亿美元,年均增长22.5%,这是不错的增长市场。

 

所谓混合云,就是在落地部署中,至少使用两种不同的部署模式,使部署方案既有公有云的计算能力与扩展弹性,又有私有云的安全性。常见的部署形式是公有云基础上加上私有云,将公有云的基础构架引入到客户的本地数据中心。


核心数据上公有云,企业是要思量一下的,数据会不会被泄露?上私有云,计算能力的扩展性不行,成本也不会像公有云那样低。混合云则是将公有云和私有云在IaaS层面拉通,为用户提供公有云与数据中心之间的高速专线连接。给客户带来的直接价值是,客户可以将一些新兴的业务放在公有云上,把核心业务放在私有云上

 

为什么IBM要收购红帽?红帽在混合云方面有独特优势,产品线丰富,竞争力强,拥有混合云基础设施、云原生开发等方面的能力,以及Linux 8和OpenShift 4这样的混合云核心产品。Linux 8往往被看做是“混合云的智能操作系统”,OpenShift 4是提供混合云服务的核心产品,在混合云中提供类似云计算的体验,为开发人员带来更多的灵活性


红帽混合云产品

 

收购红帽后,IBM拥有了Linux 8和OpenShift 4这样的产品,有望成为最大的混合云供应商。对于IBM来说,至少是个名头,或者说是个安慰。在这年头,IBM已经很久没有在新兴业务上做老大了。

本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声