去搜搜
头像
让数据拥有时空定位,为什么很重要?
2019-10-25 11:49

让数据拥有时空定位,为什么很重要?

文章所属专栏 前沿技术情报所

在下定决心之后,内地某市的交警终于把全市的路口都装上了监控摄像头,并且开始尝试通过对监控的画面进行智能化分析,用来帮助交警执行任务。

 

很快,一起逃逸事故就在设置了摄像头的区域发生了,但令交警们没有想到的是,因为摄像头刚进行设置,交警们自己都不熟悉,为了在多个摄像头画面中找到肇事车辆,最终只能找来十余名交警分散开盯着画面进行寻找。这样的操作方式显然效率很低。

 

那么有没有办法让计算机直接去调用多个摄像头数据进行分析呢?问题来了,一般来说监控摄像头的位置信息都是人为直接定义的,例如“某某路和某某路的交汇处,朝西”。这种模糊的描述显然不够精确,所以一般交警人工看画面的时候,实际上都会利用自己日常的记忆在脑海里还原路口的情况。

 

所以传统的解决方案中,摄像头都是各自为阵,只负责自己的一小块画面,成为一个个信息孤岛。自然也就不能进一步对这些摄像头的数据加以利用,甚至是进一步实现智慧交通、智慧城市这些更大的目标。

 

 

新的解决方法很快也浮出水面:给每一个摄像头安装高精度卫星定位模块。直接将每一个摄像头的时间与卫星同步,并且将定位锁定在30厘米误差之内。这时如果再遇到可疑车辆,就可以直接根据定位调取周边监控摄像头的数据,加速锁定目标车辆。

 

同时因为,摄像头的位置足够精确,结合其大致的指向,路面的各种信息诸如事故、不文明驾驶等也可以进行相应的数字化操作。现实与虚拟世界的串联一下子就紧密了起来。


定位,让爆炸更多数据有价值

 

数据每时每刻都在产生,总数爆炸式增长,也让从数据中挖掘出价值这件事愈发困难,进而催生出各种新的传输、管理、计算技术。“给虚拟世界的数据都加上现实世界定位”——就是一种近年来提出的思路。

 

根据国际数据公司(IDC)2018年的一份预测,到2025年,全球每年产生的数据量就将会达到175ZB(1ZB = 1,000,000,000,000GB)的规模。这个数字在2018年是30ZB,在2010年只不过是3ZB。由计算机所开启的整个数据爆炸浪潮显然没有要终结的迹象,反倒是增长速度越来越快。



推动数据“涌来”的不是其他,依旧是人类社会持续进行中的数字化进程,只不过这一次的“浪花”显然比之前PC互联网、移动互联网这两波更大(上图中很明显数据的增长更趋近于指数式增长)。

 

数据量和来源的不断提升,同时也为数据处理的思路产生了深刻的影响。

 

PC互联网时代追求的是“能存能取”,顶多也就是解决一下云端大规模的数据管理和存储问题;移动互联网时代因为终端足够靠近用户,收集的数据价值大大提升,大规模地分析用户数据然后反向输出晋升为核心应用。典型的包括各种兴趣和推荐算法,各类互联网服务也向终端进一步延伸。

 

由于5G,互联网边界将得以进一步拓展。例如,5G未来要覆盖物联网和车联网,要把更多关键性的现实数据连接到5G,进而连接到广域互联网当中。你可以看作移动通信终端的一个泛化趋势。

 

那么在新的这一波数字化浪潮中,处理的思路应该如何展开?我们要从这一次的基础特性说起——“5G+AI”。

 

5G+AI,下一波数字化进程的“大框架”

 

 

先说5G,在经历了3、4G时代,智能手机这个个人信息终端已经趋于完善,但仍有相当多的终端数据没有被“捕捉”和“上传”。5G恰恰是为了满足这一需求而生,在5G的NR(新空中接口)规划中,mMTC(Massive Machine Type Communications,大规模机器通信)就是三大方向之一。

 

这种针对性的研发,必然会为未来的物联网应用带来“加量不加价”的效果,即5G时代物联网将会能够传输更多的数据、更大规模的传输数据、更低功耗地工作等,但同时硬件成本的造价反而会更低,这势必会激发人类收集更多的数据。

 

参考3、4G时代的经验,5G对于物联网方面最困难的不是技术,而是要驱动整个通信行业去付出时间与金钱。

 

相比之下AI的困难就要大不少,尽管近年来AI已经取得了很大的进展,但是AI的应用拓展情况依然严峻。其中一个最大的挑战,就是数据本身。

 

经有人用两张图很形象地点出了目前AI原始数据的理想情况和现实情况。人们想象中“庞大而干净、统一”的数据,事实上却可能“杂乱而肮脏”。数据本身的“糟糕”会直接影响AI的实际效果,所以你会发现一个趋势:很多突破性的AI研究,都是从人为构建数据库开始的。典型的例子就比如开启了一整个AI图片处理浪潮的ImageNet,里面就拥有1400万张人类手工标注了的图片。



而事实上,构建这些数据的成本本身就是极其高昂的,以我们上面介绍的ImageNet为例,它虽然是2009年开始的一个项目,但实际上里面使用的数据,也就是那些图片可以追溯到1996年以前。你甚至可以这样说,虽然最终实现人工智能图像识别的神经网络、计算能力等元素很重要,但他们其实都是在人类整理了数年的数据之上才实现的。

 

假如没有这些已经由人类标注并审核过的数据,之后一系列围绕图片识别所展开的人工智能发展,都将消失。于是乎我们看到了,许许多多的AI公司,不断地开拓AI的应用领域,同时也在不断通过各种行业组织,乃至政府的关系来构建全新的AI数据库。

 

最终的结果是,这两年AI行业的发展和应用反而有所减缓,因为光是准备这些数据就要花掉大量的时间。

 

即便你现在能通过人工收集数千上万张照片来做AI人脸识别、我们可以用大量的翻译数据来训练人工智能翻译,但你绝不可能通过人工的方式收集到整个智慧城市的数据。



因为在一个城市里面,你会面对各种各样的对象,有人、有车、有摄像头、有红绿灯、有公共设施、有公共服务。就最远期的智慧城市而言,智慧城市的“大脑”必须对这里面所有的数据进行掌握、分析,并且根据整个系统的最优化给出指示。

 

这样的系统并非不可实现,关键就在于他们所产生的数据缺少了一个重要的属性:时空。

 

关键:架起现实与虚拟的“数据之桥”

 

传统网络连接方式中,主要精力都放在了解决基础性的数据传输能力上了,就以我们最熟悉的互联网为例,计算机的“地址”实际上就是一串ip数字。利用一串串ip数字,全球的计算机不管网络结构多么复杂,都可以连接上互联网、很方便地互相传递数据。

 

虽然ip地址能很好地充当起虚拟世界的地址和“指路牌”,但它却无法很好地反应设备本身在真实世界中的定位位置。相反的,为了将同一时空的设备连接到一起,人们付出了不小的代价。

 

以正在逐步兴起的智能家居为例,主要使用的都是Wi-Fi、蓝牙、Zigbee等,这样作用范围有限的局域网,少数在手机和互联网环境下的使用非常受限。同时因为局域网的标准各有不同、现有移动通信又无法容纳这么多的智能设备,也极大地影响了智能家居的应用情况。

 

另外一个典型的例子是城市级的智能交通。

 

远期来看,公路交通必须要完整且无缝地“融入”到整个城市的智慧生活当中,这其实要求公路交通进行一个根本性的转变。汽车要从当下独立的工具属性,向更为抽象的移动性生活空间转变。最基本的需求,就是智能化地统计、规划、执行城市中的出行需求。

 

例如我们需要通过摄像头或者其他传感器来统计整个道路的车流、乘客的情况,又或者直接统计每个区域马路上的人流情况,对于高峰期的出行需求进行引导,例如推荐其在高峰期过去之后出行。

 

这些统计的数据可能从人发出、也可能从车发出,还可能来自于交通设施、包括摄像头在内的一系列传感器等等。这种跨品牌、设备类别、行业类别的复合数据收集和应用,而且是在城市的规模,现有的数据处理方式显然无能为力。

 

定位,从一开始将数据与现实锚定

 

那么假如我们在数据之中加上他们的时空(时间+空间)参数呢?

 

还是以我们上面聊到的智慧交通为例,数据设备种类众多,但如果本身数据带有时空标记的话,那么数据其实就已经和现实世界完全对应起来了。

 

也就是说,你其实不需要去针对未来物联网的场景去开发太多的专用解决方案。而只需要想办法利用5G的能力将数据传上互联网,然后再根据数据中的时空标记,将所需的相关的数据聚合到一起,然后就能对这些数据进行各种处理,开发出其中的价值。

 

这种将数据在时空中定位的能力现在就有,而且就在你身边——卫星定位。



从上世纪70年代美国开始部署GPS系统开始,卫星定位开始进入了一个相对成熟的时期,最为标志性的改变,就是在高精度卫星定位中引入精确的时间,大大增强的定位的能力和精度。

 

现如今太空中的定位卫星中,就放入了不少的原子钟。这些原子钟利用原子共振频率标准来计算及保持时间的准确,是世界上最准确的时间测量方法。因为时间非常准确,而卫星发射的定位信号又是传播速度固定的无线电波,两者相结合就能得到用户与卫星发送信号时的绝对距离(距离等于速度乘时间)。

 

卫星定位系统的每一颗卫星都可以通过算法精确计算定位,并转换为轨道参数发给用户。根据每一颗已知位置的卫星,和传输信号的距离,就能够在地球表面画出一个可大可小的圈,接收信号的用户必然在这个圆圈上。

 

以此类推,结合最少4颗卫星的数据,4个虚拟的圆圈就会出现一个“重合点”,用户就在这一个点上,接收的芯片随即就能通过计算各种数字,得出用户的经纬度、海拔、速度等数据。

 

最最亮眼的是,这一整套系统中,卫星只需要源源不断地向地球表面发射信号,地面的定位端只需要接收信号,这种数据的传输本来就不是单一的点对点,而是没有容量限制的单向传输系统。

 

根据美国官方2019年6月的一份统计,从上世纪80年代至今的40年里,这一套定位系统已经产生了超过1.4万亿美元的经济效益,要知道2010年全年美国的整体GDP也只是刚刚超过20万亿美元。

 

回到我们上文一开始分析的部分,在新的数据大爆炸中,我们需要确定单个数据、单个设备的时空(时间和空间)定位,进而能够以时间和空间为筛选器,学习和处理更多的数据,这个关键的时空定位,恰恰是卫星定位所能够提供的。



这个关键的前沿技术发展趋势不仅商业界看的清楚,国内的政府机构也明白其重要性。就在上周,目前肩负北斗建设和推广任务、由中国兵器工业和阿里巴巴在2015年共同建立的公司“千寻位置”,刚刚完成了10亿元人民币的A轮融资,领投的就包括了上海国际集团资产管理、工银金融资产投资、中国国有资本风险投资基金。

 

也正是因为国家整体科技发展规划的撑腰,目前北斗也是全世界应用地基增强系统最广泛的卫星定位系统。通过在地面建设位置已知的基站来为用户修正定位数据,最高能够达到厘米级别的精度。目前仅在中国内,北斗就拥有2500多个地基增强站。

 

这也让北斗拥有了傲视全球的定位精度,在千寻定位已经探索的解决方案中,也充分利用了这一点。

 


例如直接和全球半导体巨头ST(意法半导体)一同打造全球首款车规级双频高精度卫星及惯性导航融合定位模组“LG69T”。通过应用高精度的卫星定位,车辆的位置能够直接被定位到10厘米的误差范围内,结合现有高清地图数据,完全能够判断汽车究竟在哪条车道。同样的事情假如交给摄像头来做,反而还要额外消耗计算力,还有可能受到周围车辆的干扰。

 

而通过这一个极高精度的定位,能拓展的事情就很多了:假如路上车辆都安装了,那么意味着所有车辆都已经进入了同一个高精度的坐标系。这些车辆之间可以互相通报位置,自然也可以互相避让;对于车辆和道路资源的调配,也完全可以进入下一个层级,路口的红绿灯、车道全部都可以智能调配,进一步增加整体通行效率。

 

除了智能交通之外,无人机应用、建筑状态监测、城市管理、灾害治理方面,千寻都有给出基于高精度定位的解决方案。通过定位信息带动数据的智能化应用的趋势,已经初现端倪。


写在最后

 

俗话说,太阳之下无新事。前沿科技同样是如此,正如很多几十上百年的科幻小说能够预言到现如今的科技现实一样,人类社会长远的变化趋势其实是可以判断的,如本文开篇提到的人类持续数字化。

 

现如今凭借数字化的威力,人类已经构建了一个庞大但仍四分五裂的虚拟世界。接下来的数字化工作,必将围绕着进一步扩大这个虚拟世界,并且将其连接上现实世界展开。届时,将现实世界转化为虚拟坐标的定位能力,必将成为重要的“桥梁”、再不济也是“桥梁”的“桥墩”。

 

而通过时空信息的数据,我们其实可以将更多的信息转化为更大规模的智能。鉴于中国本身就在5G和AI领域的积累,在最终的全球智能化竞赛中,我们的确值得拥有底气。

本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声