让数据拥有时空定位，为什么很重要？

在下定决心之后，内地某市的交警终于把全市的路口都装上了监控摄像头，并且开始尝试通过对监控的画面进行智能化分析，用来帮助交警执行任务。

很快，一起逃逸事故就在设置了摄像头的区域发生了，但令交警们没有想到的是，因为摄像头刚进行设置，交警们自己都不熟悉，为了在多个摄像头画面中找到肇事车辆，最终只能找来十余名交警分散开盯着画面进行寻找。这样的操作方式显然效率很低。

那么有没有办法让计算机直接去调用多个摄像头数据进行分析呢？问题来了，一般来说监控摄像头的位置信息都是人为直接定义的，例如“某某路和某某路的交汇处，朝西”。这种模糊的描述显然不够精确，所以一般交警人工看画面的时候，实际上都会利用自己日常的记忆在脑海里还原路口的情况。

所以传统的解决方案中，摄像头都是各自为阵，只负责自己的一小块画面，成为一个个信息孤岛。自然也就不能进一步对这些摄像头的数据加以利用，甚至是进一步实现智慧交通、智慧城市这些更大的目标。

新的解决方法很快也浮出水面：给每一个摄像头安装高精度卫星定位模块。直接将每一个摄像头的时间与卫星同步，并且将定位锁定在30厘米误差之内。这时如果再遇到可疑车辆，就可以直接根据定位调取周边监控摄像头的数据，加速锁定目标车辆。

同时因为，摄像头的位置足够精确，结合其大致的指向，路面的各种信息诸如事故、不文明驾驶等也可以进行相应的数字化操作。现实与虚拟世界的串联一下子就紧密了起来。

定位，让爆炸更多数据有价值

数据每时每刻都在产生，总数爆炸式增长，也让从数据中挖掘出价值这件事愈发困难，进而催生出各种新的传输、管理、计算技术。“给虚拟世界的数据都加上现实世界定位”——就是一种近年来提出的思路。

根据国际数据公司（IDC）2018年的一份预测，到2025年，全球每年产生的数据量就将会达到175ZB（1ZB = 1,000,000,000,000GB）的规模。这个数字在2018年是30ZB，在2010年只不过是3ZB。由计算机所开启的整个数据爆炸浪潮显然没有要终结的迹象，反倒是增长速度越来越快。

推动数据“涌来”的不是其他，依旧是人类社会持续进行中的数字化进程，只不过这一次的“浪花”显然比之前PC互联网、移动互联网这两波更大（上图中很明显数据的增长更趋近于指数式增长）。

数据量和来源的不断提升，同时也为数据处理的思路产生了深刻的影响。

PC互联网时代追求的是“能存能取”，顶多也就是解决一下云端大规模的数据管理和存储问题；移动互联网时代因为终端足够靠近用户，收集的数据价值大大提升，大规模地分析用户数据然后反向输出晋升为核心应用。典型的包括各种兴趣和推荐算法，各类互联网服务也向终端进一步延伸。

由于5G，互联网边界将得以进一步拓展。例如，5G未来要覆盖物联网和车联网，要把更多关键性的现实数据连接到5G，进而连接到广域互联网当中。你可以看作移动通信终端的一个泛化趋势。

那么在新的这一波数字化浪潮中，处理的思路应该如何展开？我们要从这一次的基础特性说起——“5G+AI”。

5G+AI，下一波数字化进程的“大框架”

先说5G，在经历了3、4G时代，智能手机这个个人信息终端已经趋于完善，但仍有相当多的终端数据没有被“捕捉”和“上传”。5G恰恰是为了满足这一需求而生，在5G的NR（新空中接口）规划中，mMTC（Massive Machine Type Communications，大规模机器通信）就是三大方向之一。

这种针对性的研发，必然会为未来的物联网应用带来“加量不加价”的效果，即5G时代物联网将会能够传输更多的数据、更大规模的传输数据、更低功耗地工作等，但同时硬件成本的造价反而会更低，这势必会激发人类收集更多的数据。

参考3、4G时代的经验，5G对于物联网方面最困难的不是技术，而是要驱动整个通信行业去付出时间与金钱。

相比之下AI的困难就要大不少，尽管近年来AI已经取得了很大的进展，但是AI的应用拓展情况依然严峻。其中一个最大的挑战，就是数据本身。

经有人用两张图很形象地点出了目前AI原始数据的理想情况和现实情况。人们想象中“庞大而干净、统一”的数据，事实上却可能“杂乱而肮脏”。数据本身的“糟糕”会直接影响AI的实际效果，所以你会发现一个趋势：很多突破性的AI研究，都是从人为构建数据库开始的。典型的例子就比如开启了一整个AI图片处理浪潮的ImageNet，里面就拥有1400万张人类手工标注了的图片。

而事实上，构建这些数据的成本本身就是极其高昂的，以我们上面介绍的ImageNet为例，它虽然是2009年开始的一个项目，但实际上里面使用的数据，也就是那些图片可以追溯到1996年以前。你甚至可以这样说，虽然最终实现人工智能图像识别的神经网络、计算能力等元素很重要，但他们其实都是在人类整理了数年的数据之上才实现的。

假如没有这些已经由人类标注并审核过的数据，之后一系列围绕图片识别所展开的人工智能发展，都将消失。于是乎我们看到了，许许多多的AI公司，不断地开拓AI的应用领域，同时也在不断通过各种行业组织，乃至政府的关系来构建全新的AI数据库。

最终的结果是，这两年AI行业的发展和应用反而有所减缓，因为光是准备这些数据就要花掉大量的时间。

即便你现在能通过人工收集数千上万张照片来做AI人脸识别、我们可以用大量的翻译数据来训练人工智能翻译，但你绝不可能通过人工的方式收集到整个智慧城市的数据。

因为在一个城市里面，你会面对各种各样的对象，有人、有车、有摄像头、有红绿灯、有公共设施、有公共服务。就最远期的智慧城市而言，智慧城市的“大脑”必须对这里面所有的数据进行掌握、分析，并且根据整个系统的最优化给出指示。

这样的系统并非不可实现，关键就在于他们所产生的数据缺少了一个重要的属性：时空。

关键：架起现实与虚拟的“数据之桥”

传统网络连接方式中，主要精力都放在了解决基础性的数据传输能力上了，就以我们最熟悉的互联网为例，计算机的“地址”实际上就是一串ip数字。利用一串串ip数字，全球的计算机不管网络结构多么复杂，都可以连接上互联网、很方便地互相传递数据。

虽然ip地址能很好地充当起虚拟世界的地址和“指路牌”，但它却无法很好地反应设备本身在真实世界中的定位位置。相反的，为了将同一时空的设备连接到一起，人们付出了不小的代价。

以正在逐步兴起的智能家居为例，主要使用的都是Wi-Fi、蓝牙、Zigbee等，这样作用范围有限的局域网，少数在手机和互联网环境下的使用非常受限。同时因为局域网的标准各有不同、现有移动通信又无法容纳这么多的智能设备，也极大地影响了智能家居的应用情况。

另外一个典型的例子是城市级的智能交通。

远期来看，公路交通必须要完整且无缝地“融入”到整个城市的智慧生活当中，这其实要求公路交通进行一个根本性的转变。汽车要从当下独立的工具属性，向更为抽象的移动性生活空间转变。最基本的需求，就是智能化地统计、规划、执行城市中的出行需求。

例如我们需要通过摄像头或者其他传感器来统计整个道路的车流、乘客的情况，又或者直接统计每个区域马路上的人流情况，对于高峰期的出行需求进行引导，例如推荐其在高峰期过去之后出行。

这些统计的数据可能从人发出、也可能从车发出，还可能来自于交通设施、包括摄像头在内的一系列传感器等等。这种跨品牌、设备类别、行业类别的复合数据收集和应用，而且是在城市的规模，现有的数据处理方式显然无能为力。

定位，从一开始将数据与现实锚定

那么假如我们在数据之中加上他们的时空（时间+空间）参数呢？

还是以我们上面聊到的智慧交通为例，数据设备种类众多，但如果本身数据带有时空标记的话，那么数据其实就已经和现实世界完全对应起来了。

也就是说，你其实不需要去针对未来物联网的场景去开发太多的专用解决方案。而只需要想办法利用5G的能力将数据传上互联网，然后再根据数据中的时空标记，将所需的相关的数据聚合到一起，然后就能对这些数据进行各种处理，开发出其中的价值。

这种将数据在时空中定位的能力现在就有，而且就在你身边——卫星定位。

从上世纪70年代美国开始部署GPS系统开始，卫星定位开始进入了一个相对成熟的时期，最为标志性的改变，就是在高精度卫星定位中引入精确的时间，大大增强的定位的能力和精度。

现如今太空中的定位卫星中，就放入了不少的原子钟。这些原子钟利用原子共振频率标准来计算及保持时间的准确，是世界上最准确的时间测量方法。因为时间非常准确，而卫星发射的定位信号又是传播速度固定的无线电波，两者相结合就能得到用户与卫星发送信号时的绝对距离（距离等于速度乘时间）。

卫星定位系统的每一颗卫星都可以通过算法精确计算定位，并转换为轨道参数发给用户。根据每一颗已知位置的卫星，和传输信号的距离，就能够在地球表面画出一个可大可小的圈，接收信号的用户必然在这个圆圈上。

以此类推，结合最少4颗卫星的数据，4个虚拟的圆圈就会出现一个“重合点”，用户就在这一个点上，接收的芯片随即就能通过计算各种数字，得出用户的经纬度、海拔、速度等数据。

最最亮眼的是，这一整套系统中，卫星只需要源源不断地向地球表面发射信号，地面的定位端只需要接收信号，这种数据的传输本来就不是单一的点对点，而是没有容量限制的单向传输系统。

根据美国官方2019年6月的一份统计，从上世纪80年代至今的40年里，这一套定位系统已经产生了超过1.4万亿美元的经济效益，要知道2010年全年美国的整体GDP也只是刚刚超过20万亿美元。

回到我们上文一开始分析的部分，在新的数据大爆炸中，我们需要确定单个数据、单个设备的时空（时间和空间）定位，进而能够以时间和空间为筛选器，学习和处理更多的数据，这个关键的时空定位，恰恰是卫星定位所能够提供的。

这个关键的前沿技术发展趋势不仅商业界看的清楚，国内的政府机构也明白其重要性。就在上周，目前肩负北斗建设和推广任务、由中国兵器工业和阿里巴巴在2015年共同建立的公司“千寻位置”，刚刚完成了10亿元人民币的A轮融资，领投的就包括了上海国际集团资产管理、工银金融资产投资、中国国有资本风险投资基金。

也正是因为国家整体科技发展规划的撑腰，目前北斗也是全世界应用地基增强系统最广泛的卫星定位系统。通过在地面建设位置已知的基站来为用户修正定位数据，最高能够达到厘米级别的精度。目前仅在中国内，北斗就拥有2500多个地基增强站。

这也让北斗拥有了傲视全球的定位精度，在千寻定位已经探索的解决方案中，也充分利用了这一点。

例如直接和全球半导体巨头ST（意法半导体）一同打造全球首款车规级双频高精度卫星及惯性导航融合定位模组“LG69T”。通过应用高精度的卫星定位，车辆的位置能够直接被定位到10厘米的误差范围内，结合现有高清地图数据，完全能够判断汽车究竟在哪条车道。同样的事情假如交给摄像头来做，反而还要额外消耗计算力，还有可能受到周围车辆的干扰。

而通过这一个极高精度的定位，能拓展的事情就很多了：假如路上车辆都安装了，那么意味着所有车辆都已经进入了同一个高精度的坐标系。这些车辆之间可以互相通报位置，自然也可以互相避让；对于车辆和道路资源的调配，也完全可以进入下一个层级，路口的红绿灯、车道全部都可以智能调配，进一步增加整体通行效率。

除了智能交通之外，无人机应用、建筑状态监测、城市管理、灾害治理方面，千寻都有给出基于高精度定位的解决方案。通过定位信息带动数据的智能化应用的趋势，已经初现端倪。

写在最后

俗话说，太阳之下无新事。前沿科技同样是如此，正如很多几十上百年的科幻小说能够预言到现如今的科技现实一样，人类社会长远的变化趋势其实是可以判断的，如本文开篇提到的人类持续数字化。

现如今凭借数字化的威力，人类已经构建了一个庞大但仍四分五裂的虚拟世界。接下来的数字化工作，必将围绕着进一步扩大这个虚拟世界，并且将其连接上现实世界展开。届时，将现实世界转化为虚拟坐标的定位能力，必将成为重要的“桥梁”、再不济也是“桥梁”的“桥墩”。

而通过时空信息的数据，我们其实可以将更多的信息转化为更大规模的智能。鉴于中国本身就在5G和AI领域的积累，在最终的全球智能化竞赛中，我们的确值得拥有底气。

评论

最新评论