盘点2014步步逼近的“未来科技”，2015能否触摸真实的“奇点临近”？-虎嗅网

翻篇到了2015年，除了让人老了一岁唯一能让人安慰的就是我们距离未来科技又近了一步。在《黑镜》和《Her》当中那些貌似要“很久以后”才能触碰到的超强人工智能和技术创新，其实已在2014年步步逼近。互联网科技行业喷发式的发展，给我们展示了未来科技的雏形。

互联网行业属于典型的技术创新周期性行业，其中的任何产品形态都不是突然出现的，而是以雏形的形式长期潜伏，当到达一个临界点（就是极客们常说的奇点）后爆发，进入到快速普及状态。

于是乎，在2015伊始，笔者想要盘点一些技术，也许并不是天天用的高粘性技术，而是具备巨大想象空间的，这类技术往往会对未来有着巨大的影响。

AR技术：“现实”装入“虚拟”当中

AR技术在过去的20年里都悄悄潜伏在实验室里面，在2014年AR技术才第一次迸发出无穷的想象力。2014年3月26日Facebook宣布20亿美元收购Oculus公司，后者是沉浸式虚拟现实技术（AR）的领先公司。Oculus的虚拟现实头盔Oculus Rift，利用内置的陀螺仪和显示屏能够打造出真正的虚拟显示场景，把“虚拟”贯穿到视觉、听觉、触觉、动觉当中，替代了“现实”。Facebook计划将Oculus在游戏里的现有优势延伸到新的领域，包括通讯、媒体和娱乐、教育和其他领域。

如果我们仔细回想一下计算机过去50年里的发展趋势，就不难想象AR技术的巨大发展空间。早年因为电脑笨重，不便于个人使用，然后台式机出现了，我们进入了个人可以直接在书桌上与计算机互动的时代；之后，出现了可以随身携带计算机笔记本电脑；今天我们将计算机装进了自己的口袋。按照这种发展模式走下去，计算机会与我们的身体越来越亲密。这意味着未来计算机可能戴在我们头上，然后用眼睛去跟它互动。AR技术实际上就是这种解决方式的先行者。

在过去的2014年，Oculus的发展牵动人心，首批面向开发者的Oculus Rift DK2原型机早早就被抢购一空，市场上一机难求。而分布在全球各地狂热的开发者不知疲倦的让Oculus Rift变得更好玩，在Oculus相关论坛里每天都会有不同的Mod出现供大家测试，在CES 2014上Virtuix Omni还推出了配合Oculus Rift的跑步机。

2014年是AR技术大放异彩的元年，在近期的百度BIG Talk大会上，斯坦福大学虚拟互动实验室创始人Jeremy Bailenson说虚拟现实技术很快将会到来。也许未来我们的电脑将会消失，AR将会承载新的使命。

看“脸”时代：图像搜索大数据

你想知道虾和番茄能不能一起吃，于是你输入文字搜索了一下，有了答案。而如果你手上有一张名画照片想知道作者怎么办？相信很大一部分人都会束手无策，因为这是一张图片。

相比语言搜索功能，图像搜索被誉为是下一个重要的互联网入口，这源于一个不可逆转的现实——人们从外界获取信息，其中90%来自于视觉。当有东西无法用语言传递、表达时，你第一个想到的就是靠图像、影像。你想想看，当你在街上看到一件别人身上的衣服很好看，你想自己上网搜搜看哪里能买到，在不知道品牌型号的情况下，你要怎么给一个机器解释你的所看所感？就算你形容能力无敌了，但你有心思花那么多时间在组织搜索语言上吗？所以机器还要更加的智能，不但能理解一句话，还要可以直接分析你看到的图像。

图片搜索就是目前火热的CBIR技术，这个1992年由Kato教授提出的理论距今已经20多年。CBIR的基础原理是系统对用户输入的图像进行分析并分类统一建模，再根据各种图像模型提取图像特征存入特征库，然后寻找符合相关条件的结果进行反馈。目前谷歌、Bing、百度三大搜索引擎均具备相关技术。其中谷歌是从Google Labs一个项目演化而成，目前支持图片上传搜索和URL地址检索。而微软旗下的Bing则只支持基础的关键字图像匹配，精确度算法还有待提高。

其他类似TinEye等创业型图像搜索引擎则脱胎于大学实验室，而曾经火过一段时间的GazoPa已经低调关闭B2C转型B2B业务。

小公司在做需要大数据的工程时总显得捉襟见肘。再举个国内的反例，淘宝在2012年推出过类似图像搜索的功能，不过随后运营不佳关闭。目前中国具备做好图像搜索能力的就只有百度，2014年8月手机百度正式更新到5.5版，新版本新增的拍照搜索，被业界定义为图像搜索的2.0版本。

语音技术：能说的，就不用动手

如果说图片搜索解决了机器对图片的“理解”，那么语音技术就是解决了人与机器“交流”的问题。语音技术从IBM的一个小工具软件发展到今天已有十多年的历史。而随着3G/4G带动的移动互联网市场兴起，语音识别成为有希望挑战传统搜索引擎的未来产品，最近四年是语音技术发展最快的黄金期。

从技术角度来讲，语音识别主要流程为“语音提取——声纹转化——分词——语义识别”，在后三步都需要借鉴到庞大的数据库，需要大投入长时间的研究，技术资金门槛较高。而其中的分词，尤其是中文分词，需要海量的数据样本做分析。而目前语音市场分为三大派系：

国企、大学院校研发背景的传统语音厂商（科大讯飞、捷通华声）。
互联网巨头厂商（百度、阿里、腾讯）。
小的创业公司例如云之声、思必驰等。

这些厂商均有各自擅长的领域，其中科大讯飞在军用、企业级市场当中应用颇广。而百度为首的互联网厂商则在民用商业化方面捷足先登，创业公司则更加专注于细分市场。从目前来看科大讯飞目前在识别行业处于领头羊地位，产品适用范围广技术底蕴强，在技术专利方面也可以与国外语音巨头Nuance有一拼。

不过，从消费者层面来讲好的语音识别系统很大程度上依靠经验，专利和算法什么的并没有多重要。语音识别这两年并没有着力于传统路线，而是向上发展为神经网络（你可以理解为每台服务器就是大脑的一个神经元），也就是语义识别，这里面涉及的就是人工智能和深度学习。

类似谷歌近两年来频繁挖语音牛人一样，百度邀请了吴恩达加盟，担任百度的首席科学家，负责百度研究院，他的研究领域就是机器学习和人工智能，研究重点是深度学习（deep learning）。深度学习就是神经网络当中非常重要的一个环节。

对于移动时代的搜索引擎来说，语音非常重要，一旦在这个环节落后可能直接被淘汰，所以谷歌和百度如此重视不是没有道理。像百度2010年就已经开始进行语音布局，深度神经网络技术(DNN)，自然语言处理技术(NLP)以及百度多年的搜索技术积累，语音技术进入到像手机百度这样的移动产品当中，成为语音输入的入口，足可以见重视程度。

笔者认为，除了搜索外，移动端一切产品形态都离不开语音和图像交互，这源于移动本身的属性，不早点布局语音的互联网公司，早晚会在交互上吃亏。

万物智能：万物联网时代到来

200年前，人与人之间依靠飞鸽传书。10年前我们依靠手机联系，而从2014年开始，我们发现周围的一切都逐渐开始可以联网，无论是家里的空调、洗衣机还是外面的道路、公园、机场。这所有的一切都可以实时地将数据回传到系统，系统则可以根据收到的大数据，实时地将它们运用到相应的场景中，让你切实感受到一个数字化、智能化的环境。而这些实时数据将会成为未来智能模拟和用户画像的最坚实基础。

而这一些正在慢慢变成现实，通过支付宝我们可以知道自己的支出数据，消费倾向和使用频次。通过搜索引擎我们可以知道自己的喜好、身体数据，可以知道我们经常在那里使用什么交通工具。而这一切都是基于移动互联网带来的集群效果，通过这些数据我们就可以完成精准的用户画像，可以模拟用户的行为习惯和行为预判，这将是一件无比令人兴奋的事情。

在移动端的搜索有了实时数据的支撑，就可以预判道路是否堵车，可以知道节假日景点人流拥挤程度。通过定位系统和用户餐饮喜好，直接获知附近的美食餐馆信息和排队情况。而依靠大数据挖掘、智能定位等技术的原生广告和信息流广告，基于用户的需求、兴趣推动，可在降低用户体验干扰的同时大大提高成交率。这些将会是万物智能时代最为普通的应用。

是不是感觉有些看起来简单的产品，背后的逻辑都能勾勒出像科幻电影般的未来？其实就像笔者在开头所说的，未来不是没来，是一直都在你身边，就等着哪一天被击中引爆点，突然改变你现在的一切。