大数据时代是否会使《1984》成为现实?读《爆发:大数据时代遇见未来的新思维》
2012-07-17 14:57

大数据时代是否会使《1984》成为现实?读《爆发:大数据时代遇见未来的新思维》

湛庐文化策划,介绍复杂网络如何覆盖时间。与《黑天鹅》中塔勒布认为人类行为是随机的、都是小概率事件不同,《爆发》认为人类日常行为模式不是随机的,而是具有“爆发性”的。爆发揭开了人类行为中的深层次的秩序,使得人类变得比预期中更易预测

序 在科学和历史之间
姜奇平 《互联网周刊》主编

美国物理学会院士巴拉巴西的《爆发》,在最新的时间、最新的领域,讨论了一个最古老的问题:到底应该用决定论的观点,还是用非决定论的观点,看待人类行为?作为复杂网络研究的权威,巴拉巴西在大数据的新背景下,认为数据、科学以及技术的合力,会使得人类变得比预期中容易预测得多。

这本书写得非常富有趣味和悬念,我是像看金庸的武侠小说那样,一口气读下来的。这本书由科学和历史两部分交织组成。其中历史的部分差不多就是一部小说,它是如此吸引人,以至看到一半,我开始扔掉每章的前半部分,专看“小说”部分,一直看到主人公塞克勒被处死的大结局。这种感觉就象看电视连续剧,被“欲知后事如何”吸引着,结果顾不得按部就班一集一集地看,直接到百度去搜分集剧情简介了。

故事讲的是匈牙利十字军的一段历史,主人公塞克勒受主教之命,征召农民组成十字军。在出征半路上,与贵族军发生“误会”,大水冲了龙王庙,内部打了起来。这一事变,将塞克勒激反,走上起义之路。泰勒格迪曾准确预言事情的走向,塞克勒兵败被擒,坐上“燃烧的御座”,被带上烧红的铁制王冠。

这本书虽然可以当历史小说来看,但它的重心还是在每章的前半部分,即讨论科学的部分。历史故事只是为了证明作者的观点:人类行为93%是可以预测的,就象泰勒格迪做到的那样。在日趋精密的数字技术条件下,有了从四处搜集来的信息,我们不会再把人类的行为视为互不相关、随意偶然的独立事件。相反,它们应该是相互依存的奇妙大网的一部分,是相互串联的故事集中的一个片段。它们会在不经意时显示次序,在意想不到之处偶然出现。人类行为遵循着一套简单并可重复的模型,而这些模型受制于更加广泛的规律。

爆发,被作者视为宇宙运行的科学。作者认为,当我们将生活数字化、公式化以及模型化的时候,我们会发现其实大家都非常相似。我们都具有爆发式,而且非常规律。看上去很随意、很偶然,但却极其容易被预测。

巴拉巴西的观点虽然独特,但并没有从哲学的谱系中逃逸。作者采用的“科学-历史”叙事框架,正构成本书所涉及问题的元问题本身。当科学和历史被“主义”化为科学主义和历史主义时,二者的对立构成的是一个老问题:自然是决定论的,历史是非决定论的。

如果把社会发展当做一个自然过程,作为科学的对象,它是有规律、可预测的;
如果把社会发展当做一个历史过程,作为历史学的对象,它是无规律、不可预测的;
介于二者之间的观点认为,社会发展是一个自然历史过程。

按巴拉巴西的观点,自然与历史的比重,大约应是90%与10%的关系。这就不难理解,作者对波普尔的观点,即否定历史决定论的观点,基本是否定的。由此可以看出巴拉巴西观点在哲学上的大致定位。

作为《链接》一书的作者,巴拉巴西还是一位知名的网络问题专家。《爆发》一书的新意,并不在于提出了新的历史观,而在于结合科学技术发展新的事实,对特定历史观进行了重新论证。作为网络研究者,我对此也很感兴趣。尤其其中涉及的大数据,正是下一步互联网发展的重要方向,Facebook推出的时间轴(Timeline)与本书反复提到的Lifelinear都是当前网络前沿的时尚。因此我想就此谈谈我个人的判断。

书中说到的技术事实的部分是可信的。例如谈及手机运营商掌握着我们的实时通信信息和行踪等。目前,这种可供分析人类行为的参考信息主要有几大类:

个人的地球上的全部运动轨迹(通过LBS采集);
个人的全部支付记录(通过在线支付采集);
个人的全部交往记录(通过SNS采集);
个人的全部言行记录(通过邮件、文档、Timeline、视频监控等采集)。

商家通过这些数据,确实可以预测客户的行为,从而提供有别于他人的个性化服务。从这个意义上来说,巴拉巴西的预言是有道理的。

但是,这些事实是否足以改变“决定论-非决定论”这个水平上的哲学结论,每个人可能都会有自己的判断。人具有自由意志,这是不同于分子随机运动之处。我们有可能成功预测到一个沉默的人在某个时刻突然爆发,但要猜透这个人的斯芬克斯之谜,光有科学和技术可能还是不够的。

个人视角终有局限,如有非虚构类好书新书推荐,还望投稿或微博私信@潘乱兄


大数据时代是否会使《1984》成为现实?


文/ 白小茉 刊登于《新商务周刊》8月8日 
  
伴随着《纽约时报》宣布“大数据时代已经降临”,全世界似乎都为“大数据”这个概念沸腾起来。在商业领域中,决策行为日益基于数据和分析而作出,而并非基于经验和直觉;而在公共卫生、经济发展和经济预测等领域中,“大数据”的预见能力也已经崭露头角。 
  
毫无疑问,人们已经认识到了“大数据”是一个金矿,但是大数据时代同样使我们面临新的道德困境:科技已经远远超出我们能够合理运用的能力,国家和企业在利用大数据的同时如何保证人们的隐私不被侵害?对于这个问题,全球复杂网络研究权威,冯•诺依曼奖获得者巴拉巴斯教授的新书《爆发》或许能给我们带来一些启发。 
  
巴拉巴西是复杂网络研究的重要领军人物,曾经在《自然》、《科学》杂志上发表30余篇论文。在本书中对大数据时代人类行为的解读,正是基于其二十年来跨学科研究成果。扎实的学术背景和权威地位,使得本书生动通俗,充满实证案例。巴拉巴西带领读者的视线从被拘留的当代艺术家,爱因斯坦论文的案例,到中世纪的十字军阵前,媲美小说的行文和多线程叙事,使得他的作品与他要阐明的问题一样——看似天马行空,实则论理严谨。 
  
人类的行为是否像信天翁一样,短时间内在一处觅食,然后做远距离迁徙?我们发送电子邮件的频率不是随机的,而是在相当长的时间里不发送任何邮件,一旦开始发送又连珠炮似地发送很多封。这一规律不是电子邮件时代特有的,因为巴拉巴西还研究了爱因斯坦的通信记录。他不仅为我们讲述了一个关于爱因斯坦的精彩故事,更为我们指出了:不管我们的信息是在光缆上传播,还是借助蒸汽船漂洋过海,我们的通信模型是一样的。爱因斯坦的通信记录和你的电子邮件记录遵循同样的模型。 
  
长时间休息之后就会出现短时间的密集活动,就像贝多芬音乐中悦耳的小提琴声被雷鸣般的鼓声打断一样。这种人类行为在时间维度上呈现的明显爆发特征,正是本书灵感的来源。事实上,从人们对维基百科的编辑,到货币经济公司的交易;从人和动物的睡眠模式,到魔术师为了保证魔杖时刻停留在空中而进行的小动作,所有的一切都证明:爆发的行为模式无处不在。 
  
巴拉巴西在书中虚构了一个LifeLinear网站,该网站可以通过对大量数据的分析追踪和预测每个公民的行踪。比如电梯摄像头拍到你11点20分离开了公寓大楼,那么10分钟后在你家附近地铁站的监视画面中就很有可能搜寻到你。这并不只是科幻故事,而更有可能是大数据时代人类真实的生存现状。在大数据时代,通过对爆发模型的了解,我们便可以在“大数据”预测中一次次爆发出现的时刻,从这个意义上说,预测个体的行为已经变得非常容易了。事实上,自从9 • 11 之后世界各地的情报机构已经投入了上百亿美元资金来试图将平时搜集来的数不清的电子记录联系起来。对于商业领域来说这种预测同样贵重,因为我们的旅行和购物计划可能是商业圈中最有影响力的商品。虽然我们的过去由安全防火墙和隐私法保护着,但通过精密系统的预测,我们的未来却极易被人掌握。谁掌握着我们未来行为的信息,谁就能从中获利。我们是否已经在无意中开启了潘多拉魔盒,《1984》和《少数派报告》式的故事是否会成为现实? 
  
令人略感欣慰的是,对于大数据时代的隐私保护,巴拉巴西在《爆发》一书中表示了谦逊的反思与积极的面对态度。他指出,与核工业及基因工程出现时人类面临的困境一样,在涉及研究和隐私的内在冲突时,研究者必须想出一个万全之策,但放弃学术研究只会让人类动力学的研究落入政府秘密实验室和私人企业手中。如果我们不想生活在一个处处受到监视的世界中,我们需要完善法律和科技手段避免这一情况的出现,这正是人们在欢呼着享受大数据时代所带来福利的同时,必须正视的首要问题。 
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定