如何从冰雪奇缘入门网络分析?
2019-08-12 18:45

如何从冰雪奇缘入门网络分析?

本文来自微信公众号:集智俱乐部(id:swarma_org),翻译:郭治青,审校:Leo,编辑:李倩雨,题图来自豆瓣。


网络分析的主要问题之一是确定衡量人、动物和其他实体重要性的最佳方法。本文以电影《冰雪奇缘》中的社交网络为例,讨论了不同类型的中心性指标,分别是如何度量网络节点重要性的,以及人们如何用中心性来研究多种网络。


图1:用网络分析给电影人物重要性排序


我们如何确定像《冰雪奇缘》这类电影中的重要角色呢?当然,我们看电影可以判断,但还有其他方法——通过使用数学和计算机——来了解谁在一个故事的社交网络中最重要。这种方法需要计算一个被称为“中心性”的数值,这个数值可以衡量出谁在社交网络中扮演着重要角色。


本文讨论了不同类型中心性如何以不同方式来度量其网络节点的重要性。我们还讨论了人们如何用中心性来研究多种网络,而不仅仅是社交网络。现如今,科学家们正在开发中心性测量重要性方法,同时考虑不同时间和不同类型的关系所造成的重要性变化。


1.电影《冰雪奇缘》与社交网络


你看过电影《冰雪奇缘》吗?它讲述了两个孤儿姐妹艾尔莎(Elsa)和安娜(Anna)的故事,她们是阿伦戴尔王国的公主。姐姐艾尔莎天生拥有一种神奇的力量,可以制造冰雪,但这种魔法对她和她周围的人来说十分危险。为了保护妹妹安娜,艾尔莎从小就一直躲避着她。


艾尔莎二十一岁生日那天,被任命为阿伦戴尔的女王,在庆祝女王加冕的聚会上,艾尔莎失去了对魔法的控制,使阿伦戴尔陷入永恒的冬天。她对此感到十分沮丧,离开了阿伦戴尔。妹妹安娜由此踏上找回姐姐并结束冬日魔咒的旅途。


图2:电影《冰雪奇缘》的主要人物


一路上,她遇到了许多令人难忘的人物,比如采冰人克里斯托夫(Kristoff),以及他的地精朋友们(Trolls),当然,还有雪人奥拉夫(Olaf)。安娜也被艾尔莎的魔法影响,被诅咒逐渐冻结成冰。因此,对安娜和整个阿伦戴尔王国来说,打破艾尔莎的冬日魔咒十分重要。


在《冰雪奇缘》中,许多角色或在故事开始之前就认识彼此,又或在故事发展过程中相遇相识。艾尔莎(当然)认识她的妹妹安娜,而安娜也逐渐认识克里斯托夫,克里斯托夫则认识地精。这些人们之间的关系的集合,被称之为社交网络(social network)


社交网络非常重要——例如,它们有助于传播知识,因为人们在彼此交谈或发送消息时会传递给对方一些信息。在《冰雪奇缘》中,安娜通过社交网络,即从通过克里斯托夫认识的地精朋友们那里,了解到她的咒语只能通过“真爱之举(an act of true love)”来治愈。


网络:节点集合和节点之间的连边的集合。


2.测量中心性的基本方法


社交网络可以告诉我们其中个体的信息。当某人遇到困难时,他们可以从他们的朋友那里得到一些帮助。谁在冰雪奇缘中拥有最多的朋友?如果单单看电影的话,很难说,但我们可以研究另外一种社交网络——“谁与谁交谈”的网络。尽管我们在图3中显示的网络与“友谊网络”并不完全相同,但是更容易准确地显示在电影中谁与谁交谈,而不是确切地表明哪些角色彼此是朋友以及他们之间的友谊有多强大。


在这个对话网络中,安娜与九个人说过话,所以我们就假设她有九个朋友。数学家认为,在冰雪奇缘社交网络中,电影中的角色是节点(node),网络中的节点与其他节点相连。安娜便是其中一个节点,这九个朋友是她的邻居节点并且互相连接,她的度(degree)就是邻居(neighbors)节点的数量——9。同理,艾尔莎的度是8,因为她有八个朋友;克里斯托夫度是6。计算某人的度数是衡量其重要性的一种方法,当然,也有很多其他方法。


图3:冰雪奇缘主要人物网络


这个网络显示在电影中谁与谁交谈。两个角色彼此交流越多,他们之间的线越粗。我们用黑色突出了特别重要角色。电影中每个角色,都是网络中的“节点”。例如雪人奥拉夫(Olaf),他与三个角色——安娜(Anna)、艾尔莎(Elsa)和斯温(Sven)交谈,所以说他的度数是3。艾尔莎、安娜和斯文是奥拉夫在网络中的“邻居”。


仔细观察图3,我们能通过查看图中的网络来确定谁是冰雪奇缘中最重要的角色吗?重要人物往往有很多朋友,重要人物的朋友往往也是重要人物。为了用数字来衡量这一点,我们首先假设所有角色(即节点)同等重要,初始值为1。然后,我们通过累加他们所连接的节点(换句话说,他们的邻居)重要性数字,来更新每个角色(即节点)的重要性数字,即网络研究者提出的用来表示节点重要性数字——中心性(centrality)。这样做一次之后,初始值等于节点的度数——即每个节点的朋友数量。我们将这些数字除以所有节点的重要性之和(这使得数字不会变得太大)以获得新的重要性数组。


当我们一遍又一遍地重复该过程,将每个节点的重要性数字替换为其邻居的重要性数字之和,并将结果除以网络中所有重要性数字的总和,最终,重要性数字会停止变化。


请使用图4作为计算表格来试试吧!对于小型网络,这些数字通常很快就会停止变化。我们称计算结束时得到的数字为特征向量中心性(eigenvector centralities),它是基于重要节点具有重要邻居这一理念构建出来的一种中心性度量指标。“特征向量中心性”是我们正在计算的这种角色重要性程度特征的一个“花哨”名字。


对于图3中的网络,如果我们考虑角色彼此交谈的频率,那么安娜的值最大,为 0.295;克里斯托夫排在第二,0.210;而艾尔莎Elsa以 0.151 排在第三位。根据这些数字,我们认为安娜仍然是最重要的角色,而克里斯托夫则排在艾尔莎之上。如果我们忽略角色彼此交谈的频率,那么数字会有所改变:安娜仍然是第一位(0.146);艾尔莎排名第二(0.132);克里斯托夫现在排名第三(0.112)


图4:计算网络中节点的中心性特征向量的逐步迭代过程 


这时候,你可能想问为什么要费心计算像特征向量中心性这样的数字来衡量事物重要性。从《冰雪奇缘》中我们可以清楚地看到,大部分事情的发生都是因为艾尔莎的魔法,所以也许她应该是最重要的角色?然而,再看一看图3的网络:它是一个由谁与谁对话的网络,而不是由谁的行为导致什么重大事件的网络。图3中的网络告诉我们谁对电影《冰雪奇缘》的故事情节的推动很重要,而非谁引发了阿伦戴尔的一系列事件。


当然,我们可以对情节叙述做类似的网络计算,叙述网络是由一些事件引发另一些事件的网络[1]。在这种情况下,构建网络要困难得多。图5是尝试构建这样一个网络的开始;也许你能完成它?在这样的网络中,由艾尔莎引起的事件的度值和中心性特征向量可能很大。这意味着,在《冰雪奇缘》中,虽然安娜是推动故事情节的最重要的角色,但对故事构成最重要的却是艾尔莎。


图5:关于《冰雪奇缘》开头部分事件的一个简单但不完整的叙事网络


节点:网络中与其他事物连接的事物。例如,在冰雪奇缘中的社交网络中,电影中的角色就是节点。


度:节点的邻居总数。


邻居:节点连接到的节点。


中心性:表示节点重要性的数字。


特征向量中心性:一种中心性,建立在重要节点有重要邻居的观念基础上。


3.网络无处不在


现在我们已经演示了计算中心性这类的指标的方法,让我们后退一步。我们为什么要关心这些社交网络和并做计算呢?原因是网络在我们的日常生活中无处不在,学习网络有助于我们理解各种各样的不同事物[2,3]。我们来举几个例子。


一个非常重要的例子就是互联网。互联网是一个巨大的全球网络,由计算机、平板电脑、电话和其他通过有线和无线设备连接在一起的组成。我们可以把互联网看作是计算机们的社交网络。每台计算机都有“朋友”(与之相连的其他计算机),这些朋友是通往网络不同位置的网关,就像《冰雪奇缘》中的社交网络一样。当你用手机、平板电脑或电脑发送一条短信时,它会被传递给它的一个朋友、朋友的朋友,以此类推,直到消息最终到达收件人(你的朋友)。了解这个庞大的计算机网络的特性对于许多实际应用非常重要。例如工程师想知道哪些设备更重要(中心性),从一个设备到另一个设备平均需要多少步。在像互联网这样的大型网络中,彼此连接需要的步数是很多,还是很少[3]?


关于网络的另一个例子是自然界中的生物的相互作用。生物物种以许多不同的方式相互作用,其中最重要的关系之一是谁吃谁,这被称为“捕食”。我们可以选择一个物种(比如青蛙),然后列出其他吃它的物种(比如蛇和浣熊),以及被它吃掉的物种(比如昆虫和蠕虫)。如果为每个物种都制作出以上的列表,我们最终会得到一组很大的关系网络(称为“食物网”),说明许多物种之间的捕食关系。这与我们之前讨论的友谊网络和对话网络大不相同,但是通过研究这种网络,我们可以了解很多关于生态学的知识。例如,一个物种的中心地位可能表明,如果该物种灭绝,将会造成多么严重的生态破坏。


这些例子说明了网络这类的数学工具的强大功能。我们可以使用相同的数学工具来研究许多不同的网络,即使网络的实际组成部分——如字符、计算机或生物物种——可能非常不同。除了我们在这里讨论过的网络,还有很多其他的例子。你能想出一个吗?



4.关于网络,我们还能学到什么


在上面讨论过的有关网络的例子中,我们没有改变网络结构,即使人们一直在结交新朋友,比如当他们去一所新学校时。我们也没有区分不同类型的关系。例如,在《冰雪奇缘》中,艾尔莎和安娜是姐妹,但安娜和奥拉夫是朋友。


现在,科学家们正在积极研究将计算扩展到更复杂情况的方法,比如在连通的网络[4]中随着时间变化添加、修改或删除节点。在《冰雪奇缘》中,谁和谁交谈的网络是随着故事情节的发展而变化的,所以我们有必要采用重要性随时间变化的方法来衡量重要人物。


社交网络的另一个显著特征是,网络中同时存在着多种关系,而不仅仅是友谊;研究人员正在积极开发一种结合多种关系的方法来测量重要节点。这不仅对社交网络有帮助,对其他类型的网络也有帮助。例如,在自然界中,动物不只是互相捕食;它们还以其他方式相互作用,动物复杂的社会结构依赖于这些不同的关系[5]。


网络研究是一个令人兴奋的研究领域,它将数学、社会科学、物理、计算机科学、生态学和许多其他学科的思想联系起来。网络分析的主要问题之一是确定衡量人、动物和其他实体重要性的最佳方法。通过《冰雪奇缘》的例子,我们为你展示了这个令人兴奋的研究领域的一扇窗。


参考文献:


[1] Bearman, P., Moody, J., and Faris, R.2003. Networks and history. Complexity 8:61–71. doi: 10.1002/cplx.10054


[2] NetSciEd. (Eds). 2015. NetworkLiteracy: Essential Concepts and Core Ideas. Available online at:http://tinyurl.com/networkliteracy.(Accessed 5 July, 2019).


[3] Newman, M. E. J. 2018. Networks, 2ndEdn. Oxford: Oxford University Press.


[4] Taylor, D., Myers, S. A., Clauset, A.,Porter, M. A., and Mucha, P. J. 2017. Eigenvector-based centrality measures fortemporal networks. Multiscale Model. Simul. 15:537–74. doi: 10.1137/16M1066142


[5] Finn, K. R., Silk, M. J., Porter, M.A., and Pinter-Wollman, N. 2019. The use of multilayer network analysis inanimal behaviour. Anim. Behav. 149:7–22. doi: 10.1016/j.anbehav.2018.12.016


原文题目:


Who Is the Most Important Character in Frozen? What Networks Can Tell Us About the World


原文地址:


https://kids.frontiersin.org/article/10.3389/frym.2019.00099


本文来自微信公众号:集智俱乐部(id:swarma_org),翻译:郭治青,审校:Leo,编辑:李倩雨

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定