这个“上古时期”的论坛,保存了1981年以来的互联网记忆
2019-05-17 19:00

这个“上古时期”的论坛,保存了1981年以来的互联网记忆

本文来自微信公众号:触乐(ID:chuappgame),原标题《不止从2017,这里为你保存了1981年以来的互联网记忆》,作者:熊宇,封面:Giphy


或许你早就听说过互联网的记忆很短暂,但它可能比你想象的更短暂。


这种“短暂”是物理的,在通常环境下,光盘与硬盘中的数据只能储存几十年;刻录光盘的保存时间更短,通常不到10年;SSD硬盘一年不通电,会出现数据丢失的现象。与此相比,看起来落后的纸张与简帛,却能为我们带来两千多年前的历史记载。


这种“短暂”又不只是纯物理的,昨天还能看见,今天就能看不见,可能是因为服务器故障、网络故障、存储故障、终止服务或其他原因……不管因为什么,对网络访问来说,“无法连接”就意味着消失于人们的视野,“拒绝开放”对其他人来说无异于“并不存在”。‌


在数字时代,一切信息看起来都唾手可得,但唾手可得的一切又可能会随时消失。这既充满希望,又使人心怀恐惧。


一篇30年前的文章,让我发现了Roguelike的来历


在游戏媒体工作,搜寻资料的技能是必备的,但一些老资料实在是年深月久、无从寻觅。


去年,我写了一篇关于Roguelike这个名字的来历与变迁的文章。在写作中,最让我苦恼的事情是“Roguelike”这个词最初在什么地方被使用,又是谁把它确定成了如此普遍的用法(甚至是一个游戏类型)


当然,说起这个名字,大家都会提到《Rogue》,但这可不够


经过长时间搜索,一些零散的讨论和介绍性的文章将线索指向了Usenet上的讨论。Usenet,这对我们来说可能是极度陌生的一个词,我们可以将它理解为一个论坛。当然是“上古时期”的论坛——甚至古老到你无法用浏览器访问它。


你还记得IE 6.0吗?由于Windows XP过去在中国高普及度,IE 6.0是许多人接触的第一个浏览器。现在想来它已经是十分古老了对不对?而这个古老浏览器的版本是6.0,此前还有5个大版本,IE浏览器的第一个版本发布于1995年,而Usenet比初版的IE浏览器还早了15年。


现在,使用Usenet需要专门的客户端。从原理上来说,Usenet的运行与电子邮件颇为类似。和电子邮箱有供应商一样,Usenet也是将一台主机作为专用服务器,发言的用户向这台主机发送“邮件”(当然与电子邮件的格式不一样),另一些需要查看该内容的用户则需要从主机手动下载这个帖子。


Usenet会产生巨大的传输和储存压力,图中显示的便是1341天当中几个主要群组产生的数据量


用一种不那么恰当的描述——对用户来说,使用Usenet时他们向一个公共的邮箱发送电子邮件,同时,他们可以查看这个邮箱上的所有邮件,并且手动将邮件下载到电脑上查看具体内容。这听起来很不方便——你能想象每看一个帖子和每一个回复都要重新下载一次吗?但在互联网时代早期,Usenet却开辟了一片公共的空间,使得一群人有了共同交流的场所。


我在Usenet上找到了所需要的资料。原来,“Roguelike”这个名字是由数百人经过多次投票,在否定了“Dungeon”“Alphabet-Soup”“Hacklike”等等一众名称,又经过了长时间的适应过程后,才让人们接受了它。


我看着这些讨论,参加讨论的人们当年可能是20岁、30岁、40岁,现在已经变成了50岁、60岁、70岁。他们现在可能已经不玩游戏了,但在当时,这些只有字符在跳跃的游戏,在他们的眼中却是一个崭新的奇幻世界。以至于他们坚信不应该将这些游戏和传统游戏放在一起,应该拥有一个自己的名字。


他们当然不会想到数百人讨论确定的名字会有日后的风光——现在这个类型在全球可能有数以亿计的受众。


古老的Usenet与留住它的Google Groups


Usenet太硬核了,不仅不方便使用,而且使用的费用不低。由于主机要频繁进行下载与发送文件,Usenet的网络主机往往由专业供应商提供——这意味着上网之外需要额外付费。费用往往根据流量计算,每个月的报价大概为5美元~20美元。


由于Usenet主机供应商有些难以寻找,有用户总结了一份可供参考的供应商列表


不过,在网页浏览器普及之后,Usenet显得并不方便,在这种不方便的基础上还要额外付费,Usenet的下场也就可想而知了。对于熟悉这个时代网络的新用户来说,Usenet的门槛几乎是难以逾越的,谁会付费购买一个不方便,又没有太大必要的服务呢?要知道,就连更方便的RSS订阅都已经有了渐渐不再受欢迎的趋势了。


Usenet的没落是一种进步,是技术发展的必然结果。但Usenet的价值却不仅仅在于这个架构本身,更重要的是,它在30年中积累下来的海量内容。一名游戏爱好者有一天想要溯源“Roguelike”,能从这里寻找蛛丝马迹。一名对其他领域有兴趣的人,也能从Usenet中找到他想要的东西——Usenet本身就记录了历史。


在Usenet被应用的早期,它的用户们就提出了这样的问题。1982年,一名叫Scott Orshan的用户在Usenet上提出,“任何网站都应该永远保留它所发布的所有文章”(Every site should keep all the articles it posted, forever.),与这个观点一同提出的还有他的Usenet帖子的分布式归档方案。此后的数年,Usenet一直在系统性地备份并储存积累的帖子,并为之设计出了检索等功能,这些计划的参与者既包括个人,也包括商业公司。


其中,第一家基于网页的Usenet数据库由Deja News公司在1995年开始建立。2001年,该公司被谷歌收购。随后,谷歌推出了Google网上论坛(Google Groups),除了使用Deja News的数据库外,此前曾建立过自己数据库的个人与公司,纷纷将自己保留的数据捐献给谷歌,而谷歌也将这些档案免费开放给所有人。


现在,任何人都可以在Google网上论坛中查看Usenet上自从1981年以来保存下来的帖子。


这些数据可能经过几个备份的网站,最终汇聚在这里,而它们只是简单的几句网络聊天


Google网上论坛实质上是两类东西的混合,一方面它是论坛或更接近新闻组(可以近似地理解为依附电子邮箱的Usenet),能够像普通论坛一样发表帖子,阅读别人的帖子;另一方面,它也是一个网络档案馆,它所保留下来的许多东西已经与我们有了足够的距离,可以称之为“历史”了。


这个时代的记忆力


互联网时代的人们获得了许多信息,不可避免地也会失去一些信息。在我们经历的时代中,网盘、种子、帖子都可以算是在网络上不断失去的东西。


曾经的网盘时代,人们争相使用网盘,甚至有“网盘将会逼得移动硬盘再无容身之地”的论断。但没多久,网盘大潮退去,市面上的产品所剩无几。留给我印象最深的,是那些网盘宣布关闭的前几天,所有人都在疯狂下载资源的景象。这些人抱怨说,储存的东西太多,下不完了,只能选择最想留住的东西。


人们经常叹息种子,所有以种子发布的资源都面临着无法保存的问题。和网盘不同,P2P下载依赖和取决于是否有人上传,因此见到一个冷门的种子将会是一种奇异的期待:你能够看见它包含怎样的东西,但可能永远无法得到它。


帖子则是容易遗失的另一项内容要素。大到百度贴吧,小到只有不到百人的小众论坛……无论因为什么原因,删帖就意味着一些东西从我们的视野中消失。甚至,一些小众论坛因为无法为服务器续费而关站时,所有的帖子,连同许多宝贵的数据也就直接消失。相比Usenet上有许多人来创建数据的保存与归档项目,我们的数据分散在个人手中,各种意外都会使得它们永远不见天日。


中国的互联网时代起步得晚,我们没有Usenet,但我们有的各种聊天室、论坛、QQ空间、校内网、人人网、百度贴吧,它们就是中国的Usenet。它们从中国的互联网早期就存在,并始终面临着丢失一些东西的风险——其中的很大一部分内容事实上已经失去了,只是你从未留意到罢了。


互联网的记忆其实不长,所以当我在Google网上论坛里找到许多上世纪的网络材料时,同时产生了欣喜、羡慕与心酸的情绪。Google网上论坛在海外受到了一些人的批评,他们说谷歌提供的检索功能不够好,各项功能也长期不进行更新。


我觉得这些看法都很有道理,我在其中检索时也费了不少功夫。但是,它如实地、长期地、稳定地记录下了当年互联网的一切,甚至还是免费开放的,对此我又能抱怨什么呢?

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定