一个统计学噩梦
2019-08-13 12:00

一个统计学噩梦

本文来自微信公众号:原理(ID:principia1687),作者: Leah Burrows,头图来自视觉中国


在20世纪初期,海洋中发生了一些奇怪的事情。北大西洋和东北太平洋的温度似乎是全球平均水平的两倍,而在几十年的时间里,西北太平洋则在逐渐变冷。


大气与海洋模型很难解释这种温度的差异性变化,这导致了气候科学中的一个谜:为什么在20世纪初,海洋的升温和降温速度会如此不同?


现在,哈佛大学和英国国家海洋学中心找到了一个答案,这个答案既简单如小数点的截尾,又复杂如全球的政治。它一部分是历史,一部分是气候科学。几十年的数据因这项新的研究得到了修正,表明了海洋变暖是以一种更为均匀的方式发生的。研究人员将这一发现发表在了《自然》杂志上。


几个世纪以来,人类一直在测量并记录海面的温度。海洋的表面温度能帮助水手确认航线、确定方位、预测风暴天气。在20世纪60年代之前,对海洋表面温度的测量大多是通过将一个桶扔到海里,然后测量桶里的海水温度来完成的。


美国的国家海洋和大气管理局(NOAA)和国家大气研究中心(NCAR)保存了一系列能追溯到19世纪早期的海平面温度读数。该数据库包含了来自世界各地的渔业、商业、研究和海军舰艇的超过1.55亿次的观测结果。这些观测对理解海洋表面温度随时间的变化是至关重要的,无论这种变化是由自然因素还是人为因素导致的。


同时,它们也是统计学的噩梦。


例如,你要如何将一个英国军人在1820年测量的数值与一艘日本渔船在1920年或一个美国海军舰艇在1950年测得的数值相比较?你要如何知道他们各自使用了什么类型的桶,以及在取样时,他们的水被阳光加热了多少,又或者因蒸发而冷却了多少?


在典型的天气条件下,将帆布桶里的水在甲板上放置三分钟,会比在同样条件下的木桶里的水多冷却0.5摄氏度。而在20世纪,全球变暖的温度差异只有约为1摄氏度,因此我们需要仔细计算不同测量方案之间存在的偏差。


论文的作者之一Peter Huybers说:“这个数据库中含有数十亿字节的数据,每个数据都有一个离奇的故事,每个数据都有其独特性。”


已经有大量研究用来识别和调整这些独特性。例如在2008年,研究人员发现1945年的海洋表面温度之所以突然上升了0.3摄氏度,是因为这些数据是在船舱引擎的进气口测量的。然而,即使有了这些修正,数据也远非完美,海洋的表面温度仍存在许多无法解释的变化。


Huybers和他的同事提出了一种综合的方法来修正数据,他们用了一种新的统计技术来比较附近船只的测量数据。这篇论文的第一作者Duo Chan说:“我们的研究方法是观测距离在300公里以内、时间相隔两天的不同船只测得的海面温度值的差异。使用这种方法,我们发现了1780万个这样的交叉点,并发现其中一些出现了较大的偏差。”


研究人员重点关注了1908年至1941年间的数据,根据船的所属国和“卡片组”进行了分类,这些“卡片组”是用一叠叠穿孔卡片存储的海洋观测数据。其中一叠卡片组还包括极地探险家罗伯特·斯科特(Robert Falcon Scott)和欧内斯特·沙克尔顿(Ernest Shackleton)在南极之旅所观测到的数据。


论文的另一合著者Elizabeth Kent说:“从原始的航海日志到现代档案,这些数据经历了漫长的旅程。人们为了能将可用的信息装入穿孔卡片或数量可控的磁带卷中作出了艰难的选择。现在,我们有了能揭示这些选择会如何影响数据的方法和计算能力,还能找出由于不同国家在观测上的实践差异而产生的偏差,从而使我们更接近真实的历史温度。”


在新的研究中,他们发现了两个导致北太平洋和北大西洋温度差异的关键原因。第一个原因与日本记录的变化有关。1932年以前,日本在北太平洋的海面温度记录大多来自渔船的记录。这些数据散布在几个不同的卡片组上,最初全都是用华氏温度记录的,然后才转换成了摄氏度,最后根据四舍五入的规则精确到0.1度。


然而,随着第二次世界大战开战在即,越来越多的日本读数开始来自海军舰艇。这些数据被存储在了另一个卡片组上,当美国空军将收集的数据数字化时,他们对数据进行了截取,去掉了零点几度的数字,以整的摄氏度来记录信息。


Huybers说,那些未被人意识到的因数字截取产生的效应,可以在很大程度上解释为什么在1935年到1941年间,太平洋的海面温度估算出现了明显的快速降温。在修正了由数字截取引起的偏差后,太平洋的变暖更加均匀了。


○ 从不同的数据集中,得出的北太平洋(上)和北大西洋(下)的海洋表面温度的年度变化。蓝线表示的是经过该研究修正之后的数据。它表明与之前的估计相比,北太平洋的变暖程度更高,北大西洋变暖程度更低。| 图片来源:Chan et al.


日本的数据掌握了20世纪初太平洋变暖的关键;而在同一时期的德国数据则在理解北大西洋的海面温度方面起到了最重要作用。在20世纪20年代末,大部分的北大西洋数据都开始由德国的船只提供。这些测量数据大多都记录在同一个卡片组上,与附近的测量数据相比,这个卡片组上记录的温度要高得多。在调整后,北大西洋的变暖趋势得到了缓解。


研究人员发现,通过进行这些调整,整个北太平洋和北大西洋的变暖速度变得更加相似,而且变暖模式更接近根据温室气体浓度的上升所作出的预期。然而,差异仍然存在,研究人员在这些测量结果中发现的整体变暖速度仍然比模型的模拟预测更快。


Huybers说:“仍然存在的差异凸显了继续对气候会如何受到辐射影响,气候的敏感性及其内在的可变性进行研究的重要性。与此同时,我们需要继续梳理数据,通过数据科学、历史调查和对问题的良好的物理理解,我敢打赌说我们还将会发现更多有趣的特征。”


原文标题为“Solving a statistical nightmare”,首发于2019年7月17日。原文链接:https://news.harvard.edu/gazette/story/2019/07/researchers-find-a-simpler-pattern-of-ocean-warming/. 中文内容仅供参考,一切内容以原文为准。


本文来自微信公众号:原理(ID:principia1687),作者: Leah Burrows

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定