计算机伪科学：文科已经走了，理科还会远吗？-虎嗅网

零

我这学期选了两节统计课，一门是数学系的统计课（Intro to Statistics），另外一门是计算机系的统计课（Intro to Statistical Analysis）。

这两门课尽管内容相似，但风格大相径庭。

数学系的统计课是一个博后教，每天课上定义、定理、证明，一步一步严谨的很。

计算机系的统计课是一个俄裔教授教，之前在Amazon工作。

对他来说，方法不论对错，只论是否cool。

“我们这里算一个特征值，因为算特征值很cool，算对称矩阵的特征值更cool。”

“这两种estimator都很cool。plug-in很cool，但这个unbiased estimator也很cool，很难说哪个更cool。”

一

而且他这一句句cool不是随便讲的。

他有一次讲了这么一道题，说袋子里有N个小球（N未知），从1到N标号，你从袋子里拿n个（n远小于N），如何估计袋子里一共有多少球？

他给出的解法是，看拿出的n个小球的标号，取其中最大值，作为N的估计。

他说这个解法很cool，英军就是这样用德军坦克的序列号来估计坦克量的。

我一听觉得没有道理啊，直接取最大值，只会比N小，不会比N大。这个estimator有bias啊。

我给我的同学解这道题，他说，理论上，区间内取n个值中最大值，区间长度的期望，应该是最大值乘上(n+1)/n，这样才是unbiased estimator。

我觉得他想得比教授好。

结果第二天，我同学给我发消息，说他仔细算了算，教授的cool estimator的平方误差（estimator的黄金标准）更小。（勘误：算错了其实unbiased更好）

理论乍看很蠢的估算方法，在实际上可能很优。

姜还是老的cool。

这个俄裔教授除了cool还喜欢用一个词，叫fearless。

“你们如果用plug-in estimator，最cool的方式就是fearlessly一plug到底。不要犹豫，每当你看到true distribution的时候，都plug in empirical distribution。Be Fearless！That is what cool people do。”

他不喜欢数学系统计学家的一步一证明，战战兢兢，觉得他们就那么几个定理还要证来证去的，不够fearless。

他欣赏机器学习，因为它是fearless method。

目前来看，后者人定胜天的fearless精神占了上风。

All models are wrong. Some are useful.

二

机器学习对传统统计学的冲击引出一个问题——科学是否已经过时？

知识分子是否已经不再象征最高生产力，取而代之的是掌握算力的工程师？

工程师自信到什么程度？

那个俄裔教授读梯度下降（gradient descent）读的不是“古雷第恩特”，是“古拉第恩特”。

因为梯度下降什么都能解，怎么读都管用。

颇有一种人有多大胆，地有多大产的感觉。

“统计学家看到有十几个参数要优化都要吓尿了，我们勤劳勇敢（fearless）的计算机学家，用grAHdient descent，优化上亿个参数都是小菜一碟。”

而且他honestly不发“昂尼丝力”，发“夯尼丝力”。

感到那种扑面而来的粗犷的美了吗？

好像他的数据都是从西伯利亚的猛犸象身上剥下来的，通过石油管道输进苏联的坦克里都能跑起来。

三

现在有了AI4Science，解决科学问题都不需要懂多少科学了，只需要有数据和算法。

AlphaFold就只需要读一个字符串就能预测蛋白质结构，疾病检测就只需要读一张图。

学什么具体的学科，好像都不如转去计算机解决问题来得快。

颇有一种砸铁锅大炼钢铁的感觉。

在我年少无知的时候，我还选过MIT的神经科学课。结果每次上课都睡着，两周就把课退了。

唯一记住的是教授第一节课用熊的神经系统举例子的时候说的，”I have a personal interest in bears”。

这是因为教授的名字叫Mark Bear。

我退课时，Professor Bear对我说，“年轻人，神经科学的路还长，后面有意思的东西多的是。但就好像学一门语言一样，你想要聊天前得先背单词，学语法——你现在学的不过是神经科学这门语言的最枯燥的部分。”

学语言？没时间，不如机器翻译。

我把这节课换成了个计算机课。

拒绝熊市套牢。

四

Professor Bear的思维方式反应了神经科学作为一门学科的整体思维方式：bottom-up。

先小后大，先研究清楚neurotransmitter，然后神经元，neural pathway，之后才是脑区……因为它要科学准确，每一个结论都可以用实验掰开了揉碎了证明清楚。

但神经科学的科学严谨性也是一种作茧自缚。

因为底层的好多东西都还没有研究清楚，所以对于大家真正关心的问题，像“人怎么学习更有效（听什么歌？什么时间学？）”，“如何把人分类（星座，MBTI）”这样的问题，科学家不敢妄下定论。

所以就出现了理论未至，暴论先行的局面。

大多数人没有时间建立起对神经科学的系统了解，大家都愿意听一些简单的、能够指导我们思考的理论，例如“左脑感性，右脑理性”，“IQ上140就是全人类前1%聪明的人”，比如“人脑分为爬行动物脑、哺乳动物脑、理性脑三个部分”。

这些理论因为有无数不准确性被学界唾弃：IQ试图用一个数字来衡量一个人的智力，MBTI测试结果的很大程度上取决于测试人当时的心情，人脑作为一个整体分不出来三大部分。

尽管有大学教授的抨击，但不可否认的是，最终流行起来的是这种欠缺科学性，但简单易用的理论。IQ成为了许多学校录取、公司招人的敲门砖；MBTI成为了当代年轻人社交密码，人脑的三部分理论被畅销书作家用来解释人的欲望和动机。

传统理科的科学家们，由于他们对科学严谨的addiction式的追求，不敢提出如此大胆通用的理论。这违反他们作为科学家的“操守”。

而那些“伪科学家”们，敢于脱离现有的理论体系，在严谨性和实用性之间找到平衡，多快好省，大胆立论。

他们走出了象牙塔的固有思维模式，把火带到了人间。这个火是不可控的野火，使用不当会造成一氧化碳中毒，但也给象牙塔外的人带来了温暖和思考的乐趣。

有的人可能会鄙夷地说，这些伪科学家们就没有进过象牙塔。

确实啊，光脚的不怕穿鞋的。

世界是属于fearless people的。

And I think the world is better with those pseudoscience theories than without.

如果科学的目的是增进人类对世界的理解，那经实验验证、可以治药救人的科学，和容易理解、直接应用的“伪科学”，前者一定比后者更接近科学本来的目的吗？

“无法证伪的学科就是伪科学。”但不能证伪，不够准确严谨，难道就没有社会贡献吗？

五

在世界的一端，矗立着学术的象牙塔，里面是数学家、神经科学家、统计学家们。他们用严谨的推导和科学方法得出准确的理论。他们的理论可以把火箭送上天，可以制药救人，可以在羊皮纸上建立出人类智慧的丰碑。

在另一端，是一个繁忙的小镇，里面的市民忙于生产活动，没有时间去思考象牙塔里羊皮纸上的符号和理论，但他们想生活得更好。

在这两端之间，有一个个赤脚行走在知识的荒原上的人。他们怀揣着从象牙塔里偷拿的花瓶，扯下来的书页，想着如何在镇里变现。

他们在象牙塔中不受欢迎。象牙塔里面的人管这群赤脚的人叫做伪科学家。

但他们是象牙塔和镇子之间的桥梁。

做桥梁没有什么可耻的。不管是象牙塔，镇子，还是这些赤脚的人，都在以自己的方式为这个世界做出贡献。

我想做桥梁。

六

我因为不懂物化生这样的理科，我做不了AI4Science。但是我懂一些心理学，所以可以做AI4PseudoScience。

要做AI4PseudoScience，自然要识别伪科学中的重要问题。我认为，MBTI就是这样的重要问题。

它是一对母女在读完荣格的理论之后一拍脑袋想出来的。测试方式非常原始：自己填问卷。非常不科学。（btw：我是INTP）

我想要在保证它简单易用，能流行开来的情况下，借助机器学习的力量做出能更准确分类人的测试方法。具体来说，用表征学习让机器总结出来四个维度，然后做十六个聚类。

而且神经网络就不止能读问卷了，可以读视频、音频、文字，甚至鼠标点击速度。你点进网站的那一刻，测试就开始了。

机器学习和心理学，两大伪科学强强联手。非常cool，非常fearless。

我的梦想是，之后见面大家都不问MBTI，问ANDI。

科学是科学家的墓志铭，伪科是伪科人的通行证。

本文来自微信公众号：安迪今天不写码（ID：gh_6f887df0d301），作者：安迪