围观一场深度学习界的“神仙打架”
2019-12-27 14:54

围观一场深度学习界的“神仙打架”

本文来自微信公众号:量子位(ID:QbitAI),作者:鱼羊、十三,原标题:《神仙打架激辩深度学习:LeCun出大招,马库斯放狠话,机器学习先驱隔空“互怼”》,题图来自:《复仇者联盟》


AI学术圈,又吵了起来,图灵奖得主、年近古稀的机器学习奠基者、唱衰AI的代表人物等等,纷纷下场“开怼”。


相关话题在Twitter上转发过千,点赞数万,场面极其激烈。


究其源头,起于一个直击灵魂的问题:什么是深度学习?


什么是深度学习?


你可能会很自然地想起那段再熟悉不过的定义:


深度学习(DL)是一类机器学习算法,使用多个层逐步从原始数据中提取更高层的特征。


——维基百科


有点懵逼?


现在,有人给出了更明确的说法,出手者不是旁人,正是深度学习三巨头之一,图灵奖得主Yann LeCun。他说:


有些人似乎仍然对什么是深度学习感到困惑。以下是深度学习的定义:深度学习就是构建由参数化功能模块构成的网络,并利用基于梯度的优化方法进行样本训练。


与此定义正交的是学习范式:强化学习、监督学习或自监督学习。不要说“深度学习没法做X” ,如果你真正想的是“监督学习需要太多数据所以没法做X”。


对于其扩展形态(动态网络、可微编程、图神经网络等),网络结构可以依数据动态变化。



这话之后还没完,他又一口气放出了5个排比句,对当前深度学习领域出现的“术语”进行了解读:


别说“DL对对抗样本很敏感”,你真正的意思是“受监督的卷积神经网络对对抗样本很敏感”。


别说“DL存在偏见”,你真正的意思是“纯监督学习再现了训练数据中的偏见”。


别说“DL无法处理组合性”,你真正的意思是“此特定体系结构不能推广到许多以前不可见的部件组合”。


别说“DL不做逻辑推理”,你真正的意思是“一个简单的前馈神经网络不能做长链的推理”。


别说“DL不做因果推理”,你真正的意思是“一个普通的、有监督的神经网络不会自发地发现因果关系。”



本来是对自己去年初提出的观点——“深度学习不再是流行概念”进行了一次回应。


但谁能想到,推文一出,各路大神纷纷出面发表观点,展开了激烈的讨论。


一场大型“互怼现场”就此拉开序幕。


机器学习奠基人下场激辩


马库斯开杠LeCun


第一批下场的,有DeepMind的高级研究科学家Danilo Jimenez Rezende。


他点赞认同,对Yann LeCun的观点进行了简要总结:


深度学习是用于构建复杂模块化可微函数的工具的集合。讨论深度学习能做或不能做什么毫无意义。真正有意义的是如何训练它,以及如何把数据喂给它。


但知名AI“杠精”——马库斯看到这条推特,当场不干了:


如果不能讨论一种方法可以做什么不能做什么,那它还算是一种方法?


推崇深度学习的人现在为了不被批评,总是在尽量避免提出具体、可验证的主张。这是有一个很危险的信号。



机器学习先驱下场反击:深度学习是方法论

对此,机器学习领域奠基人之一、AAAI前主席Thomas G. Dietterich迅速下场回击:


深度学习本来就不是一种方法,而是方法论。是一种研究路径。



结果,这一辩论分会场又炸出了另一位大佬——机器人教父Rodney Brooks。


他说:啊,所以深度学习是AI还是AGI哇?还是说人能想到的未来科技都基于深度学习?



这一发言似乎又点燃了马库斯新的战斗热情:


Rodney Brooks说得对啊!深度学习社区现在给自己的定位就是所有未来科技都将归功于DL,但他们并没有真正致力于任何事情。


等着吧,我马上就会火力全开。



面对这样的“挑衅”,Dietterich表示图样图森破:DL(以及AI社区)的目标是推动智能系统的科学和工程进步,而不是成为嘴炮王者。



深度学习没有定义“是什么”,而是“如何进行”


在各方互怼之外,Keras创造者François Chollet也另开新帖,对“什么是深度学习”发表了观点。



他认为,截至现在,深度学习的定义对他来说过于“严格”。并且和以下情况是相反的:


⑴ 非表征性学习(如SIFT、symbolic AI等人工特征工程)


⑵ “浅层学习(shadow learning)”,其中只有一个特征提取层。


此外,它没有规定一个特定的学习机制(如反向传播)或一个特定的用例(如监督学习或强化学习)也不需要端到端的联合学习。


现在的定义描述的是我们该如何进行深度学习,而不是它是什么。


而现在的深度学习的定义,只是给出了一个比较清晰边界:哪些是深度学习,哪些不是。例如:


DNN是深度学习,而遗传编程、快速排序和支持向量机就不属于深度学习。


单个的密集层(dense layer)不是深度学习,而密集堆栈(dense stack)是深度学习。


K-means不是深度学习,而堆叠K-means特征提取器是深度学习。


通常由人类工程师编写的程序不是DL,参数化这样的程序来自动学习一些常量仍然不是DL。


需要用一连串的特征提取器来进行表征学习。


François Chollet认为,深度学习模型只代表了很小很小的程序空间。



本来Chollet并未加入论战,谁知道还是被拉下了水。


有好事网友Ben Kamphaus在马库斯的推文下,当场@了他,还有另一位深度学习巨头、图灵奖得主Bengio,他说:


Bengio、Chollet以及其他人正在对需要解决的问题进行实质性的处理了。


不知道那些愤怒高呼让DL研究人员去做他们已经做了很多年工作的人,对解决这个问题有什么帮助。



马库斯则坦然解释说:


我很了解Bengio和Chollet,只是希望他们更坦率些。


你曲解我的意思了。


对于马库斯的这一说法,Bengio和Chollet都没有给出直接回应。


吃瓜群众一脸懵逼


场面上,感觉大半个AI学术圈都下场争鸣了。如此盛景,吃瓜群众不免有些懵逼。


有人问:这个问题这么棘手的吗?



当然,还有一脸懵逼的。



那么,你是怎么看的呢?


第一现场传送门:https://bit.ly/2ZqjKkA


本文来自微信公众号:量子位(ID:QbitAI),作者:鱼羊、十三

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定