除了爆款冥币、给猪盖章,我们还研究监狱建设标准
2019-08-28 16:19

除了爆款冥币、给猪盖章,我们还研究监狱建设标准

本文来自:一席(ID:yixiclub),作者:吴松磊,原标题:《我们还看很多有价值的材料,比如这个是监狱建设标准》,封面来自东方IC


吴松磊,短视频频道《PaperClip》制作人。


这就是我们今天在做的事情,直面这个技术高度复杂到几乎看不懂的当代生活,并试图向所有人解释这个世界究竟是怎么运转的。



全文充斥着大量可怕的数学公式和专有名词,请不要紧张,搞不懂也不影响理解文章,可以忍一下,或者跳过去。


如何把一个平凡的问题讲清楚

我叫吴松磊,我是做科普视频的。很高兴今天可以在这里和各位分享我们的工作。


 科普视频在中国是一个比较罕见的视频类型,主要原因是因为不太赚钱。因为科普,科学普及,听起来好像是一个公益事业,没有什么商业性。
在中国做科普视频的主要有两类,一类其实是教授或者专家,他有专业的知识,但不懂怎么做视频;另一类是可爱风格的动画片,它是设计师来主导的,内容比较浅。而且科普的假想观众是小朋友,所以视频看起来比较幼稚。


这恰恰就是我们的机会。我们想做的其实是严肃的、高信息密度的,给成年人看的科普视频。


我们的频道叫——回形针PaperClip,在2017年11月底发布了第一支视频。



看起来就和传统的科普视频路数不太一样。在这个视频里面我们找到了青岛市市北区平安城市监控系统的一个建设方案,大概有90多页。通过这个方案我们大概知道了中国的摄像头体系是如何建立的


比如摄像头的类型,有球机和枪机,枪机适用于什么样的场合?球机适用于什么样的场合?我们在视频里都做了研究。



还可以看到中国摄像头的布点,它有一类监控点、二类监控点,不同的监控点有不同的参数要求,需要放在什么样的点位来设计。

同时我们也看到这个系统有一个很长的设备清单,54项,需要准备这些才能搭建一个复杂的监控系统。

最后我们还分析了这个摄像头需要多大的硬盘来保存数据。摄像头24小时都在产生数据,如果一个720P的摄像头需要保存至少15天的数据的话,硬盘容量至少要316G。



这就是我们做的第一支视频。做这样的视频其实还是蛮难的,当时我们只有两个人,我负责视频的文稿和分镜的设计,另外一位同事做视频的动效设计。


做完这个视频的两个月后我们才做出第二个,爆款冥币



冥币虽然看起来没什么技术含量,其实是一个非常有意思的小众行业。在中国冥币大概有三种类型:烧纸、元宝 、钞票。这三类冥币每一种都有自己的门道。


比如烧纸,我们可以看到烧纸有皱纹、压泡、木粉、印花、打孔,不同的工艺对应的是不同的制造逻辑。



元宝也有它自己的门道。如果你靠手来折元宝的话,效率非常低,所以有一种元宝自动折叠机。



这个机器卖两万块钱,但每个小时你都可以收获一万个金元宝,感觉还挺赚钱的。


最有难度的其实是设计这种长得像人民币的纸钱。我的同事花了大概十几个小时,在Photoshop里设计了一张冥币。



首先做底纹的逻辑、字体,然后它的印花,最后我们就得到了一张原创的、看起来很有卖相的冥币。




这是一个很严肃的事情,我们的视频是非常严肃的。我们希望告诉大家每一个看起来微不足道的行业,背后都有很多的付出和设计。


在这之后我们又做了更多的视频。



这些话题听起来好像挺有意思的,但其实有趣和创意这件事完全不是我们的强项。


有些朋友经常问我,你们视频的选题是怎么选出来的?我的答案是随便选的,这是实话。我们的话题都是随便想的,因为可以研究的问题实在是太多太多了。


比如在座的各位,你们把自己想象成是一百年前穿越过来的,你马上就会出现无数个问题:这个灯怎么发出这样的光?麦克风怎么发出声音,并通过音响传递出来?我后面的显示屏怎么样显示色彩?今天场地的中央空调是怎么样工作的?我们研究的就是这些平凡朴素的问题。


提出问题并不难,难的是怎么样把一个问题讲清楚。如果你们觉得把一个东西讲清楚不难,那可能是你们对讲清楚的标准太低了。



我接下来举一个例子来讲什么是把一个问题讲清楚。


机票,我们很熟悉,但机票的价格是怎么定出来的?



中国的机票价格是民航局开会定出来的。我们中国机票经济舱的价格有一个上限,比如北京到上海的经济舱全价票是1490块钱。


我讲了一下这个问题,但是我讲清楚了吗?没有,这个问题里还有很多疑点。


首先,为什么机票价格是民航局来定?以及民航局是根据什么样的文件、什么样的方法把1490块钱定出来的?决定中国机票价格的参数都有哪些?


为了研究这些问题,我们去查了很多资料。我们发现中国民航局在1950年建立了中国的第一条航线,从天津到广州。因为它是计划经济体制的产物,所以中国直到今天,所有机票的全票价格都是由民航局说了算的。



最新的机票定价公式在这里,2014年发布的进一步改革民航定价的规定,我们可以看到具体的机票定价公式,就是这个。



它前面是一个LOG函数  ,后面是航空里程乘以1.1,大概就是这个样子。



所以我们把北京到上海的航线距离带进去算,就可以算出一个价格,1240块钱。但这还不是最终价格,因为中国民航局规定,航空公司在每一个航季都可以上涨10%的价格,所以1240块钱再上涨两次10%,就是今天的全价票1490块钱。



我有没有把这个问题解释清楚呢?还是没有。


这个公式为什么是这个样子?为什么要引入一个奇怪的LOG函数?它的底数是航空里程乘以0.6,这个公式是怎么得出来的?为什么要这么算?


我们又找到了上一版中国机票定价公式,这是一个2004年的文件。很简单,航空里程乘0.75,也就是你飞一公里是0.75元,飞十公里就是7.5元,按这个方式给机票定价。



但这个公式相比我们刚刚看到的那个公式就暴露出了很多问题,它不能有效地反映航空飞行的边际成本是递减的。


你从北京飞天津虽然里程很短,但起飞、降落和人员成本仍然是固定的,里程越长,每公里的成本就越低。这就是LOG函数的意义。



讲到这里我大概解释了中国机票定价的逻辑,但还有一个更有趣的问题在背后:中国机票的折扣票是怎么定出来的?


大家可能没有注意到,我们的登机牌上有一个很有趣的东西,叫舱位。每个舱位都有一个代码,这意味着你买的这张机票到底打了几折。如果是M,就是8.5折,如果是Y的话就是没有打折。



航空公司对舱位的划分有多细呢?他们把26个字母都用完了,全部都用来做他们的舱位了。以山东航空为例,这26个字母你都可以看到。它为什么要分得这么细?



背后其实是收益管理问题。麻省理工的Belobaba在1987年的博士论文中提出了一个模型,今天航空界仍然在沿用,叫做期望收益座位管理。


为了解释这个,我们就要知道航空公司为了获得收益最大化,需要卖出多少个Y舱,多少个M舱,多少个B舱。我们在视频里做了一个简单的模型,今天时间有限,我可能没有办法把这个模型完整地解释给大家。



所以按照我们这个讲清楚的标准,今天周围的一切其实都没有被讲清楚过。自来水是从哪来的?为什么我们的手机连上Wi-Fi就可以上网了?各种各样的问题。


我们生活在一个技术高度复杂的时代,每一个看似不起眼的技术后面都隐藏着基础学科和工程技术的突破,而我们甚至意识不到这些问题是我们不知道的。我们在研究很多问题的时候就像一次探险,因为不知道前面会有多少陷阱在等待着我们。


举一个例子,我们有一期节目讲BT种子和磁力链接是如何工作的



我们之前觉得它的运作逻辑还挺简单的,其实就是你在下载一个文件块的同时也在上传一个文件块,因为它下载的时候把一个文件分成了很多块,你在下载第13块的时候,他在下载第26块……(‍这段太复杂了,想看的朋友可以拖拽到文章末尾仔细研究。)

……


我们花了很多时间在研究之前完全没预料到的问题,当然最后我们搞清楚了。这个情况在我们研究各种话题的过程中非常常见。


在我们做过的所有视频里,最艰难的是这一期,如何设计一个三维模型



做这一期的时候我们团队很放松,觉得没有什么难的,因为设计三维模型我们很多人都会。我们大概的计划就是讲一讲建模的基本原理、建模的单位、三角面、四边面,最后我们演示一个建模的流程。很轻松,很愉快。


但我们很快就遇到了问题。曲面建模是一个点变成一条线,一个线变成一个面,一个面变成一个体,是这样的流程。我们卡在了第一步,怎么画一条线?


大家可能觉得画一条线很简单,拿着iPad画一下就是一条线,但其实不对。你画的那个线其实不是线,是很多个点。你把你画的线放大很多倍来看的话,就会发现它的边缘不光滑。那个不是线,那个是由很多个像素点组成的一种图案。



所以为了让计算机生成平滑的曲线,我们需要函数,让计算机知道我们要画一条这样的线,无论放大多数倍它的边缘都是光滑的。最常见的一种线叫贝塞尔曲线


贝塞尔曲线大概是这个样子。Photoshop里面的钢笔工具用的就是贝塞尔曲线,它通过几个锚点确定一段曲线,生成过程大概是这样。



如果我们有ABC三个控制点,就可以通过计算生成这个点。



研究到这的时候我们觉得可以了,我们终于可以开始从线到面了。但还是不对,贝塞尔曲线有很多问题。


首先,贝塞尔曲线的每个点都会控制整条曲线,所以你要画一条很长的曲线的时候就会有问题。如果你不想用很多点控制一条很长的曲线,你可以把贝塞尔曲线分段。


比如你用四个点画一条曲线,把所有曲线都连起来就是一条完整的曲线。但这个的问题是,它的连续性不够。



连续性是什么呢?它有C0连续、C1连续和C2连续,贝塞尔曲线只能做到C0连续。为了做到C2连续,你需要它的二阶求导,也是连续的。



看到这个时候我们就已经很崩溃了,怎么办呢?我们到底怎么样才能做到工业建模需要的C2连续的曲线呢?


我们查资料的答案是这个,非均匀有理B样条(????????)



怎么办?已经有点无法收场了。非均匀有理B样条到底是什么?什么叫非均匀?什么叫有理?什么叫B样条?公式里面有P,有N,有T,每一个字母我都不认识,完全不知道是干嘛的,很懵。


我决定再找找,再研究一下。我们下载了一些课件,大概是这个样子的。它不是一页是这个样子,它每一页都是这个样子。



这个时候我有点想放弃了。我觉得完了,这个真的搞不懂。但是我们的动效师鼓励我,他说你不要轻易放弃,我们还有机会。


他买了一本《计算机图形学》,是清华大学计算机系的教材。我们当时买这本是二手书,翻开之后,发现目录页写满了前任读者疯狂的草书。



你们可能没有看懂写的是什么。我们仔细辨认了一下,写的是:清华,我CNM。


原来这个东西这么难。我们三个人组成了一个学习小组,每天各自看一点,然后互相交流,互相学习。过了一个礼拜我们终于搞懂了。


这个公式涉及了很多基础概念,如果你不理解基础概念的话,就没有办法理解这个公式。所以我们搞懂基础问题之后,最终搞懂了这个公式。



我今天尝试给大家讲一下,但很有可能讲不懂。我快速地讲一下,因为不讲你们也会好奇。(并没有。)


是这样,这个函数不是传统的Y=f(x)那种函数,Y=f(x)我们初中都学过。这个函数不是一个横坐标X,纵坐标Y,不是那样的东西。


它叫参数函数。我们定义一个P1,定义一个P2,这个公式就是参数函数的公式,P1是起点坐标,P2是终点坐标。然后我们定义T是0到1,所以T在0到1之间有无数个值,无数个值带到这个公式中就会生成无数个点,把这无数个点连起来就是这条线。是不是很清晰?



你仔细想想就会发现其实是这么个意思,挺有意思的。它的核心在于T的定义域以及它的控制点,它通过点来生成线。所以我们进一步来理解这个B样条的公式。



这个Pi是它的控制点,N是函数,T是它的定义域。我们把它展开看一下。



为什么它可以做到C2连续?为什么它通过几个点就可以控制一个阶段性的曲线?因为它的基函数是一个多次递归的基函数,N0,0和N1,0可以生成N0,1。每一次组合的次数都可以生成更高的基函数,这样就得到了曲线。(……)


我们的视频做了一个可视化,非常辛苦地做了,看起来还是蛮清晰的。



你可以看到1次就是基函数这个直线的样子,2次就是这个,然后2次组合成3次,3次再组合成4次,最后它就生成一条这样平滑的曲线。


我们可以在这样的结构里进一步地看到,它确实是几个T的控制点在控制基函数,所以整个B样条它的曲线就是光滑和连续的。



对,大概就是这样。如果你们对这个话题感兴趣的话,可以去看我们的这期视频。今天确实时间有限。


为了研究各种各样的问题,我们除了看论文、专业的书籍以外,还看了很多有价值的材料。比如国家标准。这个是监狱建设标准,都是公开的文件。



监狱建设标准里有一些很有趣的数据。中国的监狱分为三个等级:低戒备、中戒备和高戒备。


内容比较反常识的是这个。越高戒备的犯人往往越危险,但越危险的犯人住得越好。高戒备监狱的犯人人均居住面积是9平米多,中戒备只有4平米多,这是为什么呢?为了防止犯人串通。


中戒备监狱的犯人是可以20人一间的,但高戒备监狱的犯人是8人一间。所以人均面积就变大了。


除了这个,还有很多有趣的国家标准。比如自动柜员机通用规范,其实就是ATM机。



在这个文件里可以看到我们很关心的一个问题,ATM机到底是不是很容易被打开?怎样暴力地拆开一个ATM机?这个文件后面有一个实验,就是抗破坏实验,要求两个人拿着电钻或者锤子,在规定的时间内把ATM机打开。



这个文件详细介绍了九种打开ATM机的方法,有切断锁舌或者打孔,但更有意思的地方是它的限制是非常非常多的。比如说时间 ,你不能发出很大声音,你带的不能是那种很复杂很专业的设备。


我们可以推测出,打开ATM机其实不难,真正难的问题是把ATM机打开之后怎么走。


除了国家标准,我们还看到一些很有意思的政府文件。这是北京市公安局官网看到的《北京市大型社会活动安全检查办法》。



你在参加各种活动的时候都会有安检。北京有两类安检等级,1000人到5000人之间的活动是二类安检,5000人以上是一类安检。


当你想办一场1000人以上的活动,需要向公安局申请,租赁安检仪器,按1%的比例雇安保人员。包括每个安检的作业点需要多少人,都会详细地公布在这个文件里。


我们还可以看到北京市城市管理委员会的预算,也会在官网公布。



表格里我们可以很清晰地看到2018年他们是怎么花掉了60个亿的,比如说智能厕所的研究,或者北京环卫车辆外面的设计。


还有一些八卦数据。我们可以看到北京城管用在微信托管运营上的钱就花了60多万。



更有意思的是电费,北京市一年路灯的电费花掉了1.6亿,2016年北京大概有30万个路灯。



所以平均一下我们可以知道我们在北京市看到的每一个路灯它们每年的电费是500块钱,这都是比较有意思的数据。


除了政府的文件,我们还可以看到上市公司的财报。可能大家没有听说过这家公司,叫中国民航网络信息股份有限公司,但是你买的每一张机票这家公司都会赚到钱。



因为这家公司给所有的中国的航空公司提供了一个系统,叫黑屏系统。你每次买机票的时候,都需要这个黑屏系统来帮你出票。所以2018年这家公司通过这套系统卖出了6.4亿个座位,赚了40多亿人民币,你每买一张机票都付给这家公司6.5元。


我们还可以看到挖金矿到底有多赚钱,这个是紫金矿业的财报。它们在全球拥有6座金矿,2018年他们挖了30多吨黄金,然后赚了90多亿。



但是其实成本也非常高,因为它挖金矿的成本就是60多亿,所以算下来平均每挖1克黄金的成本就要290多块钱。如果金价跌破了这一条线,比如2015年金价跌破这一条线很多金矿的公司就倒闭了。


如果你对炸药感兴趣,你也可以看到一些和炸药有关的财报。比如说这家公司,很有意思,它的名字叫国泰民爆集团,非常直接。



它们是一个专门做炸药的公司,通过这个公司的财报你就会知道其实炸药挺便宜的。你可以看到一些具体的数据,算一下就知道,大概0.28元你就可以买到一斤炸药,2.6元就可以买到一根雷管。这是财报里面我们可以看到一些有趣的数据。


除了财报,我们也可以看到专利文件,我们可以看到一个具体的事物它们是怎么样工作的。


比如说吸引压送罐式汽车,就是抽粪车。我们中国很多大便是放在化粪池里的,每隔几个月环卫就需要派抽粪车去化粪池里面把结块的粪便搅匀,再把那个大便给抽出来。



这个专利我们可以看到抽粪车的工作逻辑。因为它前面有一个真空泵,你把抽粪管插到粪液当中,然后真空泵把粪罐里面的空气抽走,这样压力就会把粪液压到抽粪车里来。


还有一个比较有趣的专利就是这个,灰火化炉发明专利


其实火化一个遗体是一件挺不容易的事情,因为需要考虑到环保,你要用很高效的方法把它给烧掉。我们在视频里面根据这个专利做了一个三维模型。



比较有趣的地方在于,火化遗体的时候,后面有一个观察窗,火化师可以通过观察窗来观察遗体的情况。如果遇到一些脂肪比较高的遗体,你还需要调整角度,以免引起火灾。   


 我们做了这么多研究,写出来的很多文字稿是特别没意思的,很多人看我们的文字稿看不懂,完全没有意思。那为什么我们可以支持自己去做这样硬的内容?因为我们的可视化很棒,一些很无聊的文字稿被我们做成视频以后,不仅你能看懂,而且很酷。   


举一个例子,路灯。


路灯大家以为很简单,把灯泡安在一个架子上面就可以了,其实完全不是。你从很远的地方向路灯走过来,你离路灯的距离是由远到近再到远,如果路灯的灯泡是均匀发光的,那会遇到一个什么问题呢?


你离路灯比较远的时候光线比较暗,站在路灯下面光线就特别强,你会有忽明忽暗的感觉。这是有问题的。所以我们需要把路灯发出来的光,设计成不管人离路灯远还是近感受到的光差不多,这才是一个好的路灯。


为了实现这一点,我们需要设计路灯的一个坐标体系,这个叫做Cγ平面。Cγ平面是专门用来评价照明的一个体系,也有Aγ和Bγ,Cγ是专门评价路灯的。


 Cγ坐标系是什么呢?把路灯做垂线到地面,横着拉出一个面,这个面转180度就成了很多个面,每个面都有一个角度,这叫C平面。每个C平面上都有一个γ角,每个γ角上面会有一个光强值,这个光强值就可以用来计算路灯在各个角度发出来的光。


是不是很无聊?被我说出来以后完全没有人想听,没有人关心这个是怎么回事。但是它被我们做成视频以后就不一样了。


得益于今天视效技术的发展,我们可以用很低的成本,去演示这个世界很多事物的运转逻辑。我们做过烟花是怎么样去爆炸的,这是一个三维模型,你可以看到里面有效果药。



显示器上的每一个像素点,它是怎样发光,控制光线的?



这是做钻石的六面顶压机,它是怎样做出逼真的钻石的?



电梯的工作逻辑,怎么样去科学地运转一个电梯?



硬盘、机器硬盘是怎么样去读取数据的?



    还有你家里是怎么装修的?我们根据装修图纸去建立了一个家庭装修的三维模型。



    一个原子弹的内部结构。



我们甚至做了一期说明温州动车相撞事件是怎么样发生的,用三维模型还原了一个这样的场景。


 

实现这些技术的成本其实并不高,因为今天的视效技术已经很成熟了,这也就是我们做视频的价值。如果是写文章或者看图,我们永远没有办法像这样,给观众清晰地呈现出一个事物的逻辑。

     

我们到今天为止大概做了80多期视频,但是对于我们想解释这个世界运转的雄心还是远远不够的。而且有很多很多的公开资料、文件,它们都散落在互联网上,没有被有效地整理在一起,所以我们做了一个新的项目,叫——回形针手册



它是一个人人都可以参与编辑的当代生活百科全书。我们设计了1400个条目,你在生活中看到的一切事情都可以被我们归类到这里。这个条目分成了四级,有一级目录、二级目录、三级目录。



比如你选择农林牧渔业>农业>畜牧业>家畜饲养,就可以看到猪的饲养。里面有很多资料,有猪的种类,猪的分工,猪肉的评价标准。还有很多有趣的条目,人造草坪制造、残疾人坐车制造、海底管道运输、地理遥感信息服务。


其实是这些服务构成了我们的当代生活,但是我们没有什么机会去看到这些东西的存在。


我们希望我们的观众或者更多的朋友可以参与到这个项目中,和我们一块来建设一个真正的当代生活百科全书,这是非常值得去做的、有价值的事情。


到现在为止,回形针手册已经有了四千个注册编辑和一万多次的编辑记录。我们已经完成了八百多个条目的目录修订,也就是针对这个条目的特点去编写专门的目录,我们大概会在两个月后完成所有一千四百多个条目的目录修订。


但这仅仅只是一个开始,要做这样的百科全书是一件非常漫长的事情,我们可能会用五年甚至更长的时间来完成这个项目。



这就是我们今天在做的事情,直面这个技术高度复杂到几乎看不懂的当代生活,并试图向所有人解释这个世界究竟是怎么运转的。


但这其实有点反人性。人类的本能总是倾向于找到一个非常简单的原则来判断是非对错,一个简单的比喻帮我们理解复杂的模型。这或许是因为懒惰,或许是某种自我保护。但事实并不是这样。   对我们普通人来说,这个世界到处都是黑箱,而我们一辈子甚至都不会意识到大多数黑箱的存在。我们的工作,就是打开这些黑箱。  


好,谢谢各位。


    ▼ 感谢你们坚持到了最后,如果还记得前面那个BT种子的事儿,加油。


我们之前觉得它的运作逻辑还挺简单的,其实就是你在下载一个文件块的同时也在上传一个文件块,因为它下载的时候把一个文件分成了很多块,你在下载第13块的时候,他在下载第26块,你们的13块和26块就可以做交换,所以下载的人越多,速度越快。看起来挺简单的。



这个BT种子有一个问题,它需要通过tracker服务器来连接和你共同下载的人。如果tracker服务器被封了,你就没有办法找到和你一起下载的人,这个种子速度就会很慢,甚至你没有办法下载。解决这个问题的方法是什么呢?是磁力链接。


磁力链接是把每个人都作为一个tracker服务器,你去问周围的十个人认不认识那个人,这周围的十个人再去问他们周围的十个人你认不认识那个人。然后一传,十传百,百传百千万,最后你终于可以找到和你一起下载的那个人。



我以为解释到这里也差不多了,但是还不是。


这个方案会造成很多无效的传播,比如我找A,A找B,B找C。C可能又找回了A,A可能又找到B,B可能又找到D,D可能又找回了B,B可能又找到了C。这就很麻烦,很混乱,解决方案是什么呢?


那就要通过距离来计算出我要找到的那个人,我和他之间怎么算。比如说我先找三个人,然后我问这三个人你们谁和那个更近,然后这三个人再找一个人和目标更近,这三个人再找三个人和目标更近。每一次的查找都会离目标更近,最后找到那个目标。这样的查找的效率就会比较高。



但是这个距离是什么呢?这个就很麻烦了,因为这个距离不是空间上的距离,不是IP地址上的距离,它是一种纯逻辑上的距离。


解决这个距离问题的方法叫做DHT,就是分布式哈希表,逻辑距离。假设我的节点是0100,你的节点是1111,那我们的逻辑距离就是1011。



因为它是一个异或算法,如果你不一样的话就输出1,一样的话就输出0,通过这个结果你就可以算出我和那个目标之间的相似程度,相似程度越高距离就越近。


研究到这里就已经很复杂了,它背后涉及到一个很专业的排序算法,甚至后面还有一个这样的二叉树,你需要通过二叉树去查找你和目标之间的距离。



所以我们花了很多时间在研究之前完全没预料到的问题,当然最后我们搞清楚了。

本文来自:一席(ID:yixiclub),作者:吴松磊

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP