如何透过数据看实体经济?
2023-12-07 09:12

如何透过数据看实体经济?

本文为播客“外部性”相关单集的文字版,来自微信公众号:外部性(ID:wogongxinifacai888),作者:李铁ironlee,原文标题:《播客文字版|45.数据陷阱·2:两把测量实体经济的尺子—PMI与工业高频数据》,头图来自:视觉中国,上篇:《你对于GDP的认识,可能是错的》

文章摘要
本文讲述了如何通过数据来观察实体经济,以及如何用数据分析经济问题。作者强调了大问题要讲数据,小问题要讲逻辑的原则,并介绍了与实体经济相关的数据,包括PMI数据、工业增加值、克强指数和工业企业财务数据。文章最后提到了分析实体经济时要注意库存周期的概念。

• 💡 PMI数据是观察经济周期转折的重要指标,特别要关注新订单指数。

• 💡 工业增加值可作为一个粗略版的月度GDP数据,反映工业部分的经济活动。

• 💡 工业企业收入和利润数据可以观测需求量和价格的变化,利润数据波动较大且受价格影响较大。

这个系列的核心就是通过讲我们常见的财经新闻中提到的经济数据,来告诉大家如何分析经济问题,最重要的是树立一个大问题要定量地聊的原则。


我总说,经济方面,大问题要讲数据,小问题要讲逻辑。为啥大问题要讲数据呢?因为经济这个事,是一个极为复杂的人类行为后果,我们没办法知道每一个人怎么想怎么干的。理论上我们要是知道每一个人脑子里的想法和他所有的行动的话,那我们对经济的分析就是完美的。但问题是,这个做不到,所以我们只能用黑箱的认知方法对付经济问题,这就有点像医学。


医学其实也是一种黑箱式的认知方式,你如果真的能知道每一个人体汇总的原子和分子都在干什么,那你肯定能作出最正确的分析,但问题是这个做不到,太复杂了,也没有获取信息的工具。所以结果就是,医学成了一个黑箱,很多时候不管你里面人体的原理,只要我知道我输入了一个选项,然后病好了,而且没有其它坏的结果,这就OK了,这就叫把病治好了。


我经常觉得经济和投资知识各方面都和医学特别像,为啥经济问题里面大问题要讲数据,不能光讲逻辑,就是因为你各种逻辑横竖经常是都能说得通的,在一个大问题里面盘根错节的因果关系太多了,所以有时你相反的话和逻辑都能解释同一个现象。那谁说的对呢,最后争不出个结果来,所以我们在讨论这些复杂问题时,必须基于那些能用数据去论证的因果关系,否则你就会说啥都有道理。


但是小问题的讨论,一个微观主体的行为,这时候我们可以多讲讲逻辑,因为你小问题本身就是个案问题,我们就是要去探讨它的各种可能性,这种探讨反而能启发我们的思路,所以我总结一下:你看别人论证的时候,大问题讲数据这是靠谱的。


这部分开始,我们讲一下和实体经济有关系的数据,大概分成实体经济数据、金融数据、政府财政数据三个大方向来讨论。这里我要重点推荐一本参考书,就是李奇霖写的《宏观经济数据分析手册》,甚至我能想到讲这个系列就是因为有这本书,某种程度上这个系列就是对这本书里各个主题的一个真人讲解版,所以建议大家都去看一下这本书,这是一本打破了我们与专业机构的信息差的书。


我要先强调一下我们看数据到底是为了什么,你不能看完数据要么就得出一个经济不好了,或者经济过热了(的结论),然后就完了,这种结论对我们其实没有什么帮助。我们看经济数据肯定是为了指导我们未来的实践的,包括未来的各种经济活动的选择。虽然很多时候我们没法判断得这么准确,但至少你也要知道,我们对某些事情是判断不准确的,这个也很重要,这个比你很坚定地认为某个现象一定会发生但最后没发生要重要得多。


比如你坚定地认为房价长期会涨,这种看法还不如你认为房价将来是不可预测的,因为这样你至少不会把所有积蓄全都投在房子这个资产上面。所以我们说,看数据不一定准确预测未来,但是能知道自己有多么无知,也很厉害了,在实践的指导上已经很有帮助了。


接下来进入正题,上一讲我们讲了GDP这个最重要的数据。GDP在所有的经济数据中具有统领性质的作用,这是经济这类数据本身的一大特点,就是有一个统领全局的数。但是你光看GDP这个数据其实看不出个所以然来,GDP更多的是帮我们作为一个锚的作用。它可以帮我们定位我们的经济大概处在哪个阶段,是处在工业化之前,还是快速工业化过程中,还是后工业化状态,这是GDP的主要作用。


我们看经济数据定位了大方向之后,围绕着GDP的长期中枢位置,经济会出现周期性的波动,经济活跃程度会时高时低,那么如何看我们现在处在短期经济周期的位置?以及短期经济周期是不是要发生转折了?这些问题我们没法光靠看GDP数据来判断,还要靠其他一系列更具体的数据。


PMI数据


我们接下来先讲PMI数据。这个数据很重要,也是我们新闻中会高频率听到的一个数据。PMI中文叫采购经理人指数,它是所有数据中发布时间最早的,一般是每个月最后一天公布,这个月还剩一天还没结束就公布了。这个数最早是美国开始统计的,是在1948年,一个叫美国供应管理协会的机构发布的。


我们中国PMI数据有两个,一个是统计局的PMI,还有一个财新PMI,这俩有啥区别呢?统计局的PMI调查的都是大型企业,尤其是国企央企,样本数量也比较多,有3000家。财新PMI只有400家样本,以小型民营企业为主,而且市场上的分析师们认为是以出口占比较高的企业为主。


PMI这个数据我给大家讲讲是咋统计的。主要就是月底的时候给企业发问卷调查,是抽样调查。这个问卷里面一共有十三个问题,每个问题都是三个答案,比如说采购量这个问题,就是问你这个企业这个月采购的比上个月是多还是少了呢?答案里面就是“增加,减少,基本持平”这三个选择。大家看到了吧,非常简单的问卷,所以统计很方便,时效性很高。最后算的方法,就是填“增加”的百分比加上填“持平”的百分比乘以0.5,比如所有的企业都填“持平”,那么100%乘以0.5就是50%,所以我们说50是荣枯线。就是一个很简单的计算方法。


但这里我们要注意,这个问题问的都是相比较上月的情况,所以你说50是荣枯线,指的都是比上个月是不是更好了,所以我们说它是一个环比指标,就是拿这个月和上个月比的结果。所以它其实是帮我们看很短期的一个指标,比如经济处在非常差的状态,然后你看它连续两个月都上升了,这可以说明经济有回暖的迹象。另外一个就是看它的分项数据,它有13个分项数据,我们当然是希望所有的都上升,这是最好的,但是其中最重要的,我们应该看的还是新订单指数,这个是指向需求的,新订单一多,你后面慢慢生产也没关系,经济肯定会好起来。


我们还是要注意一下,它是个月度环比的数据,这就决定了它不是什么时候都有参考价值。因为经济活动不可能无限上升,你在上升期或者说是比较好的经济状态时,你就算中间有几个月没超过50这也说明不了太大的问题,它可能是一个维持某个状态,或者说横盘的数据特征。


所以我们说PMI这个东西,它在极端情况下的指导意义比较强,比如经济特别差,然后你看连续两个月上升,而且新订单也是上升的,这个时候我们可以说有很大可能经济要转好了。至少两个月,一个月时间太短,我们习惯上看的时间周期还是至少连续两个月。相反,在经济特别过热的时候连续两个月以上大幅度下降PMI,这个时候也可能是经济见顶了。所以我们要在周期走到比较极端的时候重点观察这个数据。


另外,我们看数据希望看到的是连续两个月的数越来越大,比如说这个月是52,上个月是51,这样比较好,因为这说明我们这个月不仅比上个月好,而且是在加速的,这是在底部回暖的一个好的兆头。如果你倒过来这个月51,上个月52,虽然都在50以上,但是说明这个月觉得更差的人更多了一点,这个速度是降低的,是边际变差的,所以我们关注的时候不仅要关注是否在50以上,还要关注两个月之间的变化。


PMI我们一般看的是制造业PMI,还有一个服务业PMI,这两个数大部分时候是同涨同跌的,我们大部分时候更关注制造业的情况,因为制造业的产品涵盖了人们大部分终端需求。


最后我们要注意一下,这个指标是有季节性特征的,虽然统计局有做季节性调整,但调的还不足以完全消除这个季节性。我们要注意一个技巧,就是你看数要看一下同比,比如你今年看3月份PMI是50,但是你看往年的PMI都是51以上,这是因为春节导致的低基数效应,所以3月份大概数据会比较好,但如果你现在看3月份居然只有50,那么实际情况可能就要更差了。


工业增加值


接下来我们讲一下工业增加值这个数据。工业增加值是啥意思呢?就是指GDP里的工业部分。GDP还记得我们在第一讲中说过,它翻译成“国内生产总值”其实是不合理的,是有误导性的,应该翻译成“国内生产增加值”才比较准确。总产值这个词是指不剔除原材料成本的,从财务会计上更接近企业收入数据,增加值这个词是指剔除原材料成本的,从财务会计上更接近企业的毛利这个数,这两个概念我们这里再回归一下。GDP准确地说是国内生产增加值,那么工业增加值这个词的意思其实就是指GDP里的工业部分了。


那么工业是指什么业呢?大家看统计局的新闻里面会公布GDP一二三产业的占比,我们统计GDP时是把各类企业分成20个大行业来统计的,这20个大行业里农业对应第一产业,采矿业,制造业,电力、燃气、水供应,建筑业,这四个行业对应第二产业,剩下的15个行业对应的就是第三产业。工业增加值里的工业指的是采矿业,制造业,电力、燃气、水供应三个行业,也就是第二产业里面剔除掉建筑业,就是剔除掉那些建筑承包商、包工队的增加值。


这三个行业我查了一下,这几年占GDP的比例都是在30%左右,其中尤其是制造业占了GDP的25%以上,多的时候占到30%,可以说是一家独大,远超其他所有行业,这就是为什么我们说国民经济中制造业这么重要,这一个制造业涵盖了三分之一的GDP,剩下19个行业没有一家是占GDP比例超过10%的,包括房地产。


工业增加值这个数,有几个要注意的点。第一个是我们主要关注月度数据,这个时效性比较高,如果跟GDP一样一年公布一次那参考作用就不大了。但是月度数据它就没法统计得像年度那么精准,主要是,第一,只统计规模以上企业,也就是年收入2000万以上企业。第二,月度数据只公布增速,不公布绝对值。第三,这个月度增速已经是剔除了通胀影响后的实际变量了。


还有第四个,就是我们国家有春节现象,所以会导致1、2月的同比增速经常出现巨大波动,去年1月是春假,今年2月是春假,那么你就会发现今年1月份的数据特别高,工业增加值数据每年到了1、2月曲线都会有个巨大波动,所以这个要注意,这也是为什么我们看新闻经常看到的是1~2月的累计增速,而不是单月增速,因为这样看起来更合理一些。


具体来说,如何看工业增加值数据呢?这里面我们还是强调制造业在现阶段我们国家的经济结构中,它是嵌入到我们所有经济活动当中的。制造业虽然叫制造业,但是里面有无数个与日常生活有关的行业,你吃包零食,那里面的增加值就有食品制造业的,你买房子,那和买房有关的这个链条上有家具制造业、电器制造业、建筑材料制造业,你衣食住行所有的需求都是被制造业嵌入的。所以我们说制造业深入到经济活动中的毛细血管,它和服务业也会相互促进,所以它总量上占GDP30%,结构上又有无处不在的特点,所以我们可以把工业增加值基本看成是一个粗糙版的月度GDP数据。这是我对它的一个定位。


GDP是一个季度发布一次,那看起来太慢了,但是工业增加值一个月发布一次,这样相当于是对GDP做了一个粗略一点的替代,如果这三个月连续上升,那我们就大概当成GDP也是在上升阶段的。而且这几年以来工业增加值不仅是趋势上可以辅助我们判断GDP走势,另一个就是从增速的数字上也和GDP有所趋同,以前大部分时间是高于GDP增速的,可能GDP增长8%,工业增加值是增长12%、13%,但是现在来看的话也基本上是在5%~6%左右这个水平了,所以现阶段我们对它的定位就是一个可以按月度观测的小型GDP增速。


克强指数


其实关于辅助GDP判断的指标还有一个很有名的,大家可能都听说过,就是所谓的“克强指数”。这个是《经济学人》杂志创造发明的概念,它被发明的时候作用其实有点类似工业增加值,就是为了高频辅助判断GDP。这个指标具体是混合了三种指标,一个是工业用电量,占40%权重,一个是中长期贷款余额增速,占35%权重,还有一个是铁路货运量增速,占25%权重。大家可以看出来这是一个混合了实体经济数据和金融数据的指标。


这个指标从计算结果来看,在2016年之前和工业增加值同比增速几乎是完美契合,同升同降,数字上也差的不多。但是有个问题,就是到了2016年之后这个指标一直维持高位,但是工业增加值数字下来了。而且不仅仅是克强指数,其它一系列和中上游有关的高频指标,比如我们以前常听到的六大发电集团耗煤量,这个和用电有关;大秦铁路货运量,就是大同和秦皇岛之间的货运专线,70%是运煤,所以其实也反映发电耗煤的情况;反映钢铁行业的高炉开工率;反映汽车行业的钢胎开工率,就是做轮胎的开工率;反映化工行业的PTA产业链链负荷率。这些都是比较常见的和中上游有关的工业高频指标,这些指标因为频率比月度的(指标)还高,所以一般被用来作为更快更有时效性的数据。


但是不管是克强指数还是其它这些高频工业数据,都有一个神奇的现象,就是2016年之前与工业增加值相关性很好,但2016年之后这些数据大部分是上升的,工业增加值却一直没怎么涨,出现背离了。那具体是什么原因呢,其实现在大家都没有特别公认的解释,解释方法很多,但是各种解释方法都和2016年的供给侧改革多少有那么点关系,所以我们大概能判断是和这个有关系,但具体是什么机理现在都还不太清楚。


另外,我们现在对这些中上游高频指标的关注也相对越来越少了,主要是现在经济转型,淘汰低效产能,还有环保,这些都导致未来可能这些中上游行业对国民经济的影响越来越小了。每一个行业其实都是这样,当你产能维持社会需求平衡之后,慢慢变成传统产业,逐渐就会在国民经济中占比变低,就像农业那样。产业升级就意味着我们测量经济的这个工具、尺子,也要不断发生变化,这也是经济现象比较独特的地方。


工业企业财务数据


和工业有关的数据,我们最后讲一下工业企业财务数据,这里面比较重要的是工业企业收入数据、工业企业利润数据,这两个数据大家在新闻上应该也经常能看到。这个收入不用说,应该挺好理解的,利润数据指的是利润总额,不是净利润,这个差异就是净利润是扣除了所得税的,了解会计的应该知道。


我们先看工业企业营业收入数据,这个数据不用说,肯定是反映企业业务最直接的数据,其中还可以拆成两部分,一个是卖的东西的数量,一个是卖的价格,就是所谓“量价”。其实一提收入我们都是要分析量价的,收入和量价分析是分不开的,但是统计局没公布具体的量价数据,这咋办呢?这就需要我们用代理变量去观测了。


首先说“量”这个数,其实就是用我们之前说的工业增加值那个数,我们说工业增加值的时候是不是说已经剔除通胀影响,剔除价格影响了,比如某个企业工业增加值增加了5%,意思就是说这个企业多生产了5%数量的产品,比如它是做手机的,去年生产100台,今年工业增加值是5%,那意思就是今年生产了105台。


但是工业增加值是指的生产数量,营业收入是卖出去的(收入),生产了不一定都卖出去,这是有一定偏差的,所以我们说营业收入的量这个数只是接近工业增加值,不是一模一样,是一个代理变量,借它近似地去观测收入中量的变化,这一点要注意。


营业收入中的价格,一般我们利用PPI(生产者物价指数)数据去代理观测。PPI大家知道,是衡量工业的价格变化的,所以结合这些我们就知道这个收入的量价分析,其实就是用工业增加值和PPI两个变量作为代理变量,去近似地看收入中的量和价的变化。所以你在读工业企业营业收入的新闻的时候,经常会看到它紧接着就开始分析工业增加值和PPI这两个数,分析这两个数就是在近似地观测收入中的量价变化。然后看看工业企业收入变化到底是具体什么原因导致的,是价格涨了,比如说2016年供给侧改革的时候,收入增长就是价格大幅增长的价格。但是如果你看PPI没什么变化,但收入和工业增加值大幅度增长了,那你就知道是企业生产的、卖的东西多了导致的。


这个是收入,我们看工业企业利润,利润无非就是收入减去成本。这个利润数有一个特点,就是它的弹性特别大,因为工业企业的平均利润率这么多年以来基本维持在5%~6%左右,这么低的利润率,就说明了收入或者成本变动一点,这个利润的绝对数额就会变动得特别大。所以我们看利润数据的时候经常会看到利润的同比增速波动特别大,有的时候能到15%以上,但低的时候能到-10%,比收入的波动要大得多,这是利润数据的特点。


所以大家要注意,不要一看到新闻里说工业企业利润同比下降8%,你看别的宏观数据很少出现-8%这种程度的负增长,就觉得特别不可思议。是不是经济特别差了?其实不是,因为这个利润数本来特点就是波动大,正常经济下行周期到-8%都是有可能的。疫情的时候直接-40%多了。所以要注意,很多自媒体写赚流量的文章,就喜欢利用这种波动大的数据来唬人。


工业企业利润和收入这两个数,最好的肯定是同升同降,收入上升的原因也最好是量价齐升,这是最正常的一个经济上升周期,这就是需求拉升的效果。当然反过来也是一个标准的经济下行周期。但是如果我们中间发现一些不是同升同降的情况的话,就要注意是不是有什么特别的事发生了,近年来比较特别大的就是2016年供给侧改革,是大幅度影响了价格,尤其是上游的价格,但量没什么变化。另一次就是疫情期间,是量大幅下降,但价格没什么变化,那肯定啊,你疫情在家里想降价卖都卖不了,价格肯定没什么大变化。


我们还要注意一个问题,就是利润率对于价格是更敏感的,对于量的变化没有价格敏感。这是一个财务分析中的基本规律,如果有接触过本量利分析的就知道,价格上涨1%和数量上涨1%对利润的影响程度是不一样的,价格的影响要大得多。


结语


到这里我们就把两个比较重要的、比较常见的,测度实体经济的数据讲完了。我们总结一下,首先是PMI,这是个月度环比指标,比较重要的作用是在经济周期走到比较极端、有可能转折的情况时,看这个数据是不是能连续两个月以上有较大幅度的变化,这就说明可能周期拐点已经到了。然后,PMI的分项数据里面最重要的是新订单数据,当然其他数据也很重要,很多时候都是可以做间接观测某些经济现象的代理变量的,比如可以从就业分项数据来验证统计局公布的那个就业率数据靠不靠谱等等。


第二个是工业企业数据,其中工业增加值代表了GDP的三分之一,相当于一个月度小型GDP数据。工业企业收入和利润这两个数也很重要,收入反映的是需求好不好,具体还可以再拆分成卖出去的量多不多,和卖的东西价格涨没涨。量价的分析我们都是用代理变量来分析的,工业增加是数量的代理变量,PPI是价格的代理变量。最后这个工业企业利润数据它的波动、弹性特别大,而且受价格波动的影响比受数量的影响大得多。


最后我再提醒一下,一般分析实体经济的时候,会讲一个叫库存周期的东西,我们经常会听到补库存、去库存之类的说法。


本文来自微信公众号:外部性(ID:wogongxinifacai888),作者:李铁ironlee

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP