职场中数据分析师是如何耍流氓的?(二)
2020-07-30 17:41

职场中数据分析师是如何耍流氓的?(二)

本文来自微信公众号:数据化管理(ID:sjhglwx),作者:黄成明,此话题分为上下两篇来论述,本篇为下篇,上篇详见:《不学点防数据忽悠秘籍,如何在职场玩耍(一)》,题图来自:IC Photo


上篇我开始讲 《防被数据忽悠系列》 的内容,围绕数据忽悠常用手段之“指标忽悠”进行了阐述,让大家了解到无论是工作上的数据,或是生活中遇到的数据,若不细心思考求证,都有被忽悠的可能。大家记得要完成每篇文章的思维导图,这样有助于你吸收知识,逐渐形成系统思维。



本篇我们将进入《防被数据忽悠系列》的第二部分,数据忽悠常用手段【2】权重部分, 将重点介绍用权重进行数据忽悠的常见手段。


先来看看什么是权重?权重是一个相对的概念,是针对某一指标而言。某一指标的权重是指该指标在整体评价中的相对重要程度。


权重表示在评价过程中,是被评价对象的不同侧面的重要程度的定量分配,对各评价因子在总体评价中的作用进行区别对待。在很多数据分析场景中,如果没有重点的评价就不算是客观的评价。 


打个比方说, 一件事情, 你给它打100分, 你的老板给它打60分, 如果平均, 则是(100+60)/2=80分。但因为老板说的话分量比你重, 假如老板的权重是2,你是1,这时求平均值就是加权平均了,结果就是(100*1 + 60*2)/(1+2)=73.3分。


得出的73.3分离60分更近,也就是说结果向你的老板那里倾斜了。又假如老板权重是3,你的权重是1,结果就是(100*1+60*3)/(1+3)=70。这就是根据权重的不同进行的平均数的计算,所以得出的结果又叫加权平均数。


总而言之,权重就是要从若干评价指标中分出轻重来。可能你看这个定义,还不是太理解,别着急!以下将从案例中继续讲解:


某公司的销售部有三名员工:张三、李四、王五,他们在2017年度的指标完成情况如下图所示。假设你是公司的HR经理,今天老板找你说:根据下表中的数据,评选出销售部年度表现最突出的员工1名,并给他颁发优秀员工奖!请问你会怎么评选?谁是表现最突出的员工?



销售部各员工 2017年指标完成情况

如果单看1个指标,各员工的排名情况如下:



由上图看出,单独看任意1个指标,3名员工都有各自表现突出的指标,所以没法得出谁的表现最突出的结论。如果简单粗暴地由其中1个指标的排名,评选出优秀员工,公布出去后难以服众。那怎么办呢?


一、平均值法


单独考虑1个指标不行,那我就考虑3个指标嘛!把员工的3指标加起来求和,然后再除以3,分别求出各员工的平均值,即可进行比较排名。



由平均值进行排名后,发现第1名是李四,即可得出结论,李四就是年度优秀员工!


案例偏题了吗?你以为这样就完了吗?可没你想得那么简单,很多公司的HR经理,在这种时候,还要考虑到老板的想法:老板更喜欢哪位员工?张三,李四,还是王五?


这里假设你打听到的结果是:老板更喜欢王五!但王五的平均值才94%,排在第3名!那该怎么办?


二、加权平均值法


这时数据分析耍流氓的大哥——权重,就要登场了!这里一共有3个指标,可以给每个指标设置不同的权重,以突出公司的重点关注方向(应该说是老板重点关注的方向)


先来试一下,假设权重设置为销售完成率40%,利润完成率30%,重点产品完成率30%(隐藏的意思就是老板更看重销售完成率)


然后根据各指标的权重,计算出各自的加权平均值:


张三:92%*40%+98%*30%+93%*30%=94.1% (第2名)

李四:97%*40%+97%*30%+92%*30%=95.5% (第1名)

王五:93%*40%+92%*30%+97%*30%=93.9% (第3名)


可以看到虽然第1名还是李四,但在为指标设定权重后, 第2名与第3名已经发生了变化:王五由原平均值的第3名,变成了第2名!权重的效果虽已初现,但还不是老板想要的结果,接下来再尝试调整不同的权重系数:



王五终于可以排到第1了!此时的权重设置是销售完成率30%,利润完成率20%,重点产品完成率50%


这时你是不是就松了一口气,终于可以输出结论了:


2017年老板最看重重点产品完成率占50%,其次是销售完成率占30%,最后是利润完成率占20%。通过分析2017年的各员工数据,计算得出王五的综合完成率是94.8%,排名第1,所以最终评选出优秀员工是——王五!


大家可以看到,通过设定权重后的加权平均值,与开头计算的平均值相比较,结论可以直接逆转!估计你也会感叹:权重确实是一个非常好的耍流氓手段。


其实权重是一个很好的方法(耍流氓只是冰山一角的应用),我在《数据化管理》第2章写过:寻找零售密码中,就是给每周,每日赋予权重,现已应用在很多的商业分析中,帮助更多的零售企业提高数据分析水平。在新产品的评价体系中,权重也是很重要的方法。


三、如何设定指标的权重?


当对某个对象进行多维度的评估分析时,常常需要给各维度赋予一个权重值。例如超市在对供应商能力进行评估时,一共八项指标,每项指标和权重分别为:销售业绩0.25、商品价格0.21、送货服务0.14、员工素质0.14、品牌影响力0.14、商品可替代性0.04、货款支付周期0.04、信息化0.04等。


各维度的权重值之和为1.0。赋予权重值的方法有如下4种方法:


1. 主观意见法


这是企业或部门负责人根据业务实际发展需要,对各维度主观赋值的一种方法。


2. 历史数据法


这种方法常常用在寻找销售规律的时候。如图所示,我们可以通过2011、2012、2013年每月的销售比重来推测2014年每个月的贡献率,而这个贡献率实际上就是月销售权重值。


 矩阵对比法


一般来说离现在越近的数据越具有参考价值,意味着权重值也应该更大,在上图中2014年权重值为前三年销售比重的平均值,没有体现权重差异性。为了让2014年的规律更有参考价值,我们需要对前三年的贡献率赋予不同的权重值,如图所示。这样计算出来的结果和平均值略有差距。



2011、2012、2013这三年对应的权重值0.17、0.33、0.50体现了离现在越近的历史数据越具有参考价值的意义。这三个权重值是通过矩阵对比的方法计算出来。如图,权重2中的数值即为上图中的权重值。



矩阵对比法的步骤是:


1. 将需要赋予权重的对象按矩阵排列;


2. 将每个对象间两两对比,如果左侧更重要则填1,否则为0。例如2012年的数据肯定比2011年重要,所以①左侧的空格数字为1,2013年比前两年都重要,所以都为1;


3. 计算合计得分,再根据“合计1”占总分的比例算出“权重1”。这个权重遗弃了总得分为0的2011年选项(不是每次对比都会出现得分为0的选项)


4. 如果2011年这个选项一定要有,则可以在“合计1”的基础上分别加1得到“合计2”以及对应的“权重2”。


下图是超市评估供应商的八个维度的权重值计算过程,也是用的矩阵比较法。矩阵比较法适合单人进行分析,权重结果基本上体现个人的意志,是对主观判断的具体量化。如果多人同时对一个对象进行权重评估的话则需要用到专家打分法。



矩阵对比法的升级A:上面介绍的左边比上边重要则是1,但是有时候左边可能比右边重要很多,此时你填的数字则需要加重体现新的权重,例如你认为商品价格比送货服务重要得多,则可以填为3或4以及你认为更准确的值。所以矩阵对比不能死守1。


矩阵对比法的升级B :使用矩阵对比有时不是为了找到具体的权重值,只是为了分出轻重缓急,用用矩阵对比可以找到答案。比如本周你要办10件事情,先办哪件后办哪件可以用矩阵对比来确定;再比如你有3个异性朋友可以转化为男朋友,转化谁?矩阵对比来帮你。


3. 专家打分法


当需要综合多人意见时,专家打分法是比较合适的方法。如图所示,这是电子商务网站的几个关键营运指标的权重化。每位专家手中有100分,专家们根据自己的理解对这7项指标分别打分,然后根据平均得分算出每一项的权重值。



这里的专家不一定是真正意义上的专家,只要是有打分资格的人都可以是专家。所以这种方法的实用性比较广,在需要体现民主集中制的时候就可以派上用途了。


确定指标权重方法有很多,比如还可以用层次分析法来做,这里只是介绍了几种最简单的方法,即使不会统计学的人也可以熟练掌握。其它方法大家可以延伸学习。


本文来自微信公众号:数据化管理(ID:sjhglwx),作者:黄成明

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP