人们一拿到数据,总是想尽早地开始分析,而且很多时候会想方设法把手上的数据都拿去用。这里面有个陷阱。有些数据是先看了会更好,有些数据则是先不看会更好。为了不在数据的森林里迷路,应该注意些什么呢?

你查询销售一科至三科去年和今年的业绩,发现销售一科、二科去年和今年的销售额都是1000万日元。另一方面,只有销售三科的销售额从去年的1000万日元大幅提升到今年的1500万日元。

为了探究大幅提升的原因,你尝试进一步收集信息,以下是收集到的三个信息。

首先是每人每月的平均加班时间。表1表示销售一科至三科的平均加班时间。比较后发现,只有销售三科比去年有所增加,可以推测销售三科全科齐心协力,加班努力推进业务,最终达成了今年的业绩。

其次是研讨会的参加人数。观察表2发现,只有三科的参加人数有所增加。因此,也可以推断是研讨会发挥了作用,对业绩提升有所帮助。

最后是新增订单的和既有订单的销售额明细。只有三科成功地提升了新增订单的销售额。因此,也可以认为三科销售额增加的原因是新增订单的增长。

现在我们稍作思考。

经过信息整理,关于三科业绩增长的原因,有“加班增加了”“参加了研讨会”“新增订单增加了”三个参考信息。实际上,“新增订单的增加”跟其他两个信息的意义是不一样的。

加班和研讨会有可能是销售额增长的原因;但新增订单的增加是一个结果,这是为了了解销售额增加的情况,进行分解后显现出来的情况,并不是原因。

与此相比,加班是指加班时间,通过销售额的分解看不出来;同样,研讨会是指研讨会的参加人员,也不是通过分解销售额能看出来的数字。梳理的结果如下图所示。

如上述梳理的结果所示,加班时间和参加研讨会的数字不是“销售额”。另一方面,新增订单、既有订单是从销售额中分解出来的数字。如果只是把“数字”并排起来比较,人们往往会在没有识别其差异的情况下,理解为“相同性质的数字”,就开始进行分析。

看到数字以后,首先要判断它是结果型的数字还是原因型的数字。在此基础上,先根据“结果型的数字”充分理解正在发生什么情况,其后再分析“原因型的数字”。数字本身不会告诉我们它属于哪一种性质,所以要多加留意。

关键点1. 明确是结果型数字还是原因型数字

关键点2. 首先分析结果型数字,确认正在发生的情况

关键点3. 在此基础上思考原因型数字与结果型数字的关联性

我们用刚才的例子来进行确认。

1. 明确是结果型数字还是原因型数字

表1是加班时间,这是无法从销售额中分解出来的原因型数字。表2是研讨会的参加人数,也是无法从销售额中分解出来的原因型数字。表3把销售额划分为新增订单、既有订单的数据,是从销售额中分解出来的结果型数字。

2. 首先分析结果型数字,确认正在发生的情况

我们已经知道表1和表2是原因型数字。所以接下来,要利用表3来确认正在发生的情况。从表3得知只有三科的新增订单有所增加。

3. 在此基础上思考原因型数字与结果型数字的关联性

最后,我们试想一下新增订单增加的原因有没有可能是加班的增加和参加了研讨会。

正确的做法应该是再进一步详细调查新增订单的增长情况,如果新增订单的增加不是因为偶然增加了一个大客户的订单,而是因为增加了10家新客户,就可以推测加班和参加研讨会可能起了作用。

如果单纯就收集到的数字来解释,很可能会像上述左图那样理解,希望大家能够区分清楚原因型和结果型的数据,像上述右图一样把握清楚事实情况。

练习题

你负责人事工作,随着事业规模的扩大,今年需要比去年招聘更多的应届大学生。经过努力,对比去年招聘50人的实绩,今年得以大幅增加至100人。在调查为何能够翻倍时,你收集到了三个数据,分别是每人面试的次数、广告的次数和内定率。那么,应该怎样逐步去思考原因呢?(为了使这个例子单纯一些,我们假设内定者已全员入职)

解答

首先,明确这些数据是结果型数字还是原因型数字。

表1是面试的次数,表2是广告的次数,这些都是跟内定者人数不同的数字。对内定者人数进行分解后无法得出这些数字,因此它们是原因型数字。

表3的内定率无法通过分解内定者人数得出,但是与内定者人数相关。应聘者人数×内定率=内定者人数,基于这一点考虑,可以认为这是结果型数字。

接下来,首先观察结果型数字,确认发生了什么情况。

如上述公式应聘者人数×内定率=内定者人数,可以从内定率反向计算出应聘者人数。

去年有50人合格,内定率是20%,所以相当于有250人应聘;今年有100名内定者,内定率是40%,所以相当于同样有250人应聘。于是,通过表3可以推导出以下的信息。

由此得知,去年与今年的应聘者人数相同,而内定者人数有所增加。

最后,我们来思考原因型数字和结果型数字的关联性。

首先,看原因型数字。面试次数减少与内定者人数增加是否存在因果关系呢?有可能因为面试通过的难度降低了,所以有较多的人通过筛选留了下来。这样看来,很有必要去思考面试基准等要素的设计是否恰当。

其次,看看广告的次数是否对内定者人数的增加有促进作用。因为应聘者人数没有增加,所以可以认为增加广告次数以后,并不能促进应聘者人数的增加。

另一方面,内定者人数的增加也可能是因为前来应聘的对象人群的素质有所提升。有一种可能性就是,本次通过增加广告次数,成功地打动了平时很难打动的对象人群。

哪一种才是实际发生的情况,需要进一步详细调查才知道。而这里要强调的重点是,要充分把握并思考收集到的数字之间存在什么关联性。

关于内定者人数的增加,在收集到面试次数、广告次数、内定率的数据以后,不要急着马上去思考它们产生了什么影响,重要的是先区分、整理清楚原因型数字和结果型数字,看清结果和原因。

STEP UP!

最初得到的数据如果是“结果”,就可以从分解结果数据开始入手,因为这样的做法更有利于理解正在发生的具体情况;而如果能够更具体地理解正在发生的情况,就可以锁定发生原因,进行具体化分析。

同时,请记住去寻找能够支持这个原因的数据。在这个情况下,因为是有目的地去找数据,所以能自然而然地观察从结果至原因的数据。

另一方面,有时候结果的数字和支撑原因的依据数字可能会混在一起。如果发生这种情况,首先要区分是结果型的还是原因型的数字。要认真观察结果型数字,在此基础上,尝试观察原因型数字。此外,初期获取的信息有可能只是当时偶然发现的,所以也要考虑是否需要增加其他必要的数据。

网络上也充斥着各种各样的数字,大家解读数字时要有意识地思考哪些是结果型数字、哪些是原因型数字,以及它们之间有怎样的关联性。

小结

√ 要意识到结果型和原因型两种数字

√ 首先应该观察的是结果型数字

√ 对结果型数字的分解也不要忽视

√ 在此基础上观察原因型数字并进行解释

√ 要理解最初的数据可能只是偶然处于那个状态