欢迎光临散文网 会员登陆 & 注册

道德沦丧!为什么总分第 1 却不是优秀员工?| 《简单统计学》读书笔记

2021-04-10 22:31 作者:曹操读书  | 我要投稿

我部门有一个客服叫飞飞。飞飞是一个聪明伶俐的小姑娘,在客服团队里面,她的绩效总是最好的。

但是有一次,人资找我说,上个月飞飞的绩效大幅下降,认为飞飞状态不稳定。

我很诧异,因为我每个月都会和手底下的小朋友们进行沟通,在我看来飞飞的状态很稳定,绩效也没什么问题。

人资给我看了绩效表,我发现了问题所在。

从总体看,飞飞的绩效确实不是最好的,比第一名的转化率差了很多。

但是,从单项看,飞飞每一项的绩效都超过第一名,为什么呢?

这其实是辛普森悖论:当聚合数据被分解时其中的模式发生逆转的现象

这句话反过来也成立:在分组比较中都占优势的一方,在总评中有时反而是失势的一方

《简单统计学》里面说,产生辛普森悖论的原因,是存在混杂因素:

混杂因素常常出现在使用观测性数据的研究中,因为人们无法通过现实的方法使这些因素维持恒定。

在飞飞的案例中,混杂因素就是不同沟通类型的数量。

一般情况下,电话和在线沟通工具的转化率相差很大,电话转化率高,IM转化率低。

虽然飞飞的各项转化率都超过第一名,但是因为上个月接入了太多的IM咨询,拉低了整体的转化率。

而IM咨询太多的原因,是我上个月对投放渠道和策略进行了调整,然后给飞飞分配了更多的IM咨询。

所以,即使整体的转化率没那么高,飞飞依旧是我最好的客服。

对于数据的统计分析,辛普森悖论是个常见的现象。《简单统计学》里面举了几个有趣的例子:

1. 阿拉斯加航空公司在五个机场的准点记录都超过竞争对手,但总体准点记录却不如竞争对手,为什么呢?

2. 瑞典各个年龄段的女性死亡率都要低于哥斯达黎加,但瑞典女性总体死亡率却高于哥斯达黎加,为什么呢?

3. 一种手术对于小型和大型肾结石的治疗成功率都高于另一种手术,但总体成功率却更低,为什么呢 ?

因为这些例子里面,都有某种混杂因素对聚合数据产生了影响,导致结论反转。

如果你对这些例子的原因感兴趣,可以看下《简单统计学》这本书。

辛普森悖论的这种结论反转的特性,特别容易误导人,比如开头的飞飞案例。

当然,你也可以利用这种反转特性去误导别人。

杰拉尔德·福特担任美国总统期间,推行减税政策,各个收入群体的税率都是下降的。

但是从整体看,税率却是提高的。

因为缴税的主力是高收入人群,但他们的税率降低的很少,而且在1978年,高收入人群的税收占比大幅提高了,最终拉高了整体的税率。


如果你打算竞选下一期的美国总统,或许就可以拿着整体税率提高的数据,去打击福特,说他是表里不一的骗子。既然辛普森悖论这么容易误导人,我们该怎么避免辛普森悖论呢?一个比较有效的方法,是对数据进行合理的细分。关注细分数据,而不是聚合数据。

很多时候整体聚合的数据并没有太多的应用价值。

比如客服的转化率、产品的续费率、用户的留存率、广告的点击率等等。

一个客服的整体转化率差,并不能说明这个客服的能力不行,把沟通类型细分之后,可能发现是她进行了太多难以转化的沟通。

一个产品的整体留存率不高,未必需要全盘放弃,把设备类型、用户类型进行细分之后,说不定能找到有很高忠诚度的用户。

一个广告的点击率不高,未必是创意、着陆页的原因,把流量细分之后,可能发现是引入了太多的非目标用户。

所以,看到数据之后别着急下结论,先细分一下,说不定会发生结论反转。



—· End ·—
读书,思考,学以致用。

最近读了什么书?有什么想法

把你的想法,以 #读《***》# 的形式留言

和我们一起分享吧

道德沦丧!为什么总分第 1 却不是优秀员工?| 《简单统计学》读书笔记的评论 (共 条)

分享到微博请遵守国家法律