
76
|
第
5
章
总体来说,预测分析是数据驱动型组织的强大武器。
5.2.5
因果分析
你一定听过一句格言:相关关系并非因果关系
7
。如果你收集了一些数据,做了一些探索性
数据分析去寻找变量之间有意义的关系,也许会发现什么。但即使两个变量之间有非常强
的相关性,也不意味着二者存在因果关系。(例如高密度脂蛋白胆固醇与心脏病发病率呈
负相关,这种“好的”胆固醇越多越好;然而,高密度脂蛋白含量更高的药物并不会降低
心脏病的发病率。为什么呢?因为高密度脂蛋白是健康心脏的副产品,而非原因。)因此,
这样的事后分析局限性较大。如果真的想理解一个系统,并且判断哪些因素会影响局部变
量和指标的话,就需要构建一个因果模型。
与前文中的惊喜活动案例一样,构建因果模型的思想是进行一次或一系列实验,在其中控
制尽可能多的变量,而每次最好只变动一个。因此,你可以做个实验,测试发送给客户的
电子邮件的标题。如果其他因素都不变(电子邮件内容、发送时间等),而标题是控制组
和实验组的唯一区别,而且阅读率显著提高,那么你就有了有力证据,并且能得出结论:
更高的阅读率归功于标题的效果,标题便是原因。
但这个实验略显受限,因为它在证明标题产生影响的同时,未能明确是哪个词或短语让客
户产生了共鸣。因此,需要进行更多实验。举个更加量化的例子:发送邮件的时间会对阅
读率产生很大影响,为此,你可以做一个有很多实验组的控制实验(上午
8
点发
送一批邮
件,上午
9
点发送一批邮件
,上午
10
点发送一批邮件等),并检验电子邮件发送时间是如
何引起阅读率变化的。你还可以预测(插值)在上午 ...