
统计实验与显著性检验
|
99
3.
记录下四个组中每个组的均值。
4.
记录下四个组均值之间的方差。
5.
重复第
2~4
步多次,比如
1000
次。
重抽样方差超过观测方差的次数的比例是多少?这个比例就是
p
值。
这种置换检验比
3.3.1
节中的检验要复杂一些
。幸运的是,
lmPerm
包中的
aovp
函数可以计
算这种置换检验:
> library(lmPerm)
> summary(aovp(Time ~ Page, data=four_sessions))
[1] "Settings: unique SS "
Component 1 :
Df R Sum Sq R Mean Sq Iter Pr(Prob)
Page 3 831.4 277.13 3104 0.09278 .
Residuals 16 1618.4 101.15
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
由
Pr(Prob)
给出的
p
值是
0.09278
。换句话说,给定同样的黏性,对于四个网页的响应率
来说,仅由随机因素造成的差异与实际观测差异一样大的概率是
9.3%
。传
统上认为不太可
能发生的统计阈值是
5%
,而这个概率高于
5%
,所以我们得出结论
,四个网页之间的差异
应该是由随机因素造成的。
Iter
列给出了置换检验中的迭代次数,其他列对应于传统的
ANOVA
表格,我们将在后面
进行介绍。
在
Python
中,可以使用以下代码计算置换检验。
observed_variance = four_sessions.groupby('Page').mean().var()[0] ...