
数据与抽样分布
|
55
2.4.1
重抽样与
Bootstrap
方法
从上面的描述可知,有时候
重抽样
和
Bootstrap
这两个词是同义词。在更多情况下,重抽
样还包括置换过程(参见
3.3.1
节),在这个过程中多个样本被组合起来
,而且抽样过程
可能是以无放回方式完成的。
Bootstrap
总是意味着以有放回方式从一个观测数据集中进
行抽样。
本节要点
• Bootstrap
(从一个数据集中以有放回方式进行抽样)是估计样本统计量变异性的一
种强大的工具。
• Bootstrap
可以以同样的方式应用于各种场景,不用特别考虑抽样分布的数学近似。
• Bootstrap
还可以在不建立数学近似的情况下估计统计量的抽样分布。
•
在用于预测模型时,将多个
Bootstrap
样本预测聚合起来(装袋)的效果要优于使
用单个模型。
2.4.2
扩展阅读
• Bradley Efron
和
Robert Tibshirani
的著作
An Introduction to the Bootstrap
是第一本介绍
Bootstrap
方法的图书,现在仍然非常受欢迎。
• 2003
年
5
月的
Statistical Science
(第
18
卷第
2
期)对
Bootstrap
方法进行了回顾,讨论
了
Julian Simon
在
1969
年首次发布的
Bootstrap
方法
(对于其他先行者的贡献,见
Peter
Hall
的“
A Short Prehistory of the Bootstrap
”一文)
。
•
在
Gareth James
、
Daniela Witten
、
T
revor Hastie ...