
412
|
第
13
章
你可以用这个数据集做很多事,例如:
·
根据给定名字,对该名字随时间的比例进行可视化。
·
确定某个名字的相对排名。
·
判断各年度最流行的名字,或者流行程度增长或减少最多的名字。
·
分析名字趋势:元音、辅音、长度、总体多样性、拼写变化、首尾字母等。
·
分析外源性趋势:圣经中的名字、名人、人口结构变化等。
利用本书介绍的工具能轻松地完成这些分析工作,我会讲解其中的一些。
在写作本书时,美国社会保障管理局将该数据库按年度制成了多个数据文件,其中给
出了每个性别
/
名字组合的出生总数。读者可以下载原始档案(
http://www.ssa.gov/oact/
babynames/limits.html
)。
如果读者读到此处时,这个页面已经不见了,可以用搜索引擎进行网络查找。下载“国
家数据”文件
names.zip
并将其解压,路径中含有一组文件 ...