第5章 就业数据的可视化探索(R)
- 这一章包含以下内容。
- 分析前的准备
- 将就业数据导入R
- 就业数据探究
- 获取和合并添加附加数据
- 添加地理信息
- 获取州和县级水平的薪资和就业信息
- 可视化薪资的地理分布特性
- 探究各行业工作的地理分布情况
- 绘制地理空间的时间序列地图
- 函数性能测试和比较
简介
本章的项目将带你探索美国劳工统计局提供的美国就业数据。作为一个联邦机构,美国劳工统计局主要负责度量美国经济环境下劳工市场的活动、工作条件以及价格等。其主要职能包含对重要经济信息的收集、分析和传播等,以此来为公共和私人的决策提供支持。 在本项目中,我们将使用2012年对就业与工资的季度普查数据,该数据集包含不同区域和行业的年度就业与工资数据。你可以通过http://www.bls.gov/cew/data/files/2012/csv/2012_annual_singlefile.zip(下载逗号分隔的压缩文件)。其中文件"2012.annual.singlefile.csv"包含了完整的数据集,总计约350万条记录,每条记录有15列。
就业与工资季度普查通过企业税务征收系统,按照季度将雇主们报告的与就业和工资相关的数据进行收集。除去个体经营者、未纳入企业系统的自由职业者、无收入的家庭成员、一些农民和佣人等,该普查涵盖了美国大约98%的工作职位。该数据从县、都市、州和国家等不同的层级,对不同行业的数据进行了汇总。作为一个政府项目,就业与工资季度普查从20世纪30年代开始实施,当前的格式是从2003年开始使用的。由于该数据是企业根据法律向美国联邦和地方政府所做的汇报,因此应该是没有报告偏差的。总体来说,该数据集从地域和行业的角度给出了一个国家就业与工资水平的概览。
在本章中,一个需要注意的问题是,我们用到的2012年美国工资与就业在地域上的分布数据是在写作本书时所能获取的最新的一年完整的数据。我们不仅会从州和国家的角度进行分析,而且会从几个行业着手进行深入研究。同时,我们也会分析2003年至2012年间,工资水平在区域分布上随着时间推移所发生的变化,以及这些变化反映出的美国就业形势的改变。 ...
Get 数据科学实战手册 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.