第5章 就业数据可视化探索
本章包含以下主要内容。
- 分析前的准备工作。
- 将就业数据导入R。
- 探索就业数据。
- 获取、合并附加数据。
- 添加地理信息。
- 提取州和县级水平的薪资及就业信息。
- 可视化薪资的地理分布。
- 分行业探索就业机会的地理分布。
- 绘制地理时间序列的动画地图。
- 函数基本性能测试。
5.1 简介
本章的项目带你探索来源于美国政府劳工统计局(BLS)的美国就业数据。作为联邦机构,劳工统计局的职责包括衡量美国经济环境下劳动力市场的活动、工作条件及薪资水平。其主要任务是收集、分析并传播重要的经济信息,为公共和个人决策提供参考。本项目中,我们将使用2012年的季度就业与薪资普查数据(QCEW)进行分析,该数据包含分地区、分行业的年度就业及薪资数据。你可以通过BLS官网下载CSV格式的数据集,其中文件2012.annual.singlefile.csv包含15列大约350万条记录。
我们使用的就业与薪资普查数据由雇主按季度提交到企业税收征管系统,除去个体经营者、未纳入企业管理系统的自由职业者以及一些农场和家政工人,普查数据覆盖了大约98%的美国居民工作岗位,并从县、市区、州和国家层级对不同行业进行了汇总。该政府项目自20世纪30年代开始实行,现行的版本开始于2003年。数据集来源于企业依法向联邦政府及当地政府提交的报告,因此它应该是没有报告偏差的。总体来说,该数据从地域与行业的角度,概述了国家就业及薪资水平。
值得指出的是,本章所使用的是美国2012年薪资水平及就业的地理分布数据,这是截至写作日我们能得到的最新的全年数据。我们将考察州和县级的情况,并深入探讨一些行业。同时,也将考察2003—2012年薪资水平地理分布随时间推移发生的变化,以及这些变化所反映出的美国就业形势的改变。 ...
Get 数据科学实战手册(R+Python)(第2版) now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.