Skip to Content
数据科学实战手册
book

数据科学实战手册

by Posts & Telecom Press, Tony Ojeda, Sean Patrick Murphy, Bengfort Benjamin
May 2024
Intermediate to advanced
357 pages
5h 3m
Chinese
Packt Publishing
Content preview from 数据科学实战手册

第5章 就业数据的可视化探索(R)

  • 这一章包含以下内容。
  • 分析前的准备
  • 将就业数据导入R
  • 就业数据探究
  • 获取和合并添加附加数据
  • 添加地理信息
  • 获取州和县级水平的薪资和就业信息
  • 可视化薪资的地理分布特性
  • 探究各行业工作的地理分布情况
  • 绘制地理空间的时间序列地图
  • 函数性能测试和比较

本章的项目将带你探索美国劳工统计局提供的美国就业数据。作为一个联邦机构,美国劳工统计局主要负责度量美国经济环境下劳工市场的活动、工作条件以及价格等。其主要职能包含对重要经济信息的收集、分析和传播等,以此来为公共和私人的决策提供支持。 在本项目中,我们将使用2012年对就业与工资的季度普查数据,该数据集包含不同区域和行业的年度就业与工资数据。你可以通过http://www.bls.gov/cew/data/files/2012/csv/2012_annual_singlefile.zip(下载逗号分隔的压缩文件)。其中文件"2012.annual.singlefile.csv"包含了完整的数据集,总计约350万条记录,每条记录有15列。

就业与工资季度普查通过企业税务征收系统,按照季度将雇主们报告的与就业和工资相关的数据进行收集。除去个体经营者、未纳入企业系统的自由职业者、无收入的家庭成员、一些农民和佣人等,该普查涵盖了美国大约98%的工作职位。该数据从县、都市、州和国家等不同的层级,对不同行业的数据进行了汇总。作为一个政府项目,就业与工资季度普查从20世纪30年代开始实施,当前的格式是从2003年开始使用的。由于该数据是企业根据法律向美国联邦和地方政府所做的汇报,因此应该是没有报告偏差的。总体来说,该数据集从地域和行业的角度给出了一个国家就业与工资水平的概览。

在本章中,一个需要注意的问题是,我们用到的2012年美国工资与就业在地域上的分布数据是在写作本书时所能获取的最新的一年完整的数据。我们不仅会从州和国家的角度进行分析,而且会从几个行业着手进行深入研究。同时,我们也会分析2003年至2012年间,工资水平在区域分布上随着时间推移所发生的变化,以及这些变化反映出的美国就业形势的改变。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Python编程入门与实战

Python编程入门与实战

Posts & Telecom Press, Fabrizio Romano
软件开发实践:项目驱动式的Java开发指南

软件开发实践:项目驱动式的Java开发指南

Raoul-Gabriel Urma, Richard Warburton
编写整洁的Python代码(第2版)

编写整洁的Python代码(第2版)

Posts & Telecom Press, Mariano Anaya

Publisher Resources

ISBN: 9781836206774