May 2025
Intermediate to advanced
578 pages
8h 9m
Chinese
在本书的这一部分,你将学习如何将更多数据导入 R,以及如何将数据转换成有用的形式以供分析。有时,这只是从适当的数据导入包中调用一个函数的问题。但在更复杂的情况下,可能需要对数据进行 Tidy 和转换,才能得到你想要的整洁矩形。
在本书的这一部分,你将学习如何访问以下列方式存储的数据:
在第 20 章中,你将学习如何从 Excel 电子表格和 Google Sheets 中导入数据。
在第 21 章中,你将学习如何将数据从数据库中导出并导入 R(还将学习如何将数据从 R 中导出并导入数据库)。
在第 22 章中,你将学习 Arrow,它是处理内存外数据(尤其是以 parquet 格式存储的数据)的强大工具。
在第 23 章中,你将学习如何处理分层数据,包括以 JSON 格式存储的数据所产生的深嵌套列表。
在第 24 章中,你将学习网络 "搜刮",这是从网页中提取数据的艺术和科学。
有两个重要的 tidyverse 软件包我们不在这里讨论:Haven 和 xml2。如果您要处理 SPSS、Stata 和 SAS 文件中的数据,请查看haven 软件包。如果要处理 XML 数据,请查看xml2 软件包。否则,您需要做一些研究,以找出您需要使用的软件包;谷歌是您在这方面的朋友。
Read now
Unlock full access