May 2025
Intermediate to advanced
578 pages
8h 9m
Chinese
本书这一部分的目标是让你快速了解数据科学的主要工具:导入、Tidy、转换和可视化数据,如图 I-1 所示。我们希望向你展示数据科学的 "全局",让你对所有主要部分有足够的了解,这样你就可以处理真实的、简单的数据集。本书的后半部分将更深入地讨论这些主题中的每一个,从而扩大你可以应对的数据科学挑战的范围。

其中四章重点介绍数据科学工具:
可视化是开始学习 R 编程的绝佳起点,因为它的回报是显而易见的:你可以绘制优雅而翔实的图表,帮助你理解数据。在第 1 章中,你将深入学习可视化,了解 ggplot2 图形的基本结构,以及将数据转化为图形的强大技术。
仅有可视化通常是不够的,因此在第 3 章中,您将学习一些关键动词,以便选择重要变量、筛选出关键观测值、创建新变量并计算摘要。
在第 5 章中,你将学习 Tidy 数据,这是一种一致的数据存储方式,能让转换、可视化和建模变得更容易。你将了解其基本原理以及如何将数据转化为整洁的形式。
在转换和可视化数据之前,您需要先将数据导入 R。在第 7 章中,您将学习将.csv 文件导入 R 的基础知识。
在这几章中,还有四章是关于 R 工作流程的。在第 2 章、第 4 章和第 6 章中,你将学习到编写和组织 R 代码的良好工作流程实践。从长远来看,这将为你的成功奠定基础,因为它们将为你提供在处理实际项目时保持条理清晰的工具。最后,第 8 章将教你如何获得帮助并不断学习。
Read now
Unlock full access