第15章 效率提升

在上一章中,我们掌握了使用R从网页中提取信息。为了理解网页爬虫的运行机理,我们学习了几种语言,如HTML、CSS和XPath。事实上,R提供的不仅仅是统计计算环境。R社区还提供数据收集、数据操作、统计建模、可视化,以及报告和演示等一切可能涉及到的工具。

本章将介绍一些提高生产力的扩展包。先回顾一下在本书中学到的几种语言,再学习另一种语言:markdown。我们将看到如何结合R和markdown来生成强大的动态文档。具体包括以下内容:

  • 了解markdown和R Markdown
  • 嵌入表格、统计图表、示意图和交互式绘图
  • 创建交互式应用程序

数据分析师的工作不仅是将数据放入模型并得出一些结论。通常需要完成从数据收集、数据清理、可视化、建模再到最后编写报告或制作演示文稿的完整工作流程。

在前面几章中,我们从不同方面深入学习R编程语言,从各个环节,一步一步提升生产效率。在本章中,我们将关注最后一步:报告和展示。在以下内容中,我们将学习一种非常简洁的文档编写语言:markdown。

在本书中,我们已经学习了许多种语言。这些语言有很大的不同,而且可能会混淆初学者。但是如果你记住了它们各自的使用目的,几种语言一起使用也并非难事。在学习markdown之前,我们将快速回顾前几章中学习过的语言。

第一个当然是R编程语言,这是一种为解决问题而设计的编程语言。R是专门为统计计算量身定制的,并被社区授权,开发了多种多样的功能,种类繁多的扩展包,能够做许多事情。举个例子:

n <- 100
x <- rnorm(n)
y <- 2 * x + rnorm(n)
m <- lm(y ~ x)
coef(m)  ...

Get R编程学习指南 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.