第6章 字符串的使用

在前面的章节中,我们已经学习了用于基本对象操作的多类内置函数,并且知道了如何获取对象的类、类型和维度;如何进行逻辑、数学和基本统计计算;以及如何完成像根查找这样的简单分析任务。这些函数是我们解决特定问题的基石。

字符串相关函数是一类非常重要的函数,本章将介绍这些函数。在R中,文本存储在字符向量中,并且有许多操作和分析文本的实用函数和技巧。在本章中,我们将学习处理字符串的基础但有用的技巧,主要包括:

  • 字符向量的基本操作
  • 在日期/时间对象和它们的字符串形式之间转换
  • 使用正则表达式(regular expressions)提取文本信息

R中的字符向量被用来存储文本数据。不同于其他编程语言的是,R中字符向量并非单个字符、字母或者字母符号如a、b、c。相反,它是一个包含字符串的向量。

R也提供了许多用来处理字符向量的内置函数。其中很多可以执行向量化操作,因此它们可以一步完成对多个字符串的处理。

在本节中,你将学到更多有关字符向量中文本的打印、组合以及转换等内容。

也许查看文本是我们对文本所能做的最基础的事情。R提供了许多在控制台中查看文本的方式。

最简单的方式是,直接在引号中输入文本:

"Hello"
## [1] "Hello"

如同由浮点数组成的数值向量,一个字符向量是一个由字符值或字符串组成的向量。Hello是我们刚刚创建的字符向量中的第1个,也是唯一一个元素。

我们也可以通过简单地执行某个变量,打印出存储在该变量中的字符串:

str1 <- "Hello"
str1
## [1] "Hello"

然而,如果只是简单地将字符串放进循环中,R并不会将其迭代打印。下面这个循环不会打印出任何东西:

for (i in 1:3){ ...

Get R编程学习指南 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.