第6章 字符串的使用
在前面的章节中,我们已经学习了用于基本对象操作的多类内置函数,并且知道了如何获取对象的类、类型和维度;如何进行逻辑、数学和基本统计计算;以及如何完成像根查找这样的简单分析任务。这些函数是我们解决特定问题的基石。
字符串相关函数是一类非常重要的函数,本章将介绍这些函数。在R中,文本存储在字符向量中,并且有许多操作和分析文本的实用函数和技巧。在本章中,我们将学习处理字符串的基础但有用的技巧,主要包括:
- 字符向量的基本操作
- 在日期/时间对象和它们的字符串形式之间转换
- 使用正则表达式(regular expressions)提取文本信息
6.1 字符串入门
R中的字符向量被用来存储文本数据。不同于其他编程语言的是,R中字符向量并非单个字符、字母或者字母符号如a、b、c。相反,它是一个包含字符串的向量。
R也提供了许多用来处理字符向量的内置函数。其中很多可以执行向量化操作,因此它们可以一步完成对多个字符串的处理。
在本节中,你将学到更多有关字符向量中文本的打印、组合以及转换等内容。
6.1.1 打印文本
也许查看文本是我们对文本所能做的最基础的事情。R提供了许多在控制台中查看文本的方式。
最简单的方式是,直接在引号中输入文本:
"Hello"
## [1] "Hello"
如同由浮点数组成的数值向量,一个字符向量是一个由字符值或字符串组成的向量。Hello
是我们刚刚创建的字符向量中的第1个,也是唯一一个元素。
我们也可以通过简单地执行某个变量,打印出存储在该变量中的字符串:
str1 <- "Hello"
str1
## [1] "Hello"
然而,如果只是简单地将字符串放进循环中,R并不会将其迭代打印。下面这个循环不会打印出任何东西:
for (i in 1:3){ ...
Get R编程学习指南 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.