
第13章 整理数据 井然有序 409
让我们通过排序更仔细地看看名单中的重复情况。
在R中,通过子集括号中的order函数可以对数据框
架排序。执行下列指令:
由于PersonID域有可能是代表每一个人的特定编号,用它排序再好
不过。毕竟,这些数据中可能不止一个叫做“JohnSmith”的人。
下面,执行head指令看看生成的结果:
hfhhSorted <- hfhh[order(hfhh$PersonID), ]
head(hfhhSorted, n=50)
排序得出的新名单。排序得出的新名单。
为数据排序,让重复
数值集中出现
如果数据量很大,则发现重复数值颇
为不易,给名单排个序的话就容易多了。
Alex
Stu
Sara
Greg
Chris
Jen
Jorge
未排序
Alex
Alex
Alex
Ben
Chris
Chris
Dee
排序
发现这份名单中的重复发现这份名单中的重复
情况颇为不易,尤其是情况颇为不易,尤其是
在名单较长的情况下。在名单较长的情况下。
这儿有大量重复。这儿有大量重复。
很容易看出很容易看出
重复情况。重复情况。
R做了什么?
整理数据
练习