5.2 문자열 추출하기

파일 내용의 일부만 필요하다면 grep, cut, head, tail을 조합하는 것이 가장 간단한 방법이다. 앞의 세 가지는 이미 1장에서 소개했다. grep은 패턴과 일치하는 문자열을 출력하는 명령이고, head는 파일의 처음부터 지정된 수의 줄을 출력하는 명령이며, tailhead의 반대로 파일의 끝부터 지정된 수의 줄을 출력하는 명령이다. 그림 5-1은 이들 네 가지 명령이 조합된 형태를 나타낸 것이다.

▲ 그림 5-1 head, grep, tail은 필요한 범위의 줄을 골라내는 데 쓰인다. 여기서 grep은 ‘blandit’이라는 문자열이 포함된 줄을 찾는 데 쓰였다.

이번 절에서는 단순 문자열 일치 여부를 확인하는 것을 넘어서는 grep의 기능과 tail의 기능을 더 자세히 설명하겠다. 그리고 cut 명령으로 할 수 없는 문자열 내 추출을 awk 명령을 사용해 수행해 본다. 이들 다섯 가지 명령을 잘 조합하면, 하나의 파이프라인만으로 거의 모든 텍스트를 원하는 대로 추출해낼 수 있다.

 

 

5.2.1 단순 문자열 일치 그 이상의 기능: grep

앞에서는 파일의 내용 중 문자열과 일치하는 줄을 출력하기 위해 이미 grep 명령을 사용했었다.

chapter05 > grep_deeper_look

$ cat frost ...

Get 효율적인 리눅스 명령어 사용의 기술 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.