December 2022
Intermediate to advanced
400 pages
4h 27m
Japanese
この章では、ストリームエディター(sed)やAWKを使ううえで最も謎めいた部分について取り上げます。それは正規表現(regular expression:略してregex)です。これまでの章では、いくつかの正規表現について軽く触れる程度でしたが、それは、十分に理解せずに掘り下げることは避けたかったからです。
正規表現の書き方を理解すれば、多くの時間と労力を節約できます。正規表現を使うと、sedやAWKの背後にある真の力を解き放つことができ、それらを専門的に使えるようになります。
この章では、以下のテーマを扱います。
grepの使用そもそも、正規表現とは何でしょうか?
正規表現とは、特定のテキストにマッチさせるために正規表現エンジンが解釈する文字列のことです。これは、より進んだ検索方法のようなものです。
たとえば、あるファイルから、任意の小文字で始まる行、数字を含んでいる行、特定のテキストで始まる行を検索したいとします。通常の検索では、そのような総称的な検索はできません。唯一の方法は、正規表現を使うことです。
では、正規表現エンジンとは何でしょうか?
正規表現エンジンは、これらの文字列を理解し、それらを解釈して、マッチするテキストを検索するソフトウェアです。
世の中には多くの正規表現エンジンがあります。たとえば、Java、Perl、Pythonなどのプログラミング言語に標準装備されている正規表現エンジンも、その1つです。また、sedとAWKのようなツールでも正規表現エンジンを使用しており、私たちにとって重要なのは、Linuxでの正規表現エンジンの種類を知ることです。
Read now
Unlock full access